BriefGPT.xyz
Ask
alpha
关键词
instruction fidelity
搜索结果 - 3
MIA-Bench: 多模态 LLMs 的更好指令遵循评估
我们引入了 MIA-Bench,一个新的基准测试,旨在评估多模态大型语言模型在其严格遵循复杂指令方面的能力。通过评估各种最先进的多模态大型语言模型,我们发现性能存在显著差异,突出了指令准确性方面的改进空间。此外,我们创建了额外的训练数据,并
→
PDF
5 days ago
解锁预期文本生成:一种受限方法用于大型语言模型的忠实解码
通过将文本生成问题形式化为未来约束生成问题,以最小化不良行为并确保指令的忠实执行,本文介绍了利用 LLM 的未来约束满足估计来指导文本生成过程的方法,并通过对关键词受限生成、有害性降低和问答中的事实正确性等三个不同的文本生成任务进行了广泛的
→
PDF
7 months ago
ACL
沿着路径前进:视觉语言导航中的指令准确度
通过对 Room-to-Room 数据集的评估提出新的评价指标 CLS,并且创建了新数据集 Room-for-Room (R4R) 用于指导指令跟踪的任务,同时通过比较与基准系统,表明重视指令的代理程序优于重视目标完成的代理程序。
PDF
5 years ago
Prev
Next