- 知识感知的大语言模型微调
使用知识感知微调(KnowTuning)方法解决大型语言模型在自然语言处理任务中的知识感知不足问题,并在通用和医疗问答数据集上进行了广泛的实验证明了其有效性,并展示了其在未知问答数据集上的泛化能力。
- 无监督的问答模型自适应
通过无监督的大语言模型适应,研究论文探索了在不同目标领域中提供正确答案的问题回答,并研究了输入标记替换等方法来部分缓解中间和末尾信息获取的困难。
- 探索基于程序提示的混合问答
我们提出了一种基于程序的提示框架 HProPro,用于处理混合问答任务,该框架通过整合各种功能来解决异构数据的混合推理场景,从而能够在没有训练专门的检索器或执行模态转换的情况下,对来自各种源和模态的数据进行推理。实验证明 HProPro 在 - 层次链:从有限示例中迭代地激励大语言模型进行分类归纳
通过实验证明,Chain-of-Layer 在四个真实世界基准测试中取得了最先进的性能,它是一种从给定实体集合中归纳分类体系的上下文学习框架。
- T-RAG: LLM 战壕中的教训
构建一个基于 RAG 的 LLM 应用程序,Tree-RAG 使用树结构表示组织中的实体层级,并生成文字描述以增强响应用户查询的上下文。
- 通过细粒度奖励训练语言模型生成带有引文的文本
本文提出了一种使用细粒度奖励的有效训练框架,教授大型语言模型生成高度支持和相关的引用文献,以及确保其回答的正确性。在常见的大型语言模型训练策略上应用这些细粒度奖励进行系统分析,并在 ALCE 基准测试和 EXPERTQA 上进行了广泛实验验 - SemPool: 简洁、稳健和可解释的知识图谱汇集以增强语言模型
我们提出了一种简单的图汇聚方法(SemPool),通过预训练语言模型表示知识图谱事实,学习聚合语义信息,并在语言模型的不同层次融合它,从而在缺乏答案信息的情况下优于现有的基于图神经网络方法的 2.27%准确性,同时提供了不同层次的语言模型融 - PipeNet:基于语义修剪的知识图谱问答
通过引入显式的知识图谱可以改善问答系统,本研究提出了一种基于实体节点定位、剪枝和推理的流程以提高图推理的效率,并采用图注意力网络进行子图数据的推理。在 CommonsenseQA 和 OpenBookQA 上的实验结果证明了方法的有效性。
- 使用知识图谱评估复杂问题回答和归因的大型语言模型基准
使用知识图谱为问题 - 答案对自动生成不同类别的归因,并引入细分类型(支持性、不足、矛盾和不相关)来衡量归因,评估现有评估方法在细致归因设置下的表现较差,使用人工注释验证的 CAQA 基准为选择和开发 LLM 归因评估器提供了有前景的工具。
- AI 助理可以知道他们不知道的吗?
AI 助手可以通过模型特定的 'I don't know'(Idk)数据集来拒绝回答未知问题,且问答准确率显著提高。
- TAT-LLM:用于离散推理表格和文本数据的专用语言模型
我们开发了一个 TAT-LLM 语言模型来针对特定任务,该模型在 FinQA、TAT-QA 和 TAT-DQA 基准测试中表现优于所有基准模型,包括先前的最佳微调模型和像 GPT-4 这样的大规模语言模型。
- CFMatch: 自动化答案等效评估与专家判断在开放域问答中的对齐
通过采用职业人员 QA 竞赛来评估机器 QA 中答案的正确性,结合标准评估和一种更高效、稳健、轻量级的基于偏差 AE 分类器的匹配方法(CFMatch,小于 1 MB),培训和验证以更准确地评估答案的正确性,使得 QA 能够进一步发展。
- QAnswer:面向网站的问题回答搜索
演示了将知识图谱和自由文本结合起来进行的问题回答(QA)网站搜索技术的潜力,并讨论了其优势和劣势。通过维基媒体基金会的网站案例研究,对与搜索引擎不同的全面且独有的索引方式进行了说明。
- 开发生物和医学 ChatGPT:生物医学问答的完整概述
通过自然语言处理和多模态范式,ChatGPT 探索了医学诊断、治疗建议和其他医疗支持的问题回答的战略蓝图,在医学领域数据的逐渐整合下,这些技术加快了医学领域问题回答的进展,通过连接人类自然语言与医学领域知识或专家手动注释的空白,处理了医学环 - 通过问答探究语言模型对结构化语义理解和生成的能力
最近大规模语言模型能力的进步引发了对其评估的新浪潮,这篇研究工作通过在自然语言和形式语言之间的相互转换来验证大规模语言模型理解和生成结构化逻辑形式的能力,实验证明现今最先进的大规模语言模型在理解逻辑形式方面整体上接近人类水平,但在生成正确逻 - 为低资源语言构建高效高效的 OpenQA 系统
在这篇论文中,我们展示了能够为低资源语言开发有效且成本低廉的 OpenQA 系统的关键要素,其中包括利用机器翻译标注数据的弱监督和目标语言中相关的非结构化知识源。我们以土耳其语为挑战性案例研究,通过 ColBERT-QA 对 SQuAD-T - 导航教学视频的绕过方法
本研究提出了解决「视频绕道」问题的方法,通过学习视频和文本查询,检索出与之相关的视频片段,并利用基于文本的流程创建弱监督训练数据,进而在如何烹饪视频领域中实现了显著的检索和问题回答的性能提升。
- 从文本到多模态:对问答系统中对抗性示例生成的综合调查
本文对于整合对抗机器学习与问答系统的领域进行了综述,包括传统和多模态背景下的对抗性示例生成技术。通过系统分类,回顾了采用的技术,从传统问答模型出发,探索了基于规则的扰动和高级生成模型,并扩展了对多模态问答系统的研究,分析了各种方法,并研究了 - RJUA-QA:一份完整的泌尿科问答数据集
我们介绍了 RJUA-QA,这是一个新颖的医学数据集,用于问题回答和与临床证据推理,有助于弥合通用大型语言模型(LLMs)与医学特定 LLM 应用之间的差距。
- EMNLP大型语言模型是复杂的表格解析器
本文中,我们提出了在复杂表格问答中引入 GPT-3.5 的方法来解决相关挑战,通过重构复杂表格为元组并使用特定的提示设计对话框,将每个单元格的层次结构、位置信息和内容编码为一个元组,并通过加强提示模板的解释说明每个元组的含义和任务的逻辑推理