ReadProbe:支持横向阅读的基于检索增强的大语言模型演示
本研究采用对比探针法,探究生物医学领域基于 UMLS 词汇库的预训练语言模型的知识转移机制,并提出了 MedLAMA 作为基准来测试多种最先进的语言模型和探测方法,其中 Contrastive-Probe 方法的性能表现优于其他方法,为此领域更合适的探针技术的发展提供了启示。
Oct, 2021
大型语言模型在医学领域中的应用是分析和调查临床试验的任务,本研究使用记忆探测方法研究在临床试验上训练的 Sci-five 模型,通过训练任务特定的探测器,调整模型以提高准确性,并发现探测器的大小对调整流程产生影响。
Feb, 2024
本文提出了一种新的方法 GenRead,它使用大型语言模型生成上下文文档来解决开放领域 QA 等知识密集型任务,并且借助基于聚类的提示方法来选择不同的提示从而提高回收率,实验证明相比于传统的检索 - 阅读模型,这种方法有更高的准确性。
Sep, 2022
LINSPECTOR WEB 是一种开源多语言检测器,支持 16 种简单的语言学探测任务分析 28 种语言的单词嵌入表示,支持静态单词嵌入表示和预训练的 AllenNLP 模型的探测。
Jul, 2019
该研究介绍了一个新的 Rewrite-Retrieve-Read 框架,该框架从查询重写的角度改进了检索增强方法,并通过强化学习调整该框架的策略模型,通过开放域 QA 等下游任务进行了验证。
May, 2023
我们提出了一种新的思路,帮助大型语言模型(LLMs)在不从外部语料库检索的情况下生成更准确的事实知识,称为 RECITation-augmented gEneration(RECITE)。 通过利用口述作为中间步骤,RECITE 可以在各种闭书问答(CBQA)任务中实现新的最先进性能。在四个预训练模型(PaLM、UL2、OPT 和 Codex)和三个 CBQA 任务(自然问题、TriviaQA 和 HotpotQA)上进行实验证明了我们提出方法的有效性。
Oct, 2022
通过强化学习从人类偏好中得出支持性证据,训练生成回答并支持其声称的 “开放式书目” QA 模型。该模型能够从搜索引擎中找到的多个文档或单个用户提供的文档中提取支持证据。通过在 NaturalQuestions 和 ELI5 数据集的子集中进行的人类评估,该模型的响应在这两个子集中 80%和 67%的时间内达到高质量水平,但并非所有声称都被支持的证据是正确的。
Mar, 2022
通过使用 Shapley 值以识别证据在最终预测中的相对重要性,Retrieve to Explain(R2E)能够根据文件语料库中的证据,优先考虑对研究问题的一组预先定义的可能答案,从而解决了机器学习模型特别是语言模型在解释性上的困难,并在从科学文献中识别药物靶标这一实用案例上展现了其优越性。
Feb, 2024
通过引入一种新的模型名为 “Plan-and-Retrieve (P&R)” 和 “Edit-and-Ground (E&G)” 的方法,本文提出了一种集成外部工具与大型语言模型的新方法,显著提高了工具检索任务的召回率和 NDCG,并超越了当前最先进的模型。
Mar, 2024