ReadProbe：支持横向阅读的基于检索增强的大语言模型演示

Jun, 2023

ReadProbe：支持横向阅读的基于检索增强的大语言模型演示

ReadProbe: A Demo of Retrieval-Enhanced Large Language Models to Support Lateral Reading

Dake Zhang, Ronak Pradeep

TL;DR本文介绍 ReadProbe，它是一款支持横向阅读的工具，使用 OpenAI 的生成式大语言模型和 Bing 搜索引擎，它能够生成有用的问题，搜索相关文档，并生成良好归因的答案，以帮助人们更好地评估在线信息。

Abstract

With the rapid growth and spread of online misinformation, people need tools to help them evaluate the credibility and accuracy of online information. →

online misinformation credibility lateral reading information evaluation large language models

发现论文，激发创造

重构 - 探索法：一种对预训练语言模型进行生物医学知识探测的对比性方法

本研究采用对比探针法，探究生物医学领域基于 UMLS 词汇库的预训练语言模型的知识转移机制，并提出了 MedLAMA 作为基准来测试多种最先进的语言模型和探测方法，其中 Contrastive-Probe 方法的性能表现优于其他方法，为此领域更合适的探针技术的发展提供了启示。

Oct, 2021

提升生物医学 NLI 模型的健壮性：临床试验的探测方法

大型语言模型在医学领域中的应用是分析和调查临床试验的任务，本研究使用记忆探测方法研究在临床试验上训练的 Sci-five 模型，通过训练任务特定的探测器，调整模型以提高准确性，并发现探测器的大小对调整流程产生影响。

Feb, 2024

生成而非检索：大型语言模型是强大的上下文生成器

本文提出了一种新的方法 GenRead，它使用大型语言模型生成上下文文档来解决开放领域 QA 等知识密集型任务，并且借助基于聚类的提示方法来选择不同的提示从而提高回收率，实验证明相比于传统的检索 - 阅读模型，这种方法有更高的准确性。

Sep, 2022

LINSPECTOR WEB: 用于词表示的多语言探针套件

LINSPECTOR WEB 是一种开源多语言检测器，支持 16 种简单的语言学探测任务分析 28 种语言的单词嵌入表示，支持静态单词嵌入表示和预训练的 AllenNLP 模型的探测。

Jul, 2019

检索增强大型语言模型的查询重写

该研究介绍了一个新的 Rewrite-Retrieve-Read 框架，该框架从查询重写的角度改进了检索增强方法，并通过强化学习调整该框架的策略模型，通过开放域 QA 等下游任务进行了验证。

May, 2023

朗读增强语言模型

我们提出了一种新的思路，帮助大型语言模型（LLMs）在不从外部语料库检索的情况下生成更准确的事实知识，称为 RECITation-augmented gEneration（RECITE）。通过利用口述作为中间步骤，RECITE 可以在各种闭书问答（CBQA）任务中实现新的最先进性能。在四个预训练模型（PaLM、UL2、OPT 和 Codex）和三个 CBQA 任务（自然问题、TriviaQA 和 HotpotQA）上进行实验证明了我们提出方法的有效性。

Oct, 2022

教授语言模型通过验证的引文支持答案

通过强化学习从人类偏好中得出支持性证据，训练生成回答并支持其声称的 “开放式书目” QA 模型。该模型能够从搜索引擎中找到的多个文档或单个用户提供的文档中提取支持证据。通过在 NaturalQuestions 和 ELI5 数据集的子集中进行的人类评估，该模型的响应在这两个子集中 80％和 67％的时间内达到高质量水平，但并非所有声称都被支持的证据是正确的。

Mar, 2022

语言模型中的概念表示分析：借助逆向词典探针

基于逆向字典任务，探索和提升大型语言模型的推理能力，并预测其在一般推理性能上的表现。

Feb, 2024

检索解释：基于证据的语言模型预测

通过使用 Shapley 值以识别证据在最终预测中的相对重要性，Retrieve to Explain（R2E）能够根据文件语料库中的证据，优先考虑对研究问题的一组预先定义的可能答案，从而解决了机器学习模型特别是语言模型在解释性上的困难，并在从科学文献中识别药物靶标这一实用案例上展现了其优越性。

Feb, 2024

计划和编辑检索结果以提高工具学习

通过引入一种新的模型名为 “Plan-and-Retrieve (P&R)” 和 “Edit-and-Ground (E&G)” 的方法，本文提出了一种集成外部工具与大型语言模型的新方法，显著提高了工具检索任务的召回率和 NDCG，并超越了当前最先进的模型。

Mar, 2024