SAIE 框架：单一的支持是不够的 —— 通过对抗性评注推进 LLM 培训

Nov, 2023

SAIE 框架：单一的支持是不够的 —— 通过对抗性评注推进 LLM 培训

SAIE Framework: Support Alone Isn't Enough -- Advancing LLM Training with Adversarial Remarks

Mengsay Loem, Masahiro Kaneko, Naoaki Okazaki

TL;DR通过学习中的交互式讨论，我们的 SAIE 训练方法提升了大型语言模型在训练阶段对实例的理解能力和在推理阶段的逻辑 / 批判性思维能力和表达能力。实验结果表明，使用我们的方法微调的模型在多个数据集上均优于使用标准微调技术训练的模型，尤其在多智能体推理情景下，我们的方法表现出卓越的推理能力。

Abstract

large language models (LLMs) can justify or criticize their predictions through discussion with other models or humans, thereby enhancing their intrinsic understanding of instances. While proactive discussions enhance performance, this approach is currently limited to the inference pha

large language models interactive discussions saie training method logical/critical thinking multi-agent inference scenarios

发现论文，激发创造

增强语言模型的积极询问以提升深度理解

通过引入 LaMAI（具有主动查询功能的语言模型），本文旨在为大型语言模型（LLMs）赋予与人类互动相同的水平互动能力，借助主动学习技术提出最具信息量的问题，缩小上下文差距，提高 LLMs 的输出效果，有效改善回答准确性并在人类参与场景中表现优异。

Feb, 2024

通过多智能体辩论提高语言模型的事实性和推理能力

该论文介绍了一种新方法，即通过多个语言模型实例的反复辩论和推理过程，以达成一个共同的最终答案，从而改善语言响应的表现，特别是在数学和策略推理方面，改善了已有模型中一些常见问题，如虚假答案和幻觉现象，并有望显著提高大型语言模型的性能和开拓语言生成和理解领域。

May, 2023

结构化信息的重要性：将抽象意义表示引入到 LLMs 中以提高开放域对话评估

我们提出了一个简单而有效的开放域对话评估框架，通过将领域特定语言模型（SLMs）与 LLMs 结合起来，明确地通过门控机制将对话的抽象意义表示（AMR）图信息融入到 LLM 的提示中，以提高上下文学习性能，并在开放域对话评估任务中的实验结果证明了我们方法在区分对抗性负面回应方面的优越性。

Apr, 2024

通过与学习助手的合作交互，从错误中学习

本文提出了一种名为 SALAM（Study Assistant for Large Language Model）的框架，通过对先前反馈进行评分并收集培训阶段的错误，以在推断过程中为语言模型提供指南，从而协助其进行自我反思和提炼，从而显著提高了绩效。

May, 2023

有监督的知识提升大语言模型在上下文学习中的表现

通过提示工程，大型语言模型（LLMs）展示了在上下文学习中的新兴能力。最近在大规模生成模型方面的进展进一步扩展了它们在实际语言应用中的使用。然而，在自然语言理解和问题回答方面，提高 LLMs 的泛化能力和准确性的关键挑战仍未得到充分探索。

Dec, 2023

多智能体协作攻击：通过辩论研究大规模语言模型协作中的对抗攻击

评估模型网络在对抗影响下通过辩论进行合作时的行为，探索推理时间方法生成更令人信服的论点，并评估基于提示的缓解作为一种防御策略的潜力。

Jun, 2024

将人工智能整合到高等教育中：与 'SAMCares: 一个自适应学习中心的试点研究 ' 的协议

通过引入一种创新的研究伙伴系统（我们将其称为 'SAMCares'），该系统利用大型语言模型（LLM）和 Retriever-Augmented Generation（RAG）来提供实时、上下文感知和自适应的教育支持，从而弥合了传统辅助技术和学习辅助工具的差距。

May, 2024

LogicLLM: 探索基于自监督逻辑增强训练的大型语言模型

本篇论文主要介绍了如何通过自监督后训练和上下文学习来增加逻辑知识，从而提高语言模型的逻辑推理能力，取得了比现有基线更好的效果。

May, 2023

应用强大的大型 AI 模型于课堂教学：机遇、挑战和前景

利用人工智能的互动场景增强课堂教学品质，包括对话自动完成、知识和风格传递，和评估人工智能生成的内容，探索多种应用和挑战，为未来研究提供清晰的道路。

May, 2023

基于大型语言模型的情境对话用于第二语言学习

在第二语言学习中，基于情景的对话实践对于语言学习者实现口语流利至关重要，本文提出了基于情境的对话模型，通过在大型语言模型（LLMs）上进行微调，旨在结合开放式对话的吸引力和基于情景任务的集中练习。利用 LLMs 的泛化能力，我们证明了我们的情境对话模型在训练话题和未遇到的话题上都有效，为支持广泛的会话主题提供了有希望的解决方案。此外，对话系统领域的研究仍缺乏可靠的自动评估指标，引发人工评估作为黄金标准（Smith 等，2022）的问题，而且通常成本较高。为了解决现有评估方法的局限性，我们提出了一种新颖的自动评估方法，利用经过微调的 LLMs 来高效而有效地评估情境对话模型的性能。

Mar, 2024