大型语言模型中的跨域对齐揭示出人类类似的模式

May, 2024

大型语言模型中的跨域对齐揭示出人类类似的模式

A Nurse is Blue and Elephant is Rugby: Cross Domain Alignment in Large Language Models Reveal Human-like Patterns

Asaf Yehudai, Taelin Karidi, Gabriel Stanovsky, Ariel Goldstein, Omri Abend

TL;DR本文通过行为研究，评估大型语言模型（LLMs）的概念化和推理能力，使用跨领域映射任务并分析模型的响应，结果显示模型的表示和行为与人类相似。

Abstract

cross-domain alignment refers to the task of mapping a concept from one domain to another. For example, ``If a \textit{doctor} were a \textit{color}, what color would it be?''. This seemingly peculiar task is designed to investigate how people represent concrete and abstract concepts t

cross-domain alignment conceptualization reasoning abilities large language models behavioral study

发现论文，激发创造

跨语言生物医学实体链接的领域专用表示学习

通过提出一个新的跨语言生物医学实体链接任务并建立一个涵盖 10 种语言的基准测试，本文研究了在标准英语生物医学实体链接任务之外，标准、知识增强的单语和多语言语言模型的能力。同时解决了把资源丰富的语言中的领域特定知识传递给资源贫乏的语言的挑战，并提出并评估了一系列的跨语言传递方法。研究表明，本文提出的领域特定传递方法在所有目标语言中均获得了持续的提高，有时可高达 20 个 Precision@1 点，而无需目标语言具有领域内的知识和对应的并行数据。

May, 2021

大型语言模型作为视觉跨领域学习器

近期由深度学习模型取得的进展基于独立且同分布的假设，限制了它们在具有领域转移的实际场景中的应用。为了解决上述问题，跨域学习旨在提取领域不变的知识，以减少训练和测试数据之间的领域转移。然而，在视觉跨域学习中，传统方法仅集中于图像模态，忽略了利用文本模态来减轻领域转移。本文提出了大型语言模型作为视觉跨域学习器（LLaVO）。LLaVO 使用视觉 - 语言模型将图像转换为详细的文本描述，然后使用设计的指令模板在源 / 目标领域生成的文本描述上对大型语言模型进行微调。对领域概括和无监督领域自适应设置下的各种跨域任务进行了广泛的实验，结果表明了所提方法的有效性。

Jan, 2024

流体变压器与创意类比：探索大型语言模型在增强跨领域类比创造力方面的能力

本文系统地探讨了 LLMs 增强跨领域类比推理的能力，研究表明 LLM 生成的跨领域类比常常被认为是有帮助的，并且在问题形式化的过程中往往会引发重要的变化，并且存在潜在的风险，如可能引起不适的内容。

Feb, 2023

低资源自然语言理解的有效迁移学习

本论文旨在解决 NLU 模型在缺乏数据或知识资源时的挑战，提出了跨语言和跨域适应方法及面向低资源语言的关键词增强方法、序列颗粒化建模方法、多领域预训练方法和粗粒度到细粒度的表示学习框架。

Aug, 2022

跨语言文档分类中的领域差异缩小

本文研究跨语言理解中的半监督学习，通过结合最先进的跨语言方法和弱监督学习方法，同时解决语言和领域差异，实现了对跨语言文档分类中的新的领先水平。

Sep, 2019

超越一模型适用于所有场景：大型语言模型领域特化调查

本论文提出了一个系统化的分类方法，将 LLMs 领域专业化技术分类，并讨论了适用于这些技术的关键应用领域的问题和前景，对当前研究状态和未来趋势进行了深入剖析。

May, 2023

探索大型语言模型在生物医学概念链接中的上下文学习能力

该研究旨在探讨基于大型模型的上下文学习能力，应用检索与排名框架的方法，以实现生物医学概念链接，并在 BC5CDR 疾病实体标准化和化学实体标准化方面取得了 90% 和 94.7% 的准确率，相对于监督学习方法表现出竞争力， F1 分数有 20 个绝对点的显著提高，深入评估了在生物医学领域使用大型语言模型的优点和潜在局限性。

Jul, 2023

MoCa：人类语言模型在因果和道德判断任务上的一致性测量

人类对物理和社会世界的常识性理解建立在直觉理论的基础上，而这些理论支持我们进行因果和道德判断。本文通过收集一系列的故事并对其进行标注，测试了大型语言模型对文本场景进行的因果和道德判断是否与人类参与者的判断相符。结果显示，虽然整体上随着近期大型语言模型的发展，其与人类的判断相符度有所提高，但通过统计分析发现大型语言模型与人类参与者之间对不同因素的重视程度存在明显差异。这些结果显示了如何通过策划和挑战性数据集结合来自认知科学的见解，超越基于总体指标的比较，揭示了大型语言模型的隐含倾向，并展示了这些倾向在多大程度上与人类的直觉相一致。

Oct, 2023

跨语言对齐的理解 -- 综述

近年来，跨语言对齐是多语言语言模型研究的一个活跃领域。本文概述了改进跨语言对齐的技术方法，并总结了该领域的见解。我们提供了对大量论文的定性总结结果。最后，我们讨论了这些见解不仅适用于已经深入研究这一主题的编码器模型，还适用于编码器 - 解码器甚至只有解码器的模型，并指出平衡语言中立和语言特定信息的有效权衡是关键。

Apr, 2024

结合语言模型的专业领域研究：一种多彩的方法

将领域特定语言模型与通用语言模型相结合，通过为每个词标记或 “上色” 来指示它与通用模型或领域特定模型的关联，以优化的算法有效处理带有上色词的推理，实现将领域特定术语融入到语言任务中并降低错误率。

Oct, 2023