language models | BriefGPT - AI 论文速递

关键词language models

搜索结果 - 2349

ACL通过直接偏好优化的自我训练改进链索式推理
研究表明，通过自我训练和直接偏好优化方法，能够提高小规模语言模型在数学推理任务中的推理能力，从而提供一种比依赖大型专有语言模型更高效且可扩展的解决方案。
PDF2 days ago
时间重要性：研究生物医学语言模型的时间效应
通过统计测试了语言模型性能与数据变化之间的关系，研究表明时间对于部署生物医学语言模型至关重要，性能下降程度根据生物医学任务和统计方法的不同而异。
PDF3 days ago
PERSONA: 一个可重复的多重对齐测试平台
通过人口普查数据，我们引入了多维度用户模型 PERSONA，包含 1586 个具有不同人口统计学属性和特殊属性的合成人物。通过大规模评估数据集，我们系统评估了语言模型在扮演多样化用户角色方面的能力，为多元化对齐方法建立了基准 PERSONA
PDF3 days ago
流利的学生 - 教师红队行动
改进了现有算法以针对 Llama-2 和 Phi-3 等已经进行安全调优的模型，通过新的蒸馏方法和对目标模型的多模型困惑度惩罚以及重复惩罚，成功地破解了这些模型，并找到了一个普遍优化的单个、口语流利的提示，能够使 Llama-2-7B、Ph
PDF3 days ago
Train-Attention: 持续知识学习中的元学习关注点
我们提出了一种名为 TAALM 的新型持续知识学习方法，利用元学习框架通过动态预测和应用权重来提高学习效率，并通过优化标记重要性预测来实现有目标的知识更新和减少遗忘。在新引入和已建立的 CKL 基准上进行的实验证明，TAALM 在基线上表现
PDF3 days ago
从内部冲突到语言模型的情境适应
知识密集型语言理解任务需要语言模型（LM）整合相关上下文信息，以缓解其固有的弱点，例如不完整或过时的知识。然而，研究表明，随着与预训练期间学习到的 LM 内存存在冲突，LM 常常忽略提供的上下文。此外，冲突的知识已经存在于 LM 的参数中，
PDF3 days ago
朝向与文本反馈对齐的语言模型
ALT 是一种基于文本反馈对齐语言模型的方法，通过在生成过程中依赖文本反馈，能够在减少样本量的情况下超越 PPO 在减少毒性和生成摘要等任务上的表现，并且探索了利用现有 LLM 进行对齐的可能性以及使用受限和无限制文本反馈的方法，并概述了与
PDF3 days ago
ACLAMONGAGENTS: 评估大型语言模型在交互式基于文本的社交推理游戏中的应用
使用 Among Us 作为模拟环境的工具，本研究旨在创建人类行为的代理。研究引入了一个名为 AmongAgent 的基于文本的游戏环境，分析其中的模拟语言代理的行为，并展示了大型语言模型在游戏规则和当前情境下作出决策的能力，以推动在目标导
PDF4 days ago
通过对风险的关键评估，以大型语言模型实现强大的隐私保护
本研究探讨将电子病历（EHRs）和自然语言处理（NLP）与大型语言模型（LLMs）相结合，以改善医疗数据管理和患者护理，重点是利用先进模型创建安全的、符合 HIPAA 标准的合成患者笔记用于生物医学研究。
PDF4 days ago
基于辨别指导的知识图谱补全的生成式大型语言模型微调
本文提出一种名为 DIFT 的微调框架，旨在释放 LLMs 的知识图完成能力并避免接地错误。通过使用轻量级模型获取候选实体并使用区分指令微调 LLM，DIFT 能够从给定的候选实体中选择正确的实体，以提高性能并减少指令数据。在基准数据集上进
PDF4 days ago
FairFlow: 自然语言处理中基于模型的反事实数据增强的自动化方法
该论文提出了一种名为 FairFlow 的自动化方法，用于生成平行数据来训练反事实文本生成模型，从而减少人为干预的需求，并且展示了 FairFlow 如何显著克服了基于词典替换方法的局限性，同时保持良好的性能。
PDF4 days ago
超越二元性别：评估含有模棱两可态度词的性别包容机器翻译
该研究提出了一个基于情感态度评分（EAS）的评估性别偏见的新方法，并通过一个名为 AmbGIMT 的基准测试来评估在非二元性别背景下的机器翻译的性别偏见。研究表明，非二元性别背景下的翻译质量较差，态度更为负面，并且尽管存在约束，偏见仍然存在
PDF4 days ago
ICMLPrimeGuard：通过无需调整的路由实现安全且有用的 LLMs
PrimeGuard 是一种新的 Inference-Time Guardrails 方法，利用结构化控制流将请求路由到不同的语言模型的自我实例化，通过自适应系统设计指南为每个查询动态编译，从而兼顾语言模型的安全性和有用性。
PDF4 days ago
基准作为显微镜：对模型计量的呼吁
通过对现代语言模型进行介绍，探讨它们在能力评估方面带来的新挑战，提出了通过动态评估来衡量特定能力的方法，并强调建立模型计量学社区以满足这些需求并为人工智能讨论增添清晰度。
PDF5 days ago
利用大型语言模型在社交媒体帖子中定位语言变化
在本研究中，我们利用大型语言模型（LLMs）解决了 GeoLingIt 挑战中对意大利推特进行地理定位的问题，通过微调预训练的 LLMs 同步预测推特的区域和精确坐标，提升了理解意大利社交媒体文本细微之处的能力，从而改进了该领域的最新技术水
PDF5 days ago
提示压缩的基本限制：面向黑盒语言模型的速率失真框架
我们正式化了大型语言模型（LLMs）的提示压缩问题，并提出了一个框架来统一为黑盒模型创建难题的令牌级提示压缩方法。我们推导了该设置下的失真率函数作为线性规划，并通过线性规划的对偶提供了一种计算这一基本限制的高效算法。在以失真率函数为基准的基
PDF5 days ago
语言模型和人类对语言不确定性的认知
利用指导别的 Agent 在特定陈述中的不确定性的理论，对 10 个流行的语言模型进行了评估，结果发现大部分模型能以类人的方式将不确定性表达映射为概率性回应，但其行为却比其先验知识的人类更容易受到偏见。这些研究结果在人工智能的对齐和人工智能
PDF5 days ago
心理计量学校准：通过语言模型捕捉人类知识分布
语言模型在模拟人类行为方面的准确性和知识分布对齐度方面存在显著的差异。本论文引入了 “心理测量对齐度” 这一度量标准，通过收集来自人类和语言模型的相同测试项的回答来评估它们的知识分布对齐度。研究结果显示了语言模型在与人类知识分布对齐度方面存
PDF5 days ago
提高语言模型的上下文感知偏好建模
通过细调语言模型以配对偏好实现对各种人类偏好的模型对齐，研究表明，辅助特定上下文评估的能力对于解决这一问题至关重要。
PDF7 days ago
评估语言模型作为风险评分
当前的问答基准主要关注在可预测任务的准确性。本文聚焦于使用语言模型作为无法实现的预测任务的风险评分。我们引入 folktexts 软件包来系统地生成风险评分，并在基准预测任务中对其进行评估。我们发现零 - shot 风险评分在预测信号方面表
PDF8 days ago