标准化：根据专家定义的标准对语言模型进行调整以实现内容生成

Feb, 2024

标准化：根据专家定义的标准对语言模型进行调整以实现内容生成

Standardize: Aligning Language Models with Expert-Defined Standards for Content Generation

Joseph Marvin Imperial, Gail Forey, Harish Tayyar Madabushi

TL;DR通过使用领域专家和语言标准，我们引入一种基于检索式学习的框架，用于指导大型语言模型生成符合专家定义标准的内容，并证明了利用标准中提取的知识构件并将其整合到生成过程中，可以有效地指导模型产生更好的标准化内容。

Abstract

domain experts across engineering, healthcare, and education follow strict standards for producing quality content such as technical manuals, medication instructions, and children's reading materials. However, current works in →

domain experts controllable text generation standardized content language standards knowledge artifacts

发现论文，激发创造

结构化知识库在大型语言模型中优化元数据整理的应用

通过对 200 个描述肺癌人样本的 NCBI BioSample 数据记录进行实验，评估 GPT-4 对于符合元数据标准的建议编辑能力，并通过同行评审过程计算了字段名 - 字段值对的符合精确度，发现辅助 GPT-4 以 CEDAR 模板的文本描述作为领域信息，从 79% 提高到 97%（p<0.01），结果表明 LLMs 与结构化知识库整合后，可以在自动化元数据管理中显示出希望。

Apr, 2024

对齐工作室：将大型语言模型与特定上下文规定对齐

该论文介绍了一种方法和架构，赋予应用开发者调整模型以符合他们特定价值观、社会规范、法律和其他规定，并在特定环境中协调潜在冲突需求的能力，其中包括 Framers、Instructors 和 Auditors 这三个主要组件，这种方法通过并结合一个内部企业聊天机器人对齐到企业行为准则的示例进行了说明。

Mar, 2024

确保安全和高质量的输出：面向语言模型的指南库方法

为了解决大型语言模型存在的偏见内容生成和隐私问题，研究引入了 Guide-Align 方法，该方法通过安全训练模型识别潜在风险并建立指南和模型库，然后用于新输入的相关指导，以确保安全和高质量输出，还可以通过精调模型来优化对多样输入的适应性和对指南库的全面性。实验证明该方法显著提高了大型语言模型的安全性和质量，尤其是在 13 亿参数下，优于 GPT-3.5-turbo 和 GPT-4 的对齐能力。

Mar, 2024

CITING：大型语言模型为指导调整课程创作

利用人工智能模型替代人类作为教师，通过研究生成学生成绩的修订，构建了 Curriculum Instruction TunING (CITING) 方法，提高了大型语言模型的表达、深度和全面性能，在 GPT-4 评估上取得了 79.4% 的胜率。

Oct, 2023

BOOST：利用黑盒控制提升 LM 生成中的常识

我们提出了一种计算高效的框架，通过引导一个固定的预训练语言模型向更具常识的生成方式迈进，以产生一个合理的输出，该输出以一系列概念有意义的方式融合。测试结果表明，我们的方法在两个有限概念生成句子的基准上始终能够产生最具常识性的输出。

Oct, 2023

领域术语整合到机器翻译：利用大型语言模型

本文介绍了我们在德英（DE-EN）、英捷（EN-CS）和中英（ZH-EN）语言对上提交给 WMT 2023 术语共享任务的方法，通过使用大型语言模型（LLMs）生成二语合成数据并将预批准术语整合入机器翻译（MT）中，成功地提高了术语的使用率。

Oct, 2023

评估和优化大型语言模型的教育内容

利用语言模型作为教育专家评估不同学生群体学习成果的方法，以优化教育材料。这种方法可以复制已有的教育研究结果，如专业逆转效应和变异效应，展示了语言模型作为可靠教育内容评估者的潜力。基于此，我们介绍了一种通过一个语言模型生成教育材料，另一个语言模型作为奖励函数进行指令优化的方法，并在数学问题工作表领域应用了这一方法，以最大化学生的学习收益。人类教师对这些由语言模型生成的工作表进行评估，发现语言模型的判断与人类教师的偏好具有显著的一致性。最后，我们讨论了人类和语言模型之间的潜在分歧和自动化教学设计带来的陷阱。

Mar, 2024

面向开放域创造力和公平性的可控文本生成

本文介绍了一些控制文本生成的方法以增强语言生成模型的创造力和公平性，包括层级生成和约束解码，并应用于故事、诗歌、比喻语言的创意生成，以及减少生成模型的社会偏见。

Sep, 2022

基于医疗临床知识的语言模型：Almanac

本文研究了大型语言模型在临床医学领域的应用，探讨了通过让模型能够访问外部医疗工具，以响应医生查询的方式来实现医疗指南和建议推荐的能力，并展示了在各种临床场景中显著提高事实准确性、有效性和安全性的结果。

Mar, 2023

利用 LLM 在课程设计中：使用 GPT-4 支持学习目标的编写

通过评估 GPT-4 在人工智能实践课程中生成高质量学习目标的能力，本研究结果显示，自动生成的学习目标大多合理，表达准确，符合 Bloom 分类法的不同层次，可以用于支持课程和课程设计的工作。

Jun, 2023