标准化:根据专家定义的标准对语言模型进行调整以实现内容生成
通过对 200 个描述肺癌人样本的 NCBI BioSample 数据记录进行实验,评估 GPT-4 对于符合元数据标准的建议编辑能力,并通过同行评审过程计算了字段名 - 字段值对的符合精确度,发现辅助 GPT-4 以 CEDAR 模板的文本描述作为领域信息,从 79% 提高到 97%(p<0.01),结果表明 LLMs 与结构化知识库整合后,可以在自动化元数据管理中显示出希望。
Apr, 2024
该论文介绍了一种方法和架构,赋予应用开发者调整模型以符合他们特定价值观、社会规范、法律和其他规定,并在特定环境中协调潜在冲突需求的能力,其中包括 Framers、Instructors 和 Auditors 这三个主要组件,这种方法通过并结合一个内部企业聊天机器人对齐到企业行为准则的示例进行了说明。
Mar, 2024
为了解决大型语言模型存在的偏见内容生成和隐私问题,研究引入了 Guide-Align 方法,该方法通过安全训练模型识别潜在风险并建立指南和模型库,然后用于新输入的相关指导,以确保安全和高质量输出,还可以通过精调模型来优化对多样输入的适应性和对指南库的全面性。实验证明该方法显著提高了大型语言模型的安全性和质量,尤其是在 13 亿参数下,优于 GPT-3.5-turbo 和 GPT-4 的对齐能力。
Mar, 2024
利用人工智能模型替代人类作为教师,通过研究生成学生成绩的修订,构建了 Curriculum Instruction TunING (CITING) 方法,提高了大型语言模型的表达、深度和全面性能,在 GPT-4 评估上取得了 79.4% 的胜率。
Oct, 2023
我们提出了一种计算高效的框架,通过引导一个固定的预训练语言模型向更具常识的生成方式迈进,以产生一个合理的输出,该输出以一系列概念有意义的方式融合。测试结果表明,我们的方法在两个有限概念生成句子的基准上始终能够产生最具常识性的输出。
Oct, 2023
本文介绍了我们在德英(DE-EN)、英捷(EN-CS)和中英(ZH-EN)语言对上提交给 WMT 2023 术语共享任务的方法,通过使用大型语言模型(LLMs)生成二语合成数据并将预批准术语整合入机器翻译(MT)中,成功地提高了术语的使用率。
Oct, 2023
利用语言模型作为教育专家评估不同学生群体学习成果的方法,以优化教育材料。这种方法可以复制已有的教育研究结果,如专业逆转效应和变异效应,展示了语言模型作为可靠教育内容评估者的潜力。基于此,我们介绍了一种通过一个语言模型生成教育材料,另一个语言模型作为奖励函数进行指令优化的方法,并在数学问题工作表领域应用了这一方法,以最大化学生的学习收益。人类教师对这些由语言模型生成的工作表进行评估,发现语言模型的判断与人类教师的偏好具有显著的一致性。最后,我们讨论了人类和语言模型之间的潜在分歧和自动化教学设计带来的陷阱。
Mar, 2024
本文介绍了一些控制文本生成的方法以增强语言生成模型的创造力和公平性,包括层级生成和约束解码,并应用于故事、诗歌、比喻语言的创意生成,以及减少生成模型的社会偏见。
Sep, 2022
本文研究了大型语言模型在临床医学领域的应用,探讨了通过让模型能够访问外部医疗工具,以响应医生查询的方式来实现医疗指南和建议推荐的能力,并展示了在各种临床场景中显著提高事实准确性、有效性和安全性的结果。
Mar, 2023
通过评估 GPT-4 在人工智能实践课程中生成高质量学习目标的能力,本研究结果显示,自动生成的学习目标大多合理,表达准确,符合 Bloom 分类法的不同层次,可以用于支持课程和课程设计的工作。
Jun, 2023