LaMDA:面向对话应用的语言模型
通过使用 GPT-3,本文提出了一种名为 LAD 的数据范式,用于创建多样化和准确的合成数据,以训练下游神经对话模型,实现零 - shot 泛化,并在意图预测、槽填充和下一步行动预测方面实现了显著的性能提升。同时通过交互式人类评估表明,与人类对话训练相比,使用 LAD 训练的效果是有竞争力的。
Jul, 2022
通过现有的自然语言处理技术和文本生成能力,我们提出了一种新的数据增强方法,即基于语言模型的数据增强 (LAMBADA),它可以在有限标注数据的情况下用强大的预训练神经网络模型合成新的有标注数据,进而提高文本分类任务性能。
Nov, 2019
在机器学习快速发展的领域中,对抗性攻击对模型的稳健性和安全性构成了重大挑战。本研究引入了 L-AutoDA(基于大型语言模型的自动化决策攻击),这是一种新颖的方法,利用大型语言模型的生成能力来自动设计这些攻击。通过与大型语言模型在进化框架中的迭代交互,L-AutoDA 能够高效地自动设计具有竞争力的攻击算法,减少了人力成本。我们在 CIFAR-10 数据集上展示了 L-AutoDA 的有效性,表现出较基准方法在成功率和计算效率方面的显著提升。我们的发现突显了语言模型作为对抗性攻击生成工具的潜力,并为开发稳健的人工智能系统提供了新的途径。
Jan, 2024
这篇论文提出了一种新的 LaDA 模型,在跨语言自适应的语音理解系统中使用潜在对话动作层来优化解码策略,以提高对复杂多语言意图和槽值的处理能力,并在零样本和少样本适应方面取得了最先进的结果。
Aug, 2023
该论文提出了一个简单、通用和有效的对话系统模型 - 交替角色对话模型(ARDM),利用大规模预训练语言模型,可在无需人类注释监督的情况下实现有效会话,并且在 CamRest676 和 MultiWOZ 等任务导向型对话数据集上的表现优于或与最先进的方法相当。该模型还可推广到更具挑战性的非协作任务,例如说服任务,能够生成类似于人的回复,以说服人们捐赠慈善事业。
Oct, 2019
本文提出了一种新的解决方案 - 对话式解决代理(DERA),用于提高较大语言模型(LLMs)在医疗保健等安全关键领域输出的准确性和完整性,通过与 GPT-4 的交互来迭代地提高输出,并在医疗交流摘要、护理计划生成和 MedQA 等临床焦点任务中表现出显著的性能改进。
Mar, 2023
自动驾驶面临重要的挑战:公众信任问题和长尾未知驾驶场景的安全担 忧。为解决这个问题,本文提倡在自动驾驶系统中整合大型语言模型,充分利用其强大的常识知识、推理能力和人机交互能力,将其作为智能决策者来提升整体自动驾驶性能和安全性。本文展示了两个案例研究的结果,证实了我们方法的有效性。此外,我们还讨论了将大型语言模型整合到其他自动驾驶软件组件 (包括感知、预测和仿真) 的潜在优势。尽管在案例研究中面临挑战,但大型语言模型的整合对于加强自动驾驶的安全性和性能具有潜在的希望和益处。
Nov, 2023
对于最近有人声称基于 Transformer 模型体系结构的预训练语言模型 LaMDA 具有感性的争论中,我们认为这种语言模型不能具有感性或意识,LaMDA 没有表现出其他类似模型的进展,我们通过集成信息理论分析变压器结构来证明这一点,我们认为意识的主张是 NLP 报道中使用人类描述语言的趋势的一部分,无论这些主张的真实性如何,都需要考虑语言建模的进展和相关的伦理问题。
Nov, 2022
这项研究介绍了 Me LLaMA,这是一个医学领域的大型语言模型(LLM)家族,包括基础模型 Me LLaMA 13/70B 和增强聊天版本 Me LLaMA 13/70B-chat。通过在大型医学数据上进行持续预训练和指导调整,Me LLaMA 模型在医学任务上表现优于其他医学 LLMs,适用于医学人工智能应用。
Feb, 2024