“藏在明处”:设计合成对话生成以揭示社会情境规范
本文提出了一种新的对话代理模型——Generative Conversation Control,它能够控制对话代理的个性,并通过控制该模型上一次与目标演员的对话,实现对话代理个性的表达,该模型在 Reddit 评论数据上进行了验证和评估,其效果得到了显著提高。
May, 2020
本文探讨了大规模语言技术在人类与对话代理之间的应用,提出了几个步骤以确保人类价值观得到贯彻,并探索了如何通过对话规范来协调对话代理与人类之间的通信。
Sep, 2022
通过语言模型提示和自我验证机制,NormSAGE框架可以发现符合人类交流和互动中的多语言、多文化规范,评估结果表明,与基线相比,该方法能够在语境中发现更多相关且有意义的规范,同时发现的中文对话的规范灵敏度和正确性与英文对话相当。该方法同时可以识别符合文化特定的规范,并通过可解释性和透明度支持动态实例化对话中的任何规范遵守和违规,并在传达自然语言解释时达到人类写作质量的水平。
Oct, 2022
使用专家编写的少量对话作为上下文示例,通过提示生成社交对话数据集,可在多方交流任务中创建更多的合成数据。与人类收集的对话相比,合成的多方交流在所有度量维度上都获得了更多的好评。
Feb, 2023
本文提出了第一个基于中国社会文化的社交感知对话语料库- SocialDial,使用 ChatGPT生成了 4,870 段数据,并评估了使用BERT和RoBERTa等预训练模型的数据集。
Apr, 2023
本文提出了NormMark,一种基于概率生成的马尔可夫模型,通过离散和连续的隐变量去捕获会话历史中的特征,提高规范识别的能力。在弱批注数据集上,本方法的F1分数更高,超过了当前最先进的方法,包括GPT3。
May, 2023
提出了一种半自动对话生成框架DIALGEN,它使用语言模型(ChatGPT)迭代生成子对话,并使用人类反馈来纠正不一致性或重定向流程,以解决私人信息保护和成本的问题。通过结构化摘要代理人-客户信息收集通话的实验,展示了DIALGEN数据在模型性能提高方面的显著改进。
Jul, 2023
社会规范对人际交往产生根本性的影响。本研究介绍了NormDial,一个高质量的双向对话数据集,其中具有中美文化中社会规范的每个交互回合的注释。通过引入社会规范遵守检测任务,我们使用人机协同流程使用少量由专家注释的社会规范提示大型语言模型在中英文中合成生成了数据集。我们通过人工评估表明我们生成的对话质量很高,并进一步评估现有大型语言模型在此任务上的性能。研究结果指向了跨语言和文化对话背景中了解社会规范微妙之处的新方向。
Oct, 2023
推广Norm违规疗法,ReNoVi是一个大规模对话语料库,包含9258个带有社会规范标注的多轮对话,以及定义了一系列任务,以逐步理解和纠正违规行为,从而使交互式AI系统具备疗法能力。
Feb, 2024
本研究解决了在社会意识对话中缺乏高质量社会文化规范的问题。通过利用大型语言模型构建全面的社会文化规范库,研究者提出了一种创新的方法,使用合成数据进行训练,获得的规范质量与真实数据相当。这一发现对提升对话系统在多种任务中的表现具有重要影响。
Oct, 2024