从指令学习生成对话:使用模拟聊天构建对话系统
利用大型语言模型(LLMs)生成的合成观察数据,用于改善机器学习模型对于自闭症谱系障碍(ASD)诊断的准确性。通过评估 ChatGPT 和 GPT-Premium 生成的 4,200 个合成观察数据,并使用预训练于生物医学文献的 BERT 分类器比较模型之间的性能差异,发现数据增加了召回率 13%,但降低了精确度 16%。未来的研究将分析不同合成数据特征对机器学习结果的影响。
May, 2024
通过构建名为因果室的计算机控制实验室,研究人员可以在各个领域中快速、廉价地生成大量来自非平凡但易理解的物理系统的数据集,并提供一种丰富的算法测试平台,解决因果发现、分布外泛化、变点检测、独立成分分析和符号回归等问题。
Apr, 2024
使用深度学习技术,以大量未标记数据预训练模型,并在特定任务上进行微调,对大脑信号进行建模比常规线性自回归模型具有更好的建模能力,其中 GPT2 模型在时间、空间和频谱特征方面更好地重现了实际数据和任务数据的诱发活动。
Apr, 2024
本研究使用高斯过程(GPs)探索了对具有基本结构的均值回归时间序列进行预测的应用,使用相对未开发的函数和增强数据结构。通过模拟数据,我们可以将预测分布与测试集的实际分布进行比较,从而减少对实际数据进行时间序列模型测试时固有的不确定性。
Feb, 2024
本研究探讨了大型语言模型(LLMs)在生成人工数据中的不断扩大的作用。尽管人工数据能够与人类性能相匹配,但本文揭示了显著的潜在差异,尤其是在复杂任务中,LLMs 常常错过对内在人类生成内容的微妙理解。该研究批判性地考察了多样化的 LLM 生成数据,并强调了在数据创建和使用 LLMs 时遵循道德实践的必要性。它凸显了解决 LLM 生成内容中产生的偏差和人为因素对于未来研究和开发的重要性。所有数据和代码都可在我们的项目页面上获得。
Jan, 2024
通过人类的自由文本反馈进行学习对于对话系统至关重要,本文通过研究多个常用的对话数据集,包括 MultiWoZ,SGD,BABI,PersonaChat,Wizards-of-Wikipedia 和 Self-Feeding Chatbot 的人机分离数据集,发现了数据集的组成情况,误差类型,用户响应类型以及它们之间的关系,并研究了将这些数据包含在语言生成模型 (response generation) 中的影响。
Oct, 2023
利用模拟数据在因果发现领域普遍存在,本文对线性数据和非线性模型中方差的演变模式进行了研究,并引入了 ScoreSort 算法。通过理论和实证分析发现 ScoreSort 在统计效率上相较于之前的方法具有优势,认为缺乏数据多样性限制了非线性因果发现方法的评估,强调了在问题类中进行不同设置的全面测试的重要性,以及分析因果发现中的统计特性的重要性,现有研究常限于模型的可识别性条件。
Oct, 2023
车联网 (V2X) 的协作感知对于自动驾驶至关重要。然而,实现高精度的 V2X 感知需要大量的真实世界数据进行标注,这往往昂贵且难以获取。模拟数据因其可大规模低成本生成而备受关注。然而,模拟数据与真实世界数据之间存在显著的领域差异,包括传感器类型、反射模式和道路环境差异,导致在真实世界数据上评估的模型性能较差。为了充分利用模拟数据,我们提出了一种新的无监督 sim2real 领域适应方法,名为 Decoupled Unsupervised Sim2Real Adaptation (DUSA)。我们的新方法将 V2X 协作 sim2real 领域适应问题分解为两个子问题:sim2real 领域适应和协同代理适应。通过针对 sim2real 领域适应,设计了一种自适应聚合特征的位置适应型 Sim2Real Adapter (LSA) 模块,通过聚合全局特征上的模拟 / 真实判别器来调整来自特征图的关键位置的特征,并对模拟数据和真实世界数据之间的特征进行对齐。针对协同代理适应,我们进一步设计了一种自信度感知的协同代理 Adapter (CIA) 模块,通过代理自信度图的引导来调整异构代理的细粒度特征。实验证明了所提出的 DUSA 方法在从模拟 V2XSet 数据集到真实世界 DAIR-V2X-C 数据集的无监督 sim2real 领域适应任务中的有效性。
Oct, 2023
通过对针对性别少数群体的仇恨言论的具体例子,本文分析了仇恨言论检测所面临的问题,并提出了一个以数据为中心的综合框架,以跨七个广泛的维度来概括数据创建流程,同时指出实践者将从按照该框架来创建未来的仇恨言论数据集中获益。
Sep, 2023