ChatGPT 如何评价声音语义?
本文提出了一种名为 AudioGPT 的多模 AI 系统,该系统结合了基础模型来处理复杂的音频信息和解决许多理解和生成任务,以及支持口语对话的输入 / 输出接口(ASR,TTS),并通过一系列实验证明了 AudioGPT 在多轮对话中具有语音、音乐、声音和对话理解和生成任务的能力。
Apr, 2023
通过 12 个预注册的实验,我们发现像 ChatGPT 这样的运用大型语言模型的聊天机器人能够在很大程度上模仿人类语言处理,但是他们在一些方面与人类处理方式存在差异,并且可能通过 Transformer 架构来解释这些差异。
Mar, 2023
AI 的透明度和责任感的需求增加了,因为对 AI 决策背后的推理进行自然语言解释(NLE)对于澄清重要,但通过人的判断进行评估复杂且资源密集,由于主观性和对细粒度评分的需求。本研究探索了 ChatGPT 与人类评估之间的一致性,涵盖了二元、三元和 7-Likert 量表多个等级尺度。我们从三个 NLE 数据集中抽取了 300 个数据样本,并收集了 900 个人类注释,用于信息量和清晰度评分作为文本质量度量。我们还在不同主观性得分范围内进行了配对比较实验,其中基线来源于 8,346 个人类注释。我们的结果表明,在粗粒度尺度上,ChatGPT 与人类的一致性更好。配对比较和动态提示(即在提示中提供语义上相似的示例)提高了一致性。该研究推进了我们对大型语言模型的理解,以在不同配置中评估文本解释质量,为负责任的 AI 发展做出贡献。
Mar, 2024
通过实验和比较 ChatGPT 与普通人和语言学家在语言构造的判断上的一致性,在判断任务和语言处理方式上的差异性分析,我们的研究结果显示 ChatGPT 是人工智能模型中与语法直觉最接近的模型之一。
Jun, 2024
研究探讨人类和 LLM 生成的对话之间的语言差异,并使用 ChatGPT-3.5 生成的 19.5K 对话作为 EmpathicDialogues 数据集的补充。研究使用了语言查询和词频统计(LIWC)分析,在 118 个语言类别上比较 ChatGPT 生成的对话和人类对话。结果显示人类对话在可变性和真实性方面更出色,但 ChatGPT 在社交过程、分析风格、认知、注意力焦点和积极情绪方面表现优异,加强了 LLM “更接近人类” 的最新发现。然而,在正面或负面情感方面,ChatGPT 和人类对话之间没有显著差异。对话嵌入的分类器分析表明,尽管对话中未明确提及情感,但存在着情感价值的隐式编码。该研究还提供了一个新颖的 ChatGPT 生成的对话数据集,其中包含两个独立的聊天机器人之间的对话,这些对话旨在复制一个开放可访问的人类对话语料库,广泛应用于语言建模的 AI 研究。我们的研究结果增加了对 ChatGPT 的语言能力的理解,并为区分人类和 LLM 生成的文本的持续努力提供了信息,这对于检测由 AI 生成的虚假信息、错误信息和误导信息至关重要。
Jan, 2024
通过测试 ChatGPT 在语言记忆任务中对人类表现的预测能力,研究发现 ChatGPT 和人类的表现有惊人的一致性,尽管它们的内部机制可能存在显著差异,这一发现强调了生成型人工智能模型在准确预测人类表现方面的潜力。
Mar, 2024
ChatGPT 是如何运作并具备超过预期能力的?本文通过与 ChatGPT-4 对话的方式,对 ChatGPT 作出解释,包括与语言自身相关的良性偏见、语言的间接语义基础以及神经网络中的类别学习等。
Feb, 2024
通过利用语言模型的推理能力,本文介绍了一种生成逼真声音景观的工作流程,该工作流程不仅关注与屏幕视觉匹配的声音,还扩展到建议可能不直接可见但对于打造令人信服和沉浸式听觉环境至关重要的声音。
Nov, 2023
本文研究了 GPT-3 在通过文本解释来表达音乐决策方面的能力,结果表明 GPT-3 缺乏理解音乐决策的必要智能,解决该问题的主要障碍是缺乏艺术家创作音乐时解释过程的数据资源。
May, 2022
我们介绍了 ChatMusician,这是一个开源的大型语言模型,基于在 ABC 符号表示和音乐作为第二语言上进行连续预训练和微调的 LLaMA2,它能够理解和生成音乐,并能够创作结构良好、完整的音乐作品,超过了 GPT-4 基准模型。
Feb, 2024