- SIGIR虚拟助手的大型语言模型合成查询生成
通过大型语言模型生成的合成查询可以提高虚拟助手的能力,它们与基于模板的方法相辅相成,能够生成类似虚拟助手用户查询的详细且具体的查询。
- 面向任务的查询基准 (ToQB)
利用现有的任务导向对话数据集和大型语言模型(LLM)服务,我们提出了一种高效生成任务导向查询基准(ToQB)的新方法,并演示了如何自定义 LLM 提示,并表征生成的任务导向查询。
- 面向设备上的虚拟助手的世界英语语言模型
通过使用适配器瓶颈来模拟方言特性,我们结合多种区域变体的英文构建了一个 “世界英语” 神经网络语言模型,以提高虚拟助手的可扩展性。
- 多模态方法在大型语言模型中的设备导向语音检测
虚拟助手的交互通常以预定义的触发短语作为开端,我们探索是否可以放弃用户必须以触发短语开始每个指令的要求。通过三种方式进行实验:首先,只使用从音频波形中获得的声学信息来训练分类器;其次,将自动语音识别(ASR)系统的解码器输出,如 1 最佳假 - LUCID: LLM 生成的复杂有趣对话短语
通过模块化和高度自动化的 LUCID 系统,我们产生了一个包含 4,277 个跨 100 个意图的多领域、多意图对话的种子数据集,其中包含了各种具有挑战性的现象和多样的用户行为。
- TOAD: 任务导向的自动对话系统具有多样化的回应风格
鉴于大型语言模型的最新进展,下一代虚拟助手的期望包括在各种使用场景中增强自然性和适应性。为了解决为面向任务的对话(TOD)创建高质量的注释数据的缓慢和昂贵问题,我们介绍了面向任务的自动对话(TOAD),以及其自动生成流程。TOAD 数据集模 - 多模态数据和资源高效的设备导向语音检测与大型基础模型
通过消除触发短语的需要,本研究探索了使用流式音频录制的设备麦克风记录的信号来确定用户是否在与虚拟助手进行交流,通过将语音识别系统的最佳假设和解码器信号与音频编码器的声学表示结合为大型语言模型的输入特征来实现这一目标。使用低秩适应和前缀调整的 - 对话助手中对话修复的分析
通过分析与 Google 助手和 Siri 的互动,本研究探讨了对话修复中互动语言在虚拟助手和用户之间的重要性,并发现虚拟助手在生成策略方面存在差异,但不能复制人类的修复策略。用户接受度调查显示英语和西班牙语用户在修复策略偏好和虚拟助手使用 - 增强虚拟助手智能力:针对元数据以外的实例级用户意图的精准区域定位
本文提出了一种新颖的跨模态深度学习方法,用于处理基于应用程序屏幕像素的实例级用户意图,同时在没有应用程序元数据的情况下预测目标操作区域和检测屏幕上的绝对按钮区域,并通过用户研究测试集上达到了 64.43% 的准确率。
- ChatGPT:愿景和挑战
研究人工智能,机器学习,虚拟助手和 ChatGPT 基础,视野,研究挑战,优势及未来发展可能性,如物联网,安全,人机交互等。同时探讨了 ChatGPT 的重要伦理和当前趋势。
- CONSCENDI:一种对比和场景引导的蒸馏方法,用于虚拟助手的护栏模型
本文研究使用 GPT-4 的训练数据和蒸馏方法,探索了一种称为 CONSCENDI 的守护模型,用于监控虚拟助手的输出,以保持其输出符合设计规则,提供了一种新方法以生成更多样化的违规训练数据。研究表明,使用 CONSCENDI 得到的守护模 - SIGIR虚拟助手中口语信息查询的建模:开放问题、挑战和机遇
讨论语音交互虚拟助手中的建模问题与挑战,提出了信息检索方法和研究可以应用于提高虚拟助手语音识别质量的机会,并简要概述了语音识别中当前的问题和挑战。
- 基于对话的意图识别:DSTC 11 面向任务导向对话任务的研究
本文提出一个针对客户服务交互的自动感知意图的基准测试,探讨了虚拟助手、bot 架构设计、意图识别、客户服务交互和评估方法方面的研究成果,并在挑战中收到了来自 34 个团队的提交和结果。
- 众包数据集中的代词错误
研究使用多语言翻译技术在虚拟助手中嵌入多元化,解决人称代词翻译偏差问题的实践方案。
- 超越 “男性密码”:NLP 背景下的隐性男性偏见
研究调查了两个自然语言处理数据集,发现当语言具有性别特征时,特别是具有男性特征时,就会出现性别偏见,为此提出了一个名为 AVA 的新词典,旨在涵盖性别化语言与 VA 语言之间的模糊关联。
- DAMP: 面向任务型对话的双重对齐多语言解析器
使用两个阶段的多语言语义解析的多语言代码切换语义解析系统,通过对比预训练改进英语性能和转移效率,并引入有限调整优化方法来提高零 - shot 性能,将 mBERT 的转移性能大大提高,同时使用 3.2 倍少的参数优于 XLM-R 和 mT5 - 基于实体中心查询语言模型的节省空间表示
本文通过在有限状态转换器框架内使用概率语法,提出了一种对虚拟助手的语音识别有着较好性能的方法,适用于实体识别问题。使用该方法相较于相同大小的 n-gram 模型,长尾实体查询的相对单词错误率提高了 10%。
- 食谱领域文本材料提取
本研究探讨了从虚拟助手所接收到的文本用户语句中提取食谱相关信息的方法,通过 fine-tuned 的 BERT 模型达到了 95.01% 的 F1 分数,并在 Github 上共享了全部代码。
- ACL数据驱动的金融领域统计和自然语言处理技术的内容创作
本文提出了一个通过摘要网络和层次聚类技术来提取客户提问的框架,同时对客户的问题进行语法和语义相似度分析,并采用 TF-IDF 和 BERT 计算相似性得分。
- 虚拟助手的辨别式实体感知语言模型
本文研究提出了一种基于知识图谱的语言建模方法,通过有效的格栅重排过程,达到了相对句子错误率的降低,为虚拟助手 ASR 的精度提高提供了强有力的支持。