FLIN: 用于 Web 导航的灵活自然语言接口

ACLOct, 2020

FLIN: 用于 Web 导航的灵活自然语言接口

FLIN: A Flexible Natural Language Interface for Web Navigation

Sahisnu Mazumder, Oriana Riva

TL;DRFLIN 是一种自然语言接口用于网页导航，它将用户的命令映射到概念级别的操作并可灵活适应不同的网站，与低级 UI 操作不同。

Abstract

ai assistants can now carry out tasks for users by directly interacting with website UIs. Current semantic parsing and slot-filling techniques cannot flexibly adapt to many different websites without being consta

ai assistants flin natural language interface web navigation semantic parsing

发现论文，激发创造

逐步学习上下文环境中的迭代检索

通过强化学习的训练过程，我们引入了迭代检索的新框架，将活跃检索器赋予迭代决策的能力，并在选择上下文学习示例时在语义解析任务中表现优于之前的方法。

Jun, 2024

神经机器翻译中的结构泛化评估

本研究探讨了机器翻译和语义解析中的复合通用性问题，并发现神经机器翻译模型在句法结构的通用性上存在困难，而语义解析和机器翻译具有不同的性能趋势。

Jun, 2024

AI-Based 编码辅助在实践中的应用：现状、观点和未来发展

AI 助手在软件工程中的使用情况对开发者的需求和改进方向具有重要影响。

Jun, 2024

基于多模态上下文语义解析的语音处理

通过将多模态输入与先前的语境相结合，我们介绍了一种称为 SPICE 的任务，旨在提高人工智能代理程序的上下文意识。SPICE 不仅仅是传统语义解析，还提供了一种结构化、可解释的框架，用于根据新信息动态更新代理程序的知识，反映人类沟通的复杂性。我们开发了 VG-SPICE 数据集，旨在通过口语对话交换中的视觉场景图构建来挑战代理程序，并突出了语音和视觉数据的整合。我们还介绍了用于 VG-SPICE 的音频 - 视觉对话场景解析器 (AViD-SP)。这些创新旨在改进多模态信息处理和整合。VG-SPICE 数据集和 AViD-SP 模型均已公开提供。

Jun, 2024

基于语言模型的组合概括

通过扩展语义解析的组成概括工作，我们为生成与知识图谱配对的自然语言问题开发了一种方法，以在不受限于语言模型权重隐式编码的信息的同时，对这些模型从知识图谱中学习和概括程度进行控制性评估，我们发现现有的将语言模型与知识图谱组合的方法在未见过长度序列和新组合的基础组件方面存在泛化问题，因此，我们希望我们的工作和发布的数据集能够促进未来研究并探索如何更好地将语言模型与结构化知识表示相结合的方法。

Jun, 2024

SPAGHETTI：异构数据源的开放领域问答 —— 检索和语义解析

SPAGHETTI 是一个混合问答 (QA) 流水线，利用来自知识库、文本、表格和信息框的异构知识源，通过 LLM 增强方法在 Compmix 数据集上取得了最先进的性能，达到了 56.5% 的精确匹配（EM）率。更重要的是，对数据集的一部分进行手动分析表明，SPAGHETTI 的准确率超过 90％，表明 EM 不再适用于评估当前的 QA 系统的能力。

Jun, 2024

PixelsDB：灵活服务级别和价格的无服务器及自然语言辅助数据分析

PixelsDB 是一个开源的数据分析系统，通过自然语言接口和灵活的服务级别和价格，使得缺乏系统或 SQL 专业知识的用户能够高效地探索数据。

May, 2024

周到之物：用小型语言模型构建以人为本的智能设备

提出了 thoughtful things 这种设备，利用轻量级本地语言模型执行操作并解释行为，以解决智能设备使用的复杂性和语音助手的局限性。

May, 2024

WebAI 导航：使用大型语言模型和强化学习训练代理完成 Web 任务

该研究提出了一种将监督学习和强化学习技术相结合的新方法，通过在 MiniWoB 基准上利用两种方法的优势，解决了先前模型对 HTML 内容的理解上的关键限制，并展示了优于先前监督学习方法的实验结果，同时在与多模式强化学习方法相结合时缩小了与强化学习模型之间的性能差距，从而为未来的网络导航提供了新的方向和对语言建模在计算机任务中的潜力的洞察。

May, 2024

使用大型语言模型的知识图谱上的多跳问答

鉴于知识图谱，以多跳问题为基础评估语言模型在知识图谱中的问答能力，展示了基于信息检索和语义解析的方法能够具有竞争力的性能。

Apr, 2024