- 工具故障:检测有故障的工具中的静默错误
LLMs 使用工具检索知识、在网络上执行任务甚至控制机器人,本文介绍了一个框架来更广泛地研究模型对探测 ' 静默 ' 工具错误的能力,并对如何规划进行反思,以更直接地与模型作为工具的流行用途相一致。我们提供了一个初步的故障恢复方法,在控制计 - 工具增强的大型语言模型是否能意识到不完整的条件?
本研究探讨了大型语言模型与工具的整合,以及在用户提供不完整信息或无法使用所需工具时如何识别并管理这些不完整场景,从而提高语言模型的可靠性,并验证了大多数语言模型在识别特定工具所需的附加信息和适当工具的缺失方面存在困难。
- 工具究竟是什么?来自语言模型视角的调查
语言模型和工具的定义、应用场景、效率以及未来研究的挑战和可能性的综述。
- 从总结到行动:利用开放式接口增强大规模语言模型对复杂任务的应用
人类与动物之间的区别在于人类可以使用和创造工具,而使大型语言模型具备学习外部工具使用的能力可以成为实现人工智能的重要一步。本研究引入了一种新的工具调用管道,设计用于控制庞大的真实世界应用程序接口,通过 ` 从摘要到行动 ' 的 Sum2Ac - API-BLEND:用于训练和基准测试 API LLM 的全面语料库
本文介绍了 API-BLEND 数据集,用于训练和基准测试工具增强的大型语言模型,数据集模拟了涉及 API 任务的实际情境,如 API / 工具检测、插槽填充和检测到的 API 排序。
- 基于 LLM 的中间件:工具在复杂环境中对语言代理很重要
本研究探讨了利用工具增强大规模语言模型在处理复杂环境中的潜力,并通过在知识库和数据库等复杂环境中的实证来展示这种潜力。结果表明,配备这些工具的 GPT-4 在需要访问数据库内容的任务中性能提高了 2.8 倍,在知识库任务中提高了 2.2 倍 - TOOLVERIFIER:通过自验证实现针对新工具的泛化
通过自我验证方法,在语言模型中学习使用工具是构建通用助手的重要里程碑,但仍然是一个尚未解决的问题。本研究介绍了一种通过自我对比问题在工具选择和参数生成过程中区分相似候选项的方法。在 ToolBench 基准测试的四个任务上进行了大量实验,包 - 利用人工智能推动跨非洲的科学与计算教育:进展、挑战与机遇
在非洲大陆,学生面临着各种教育挑战,包括获取计算机、互联网连接、可靠电力和合格教师等重要资源的限制。尽管存在这些挑战,但像 BERT 和 GPT-4 这样的人工智能近期取得的进展已经展示出了推动教育的潜力。然而,这些人工智能工具往往主要在西 - MM基于知识的黏合剂选择支持:能否粘合?
通过与粘接专家团队的合作,本研究提出了一种高级工具,包括一个知识库和交互界面,能够协助粘接专家节省时间并找到更合适的胶粘剂。
- MusicAgent:大型语言模型的音乐理解和生成 AI 代理
通过集成多种音乐相关工具和一个自动化工作流,MusicAgent 系统旨在解放用户,使他们能够专注于创造性工作,从而提供无缝且丰富的音乐体验。
- 外科视频的动态场景图表示
通过使用场景图和图卷积网络对手术视频进行建模和分析,研究证明其在自动化手术工作流识别方面具有竞争性能,并对模型决策的解释性和稳健性提供了关键的临床支持。
- ChatGPT 时代的服务组合
本文猜测像 ChatGPT 一样的系统如何支持自动化服务组合,同时确定了探索新研究领域以利用此类工具在面向服务的组合领域的优势。
- 利用执行反馈提升语言模型对学习者的帮助
该研究主要介绍了一种名为 TRICE 的基于执行反馈的二阶段端到端框架,使语言模型通过从工具执行中得出的反馈不断学习,从而学习何时以及如何有效地使用工具,实验结果表明,TRICE 可以通过减少模型对工具的依赖性来选择性地使用工具,同时提高性 - ToolkenGPT: 利用工具嵌入增强冻结语言模型
本研究提出了一种名为 ToolkenGPT 的方法,通过 in-context learning 实现大量工具集的无缝扩展,从而有效提升了 LLM 在数字推理、问题回答和行动计划生成等领域中的性能表现。
- MM深度学习对于纯数学家是否是有用的工具?
一篇关于纯数学家在其研究中使用深度学习工具所期望的个人及非正式阐述。
- 增强语言模型:一项综述调查
该论文回顾了一些带有推理技能和使用工具能力的语言模型增强技术,并将其称为增强语言模型 (ALMs),该模型在缺失令牌预测的目标下,能够学习推理、使用工具,甚至执行任务,具有普通语言模型所没有的上下文处理能力,且在多个基准测试中优于普通语言模 - PushWorld:带工具和可移动障碍的操纵计划基准
本研究基于一个物理世界环境,结合机器人的智能行为,检验了当前最新的经典计划和强化学习算法。结果发现,新提出的经典计划启发式算法在效率更高的情况下,仍未能达到最优解,略低于人类的水平。
- 生成语料的属性理解
本文介绍了一个用于检验生成文本语料库属性的工具集,该工具集应用于不同生成语料上获得了生成模型属性的新认识,结果显示使用两种主要的生成技术生成语料的差异显著。
- 计算语言学与自然语言处理
介绍计算语言学方法,重点关注其在翻译实践和研究中的应用,涵盖了语言数据的收集、存储、索引和分析的计算模型、方法和工具,并讨论了该领域的主要方法论问题和挑战。
- MM合成数据 -- 什么、为什么和如何?
本文介绍了合成数据技术及其隐私保护方面的现状,以及相关工具的使用,强调了其细微处理中容易被忽略的方面。