- 从立体匹配的视角重温深度完成问题以实现跨域泛化
该论文提出了一个新的深度补全框架,它能够抵御领域转移问题,通过处理虚拟模式投影范例获得的虚构立体对,利用现代立体网络的概括能力来面对深度补全。任何立体网络或传统立体匹配器都可以无缝插入到我们的框架中,从而实现对未来立体领域的先进性。通过对跨 - 解耦文本到 SQL 的 SQL 查询难度解析
通过解耦 SQL 查询的难度分析问题和模式,我们引入了一种创新的基于 Text-to-SQL 的框架,将多难度任务简化为单一难度挑战,大大降低了语言模型的解析压力,并在 Spider dev 上实现了新的最新的性能。
- 利用强化学习和大型语言模型进行代码优化
提出了一种建立在大型语言模型和强化学习基础上的框架,用于减少代码优化的复杂性并提供更高的效率和可靠性。
- 数据科学家的保证论证操作化:在机器学习测试数据质量方面的概念和工具展示
我们提出了一个基于 Python 和 Jupyter Notebook 技术的框架,以支持机器学习组件中的 ACs 的实施,旨在使 ACs 中关于测试数据质量的相关证明过程更加有效。
- 物理符号优化
我们提出了一个框架来约束自动顺序生成方程式以通过构造符合量纲分析规则。结合增强学习,我们构建了 Phi-SO,一种从物理数据中恢复分析函数的物理符号优化方法,利用单位约束。我们的符号回归算法在已知物理单位的情况下取得了最先进的结果,在存在噪 - 利用众包数据和大型语言模型的接近实时地震致死人数估计
通过多语言的、群体化的社交媒体,引入一个端到端的框架,显著提高全球地震引发的人员损失预测的及时性和准确性。该框架集成了(1)基于大型语言模型、提示设计和少样本学习的分级伤亡提取模型,用于从社交媒体中检索定量人员损失索赔,(2)一个考虑物理约 - 鲁棒的流式数据处理、采样及在线学习的视角
本文针对统计学习进行了概述,然后对鲁棒的流式技术和挑战进行了调查,并通过几个严格的结果证明了我们在整个过程中激发并暗示的关系。此外,我们将通常不相关的定理统一到一个共享的框架和符号中,以阐明我们所发现的深层次联系。我们希望通过从一个共享的视 - TaskWeaver:一个面向代码的代理程序框架
通过将用户请求转换为可执行代码,TaskWeaver 作为一种以代码为核心的框架,为领域特定的数据分析任务提供支持,提供对丰富数据结构和灵活插件的使用,并利用 LLM 编码能力处理复杂逻辑,以创建能处理复杂任务并适应特定领域场景的智能对话代 - MM逼真的日常人类活动模拟框架
为了开发和测试与用户在家中的日常活动相互作用和适应的社交机器人 Astro,需要对人类活动进行逼真的模拟。本研究提出了一个在家庭环境中大规模模拟日常人类活动模式的框架,支持手动配置不同人物或活动模式,活动时间的变化,并在多个家庭布局上进行测 - HOMOE:一种基于记忆和组合感知的软混合专家 Hopfield 网络的零样本学习框架
我们的论文提出了一个新的框架,首次将现代霍普菲尔德网络和专家混合模型(HOMOE)相结合,用于对以前未见的对象的组合进行分类。该方法在多个基准测试中取得了最先进的性能,包括 MIT-States 和 UT-Zappos,并且我们还研究了每个 - 基于分解的多目标强化学习:分类与框架
基于分解的多目标强化学习(MORL/D)引入了一个全面的分类体系,提供了一个有结构的基础,用于对现有和潜在 MORL 作品进行分类。同时,引入的框架展示了其灵活性,并通过各种配置的实现来证明其多功能性。通过提出这个分类体系和框架,本文为 M - TPTU-v2:在现实世界系统中增强基于大型语言模型的代理人的任务规划与工具使用
该论文介绍了一个综合框架,旨在增强基于大型语言模型的代理在实际系统中的任务规划和工具使用能力,通过 API 检索器选择相关 API、LLM 精调器调整基础 LLM 以增强规划和 API 调用能力、以及演示选择器用于区分难以辨别的 API 并 - 定义、建模和分析认知机制的框架
通过机械化途径,提出定义、建模和分析认知机制的框架,并介绍了数学模型和可视化方法。
- CAIS-DMA:协同人工智能系统的决策助手
该研究介绍了一种新的方法,用于在协作人工智能系统在经历破坏性事件后的性能退化时自动支持决策过程。我们开发了一个框架,自动监控决策过程,在性能退化时进行干预,并推荐下一步操作。
- CVPR用于在连续空间中执行自然语言指令的取送任务的完全自动化任务管理框架
本文旨在开发一个能够根据视觉信息来执行任务的框架,以响应自然语言指令进行带有物体接地的取物和搬运(FCOG)任务。为了解决现有框架的局限性,我们提出了一个完全自动化生成、执行和评估 FCOG 任务的框架,并引入了将任务划分为四个不同子任务的 - 人工智能水平:在通往人工智能通用水平的道路上实现进展
我们提出了一个人工通用智能(AGI)模型及其前身的能力和行为分类框架,该框架引入了 AGI 性能、广泛性和自治程度的级别。希望这个框架类似于自动驾驶的级别,通过提供一个共同的语言来比较模型、评估风险并在 AGI 的道路上衡量进展。我们分析了 - LLM 集成应用中的提示注入攻击与防御
大型语言模型在 LLM 集成应用中存在提示注入攻击的安全漏洞,现有研究有限且缺乏系统性,本文提出了一般性的框架来理解和设计这种攻击,同时也提出了对应的防御框架,并基于 10 个 LLM 和 7 个任务进行了系统评估。
- 生成型 AI 系统的社会技术安全评估
生成型人工智能系统的安全评估需要考虑风险,本文提出了一个三层框架来评估这些风险,结合体系安全原则并考虑人类互动和系统影响作为额外的评估层,同时分析现有的安全评估存在的几个问题并提出解决办法,以此实现生成型人工智能系统的全面安全评估。
- 基于部分原型的分类器可解释性分析:一种以人为中心的视角
使用可解释的部分原型网络作为黑盒图像分类器的替代方法来评估可解释性的框架和实验
- 关于预测模型与决策者:为什么公平需要超越公平预测模型
在预测为基础的决策中,建立一个概念性框架以识别责任和实施公平性治理机制,从而将注意力从抽象的算法公平性转向依情况而定的决策制定,认识到具有独特目标和独立行动的不同参与者。