- 推进医疗自动化:面向医疗必要性证明的多智能体系统
应用 Swarm-Structured Multi-Agent Systems(MAS)研究医疗必要性,通过对临床指南对患者特定医疗结构化和非结构化数据的系统审查,将复杂任务分解为可管理的子任务,并研究各种提示策略对 AI 代理的影响,评估 - 对神经网络编码结构化数据的实验
该研究论文的主要内容是在一个名为 Battlespace 的游戏领域中创建一个能够选择良好行动的人工智能代理,使用 Monte Carlo Tree Search (MCTS) 和 Deep Q-Network (DQN) 技术,针对如何呈 - 人工智能代理的非追求权力的稳定性量化
如果一个 AI 代理在一个设置中被认为是安全的,那么它在一个类似的新设置中也是安全的;我们研究了 AI 对齐的一个核心问题 —— 我们训练和测试模型在一定的环境中,但在部署中需要确保在测试中被认为是安全的模型仍然是安全的;我们的安全概念基于 - Graph2Tac: 数学定理证明中的数学概念的分层表示学习
使用新的基于图的数据集进行 Coq 的机器学习,我们提出了 Graph2Tac(G2T)模型,通过考虑以往定义层次与当前目标之间的依赖关系,将新的数学概念整合到模型的知识库中。
- 数据配方制作器:基于人工智能的概念驱动可视化创作
使用一个新的可视化范例,即 “概念绑定”,通过一个 AI 代理来解决可视化创作中数据转换的困难,使用 Data Formulator 进行数据转换和可视化创作,并为创作者提供反馈,通过用户研究验证了其有效性和潜在的研究方向。
- 基于 AutoBA 的自动生物信息学分析
Auto Bioinformatics Analysis (AutoBA) 使用大型语言模型设计,通过最小用户输入提供详细的各类生物信息学任务的步骤计划,经过专业生物信息学家的验证,在各种基因组学分析案例中证实了其鲁棒性和适应性,在保护数据 - 走向元宇宙逻辑的一些初步步骤
本研究旨在探寻应用于真实世界和虚构领域的计算机多元宇宙应用程序,考虑到一阶逻辑无法处理甚至是最简单的信息系统,因此使用非传统扩展采用最小复合逻辑策略,并借助 AI 代理 ChatGPT 探讨理论概念...
- ADVISE: 全球发展证据综述的 AI 加速设计
本研究介绍了一种利用 BERT 模型开发 AI 代理程序,结合人类团队设计全球发展证据综合产品的方法,探讨了活性学习策略的影响,结果表明,将 BERT-based AI 代理程序纳入人类团队可以降低人类筛选工作量 68.5%,而采用高优先级 - 利用人工智能玩狼人杀游戏以促进语言理解
本文介绍了使用预训练语言模型构建一个价值网络,并在此基础上开发出一个 AI 代理系统 Deep Wolf 来玩 Werewolf 游戏的方法和性能评估结果,其表现可以和人类玩家竞争,这表明当前的语言模型有能力在对话中怀疑他人的话语,撒谎或者 - 目标一致性:价值对齐问题的人类意识解释
AI 中的价值对齐问题源于 AI 代理的指定目标与其用户的真正基础目标不匹配。本文提出了一种名为目标对齐的新价值对齐问题公式,并提出了一种交互式算法,用于确定用户的真正基础目标。
- 使用深度学习和树搜索学习无先验数据设计:发现可推广的设计策略
本文提出一种自学习框架,将深度策略网络与新颖的树搜索算法结合,实现了在问题空间中学习可推广的设计行为的目标。利用此框架,可以在没有先验数据、现有解决方案和问题特定学习的情况下,自学习高性能和通用解决方案。
- 学习回答多语言和混合代码问题
本论文聚焦于在多语言环境下推进处理末端用户问题的 QA 技术,涉及多语性和混编等问题并提出了一种多文档利用的多跳问题生成技术,实验证明该方法可在 MQA、VQA 和语言生成等多个领域和语言中达到最先进的表现,是通用的,可用于提高 QA 系统 - ICML多阶段强化学习中关键时期的重要性
该研究提出了一种多阶段强化学习策略,以强调在关键时期周围找到合适的刺激以形成奖励,从而提高 AI 代理的性能、效率和稳定性。
- VD-PCR: 通过代词指代消解提高视觉对话
本文中提出了 VD-PCR,这是一种提高视觉对话理解的新框架,旨在通过使用代词照应解决方法,包括隐式和显式方法。采用隐式方法,采用新的方法来执行代词照应解决和视觉对话任务的联合训练;采用显式方法,提出从代词和它们的指示物的指代关系识别历史轮 - 通过问问题学习检索视频
提出了一种具备多轮对话交互能力的视频检索框架,该框架包括 AI agent、多模态问答生成器及信息指导监督器,实验表明其效果显著优于传统非交互方式的视频检索系统。
- ACL充分利用之前的数据:交互式文本摘要的偏好反馈解决方案
本研究提出了一个新的交互式框架,可通过优化离线数据和一种新型奖励模型,以少量交互式反馈的方式训练摘要模型,提高 ROUGE 得分和采样效率。这个框架在摘要的活动、少量交互式学习和在线学习的场景下均具有优势。
- AAAI朝着人类级视频理解智能的发展
本文旨在开发一种人工智能代理,能够观看视频并与人类就视频故事进行对话。我们提出了视频图灵测试作为衡量视频理解智能以及评估 AI 代理器类人性的有效而实用的评估方法,并提供了案例研究来证实该测试的有效性和有用性。
- ACL出门看前方:基于运动和外观相互协作的视频问答网络
本文提出了基于运动和外貌信息的交叉模态特征嵌入的 MASN 网络用于视频问答任务,通过问题导向的融合实现了最新的表现,并在 TGIF-QA 和 MSVD-QA 上实现了新的最佳性能。
- ACL基于 MRR 和 NDCG 模型的视觉对话集成
介绍了一种基于非参数排序的双步骤方法,可以将 MRR 和 NDCG 模型合并,从而在视觉对话的领域中发挥出色,展现了当前 MRR 和 NDCG 的最优表现。
- TStarBot-X:StarCraft II 完整游戏中高效联赛训练的开源综合研究
本研究基于 AlphaStar 的技术,利用多项创新性技术,如新型联赛训练方法、配合规则的策略搜索、稳定的策略改进、轻量级神经网络架构、模仿学习中的重要性采样等,开发出一款名为 TStarBot-X 的 AI 代理程序,在计算能力有限制条件