AI 论文速递

最新

大型逆向渲染模型：渐进重建形状、材料和视依赖光照场
本文提出了大型逆向渲染模型（LIRM），旨在解决现有大规模重建模型在重建未见部分、光泽外观恢复和生成可被标准图形引擎使用的可重光照3D内容方面的不足。我们提出了三项技术贡献，包括逐步添加输入视图以改善重建的更新模型、用于恢复详细纹理和材料参
PDFa day ago
模块化机器学习：通向新一代大型语言模型的重要路径
本研究解决了大型语言模型（LLMs）在推理、事实一致性和可解释性方面的关键局限。提出了模块化机器学习（MML）这一新学习范式，通过将LLMs的复杂结构分解为三个相互依赖的组成部分，以提升其对逆事实推理的能力，减少幻觉，同时促进公平、安全和透
PDFa day ago
基于物理信息神经网络的水下车辆建模与控制
本研究针对水下车辆建模中的数据效率和泛化能力不足的问题，提出了一种物理信息神经网络控制框架（PINC）。通过结合初始状态、控制动作和时间输入，该框架可以在训练域之外实现物理一致的状态过渡，验证结果表明其在长时间预测方面相较于非物理信息方法显
PDFa day ago
多向量搜索索引调整
本研究针对现有多向量搜索索引调整的不足之处，提出了一种新的框架以优化多向量数据库的索引选择。研究表明，该框架在满足存储和召回限制的同时，可以将延迟减少2.1到8.3倍，显著提高了检索性能。
PDFa day ago
面向社会公益项目的人工智能自动化问题界定
本研究解决了社会公益人工智能（AI4SG）项目中的问题界定过程效率低下的问题，特别是缺乏具备技术和领域专业知识的人才。我们提出了一种名为问题界定代理（PSA）的方法，该方法利用大型语言模型生成基于科学文献和现实知识的全面项目提案，结果表明，
PDFa day ago
面向人工智能驱动的警务：来自警察佩戴摄像机录像的跨学科知识发现
本研究针对警察佩戴摄像机录像的分析，提出了一种新的跨学科框架，填补了现有研究在警务与人工智能结合领域的空白。通过整合视频、音频和自然语言处理等多模态数据分析技术，该研究识别出了警务人员与平民互动中的关键行为动态，具有重要的实际应用价值。
PDFa day ago
企业AI集成的简化和安全MCP网关
本研究解决了企业在集成AI代理时面临的安全性不足问题。论文提出了一种MCP网关架构，结合安全原则和简化的自托管集成策略，实现了安全自托管，保护基础设施不受外部威胁。研究的重大发现在于提供了参考架构和威胁模型映射，有助于开发更安全的企业AI集
PDFa day ago
利用哨兵-2卫星影像监测农业作物上的消化物施用
本研究针对农业中外源有机物施用对土壤和作物健康影响的监测空缺，采用光学哨兵-2卫星影像评估消化物施用的效果。通过时间序列分析和机器学习模型，该研究实现了对消化物存在的高准确性检测，表明遥感与机器学习结合在精细农业和可持续发展中的潜在应用与价
PDFa day ago
在人工智能时代缓解社会认知过载：挑战与方向
本研究聚焦于人工智能时代信息泛滥与复杂性带来的社会认知过载问题，强调这一现象对人类福祉及社会韧性的重要性。论文提出，通过重新审视AI安全辩论，强调认知过载作为人类与AI对齐的关键因素，并探讨应对这一挑战的制度适应、研究方向及政策考量，以指引
PDFa day ago
实时模仿人类头部动作、眨眼和情感的Nao机器人：闭环方法
本研究针对人机交互中的一个关键问题，提出了一种新颖的方法，使Nao机器人能够实时模仿人类的头部动作、眨眼和情感表达。利用MediaPipe和DeepFace的强大能力，研究展示了如何通过闭环反馈系统提高头部动作的精确性，尤其是对自闭症儿童的
PDFa day ago
TD-EVAL：通过结合轮次级精确度与对话级比较重新审视任务导向对话评估
本研究针对任务导向对话系统的评估方法不足的问题，提出了TD-EVAL框架，结合了细粒度的轮次级分析和整体对话级比较。研究表明，TD-EVAL能够有效识别传统评估方法难以捕捉的对话错误，并且在与人类评判的一致性上优于传统和基于大型语言模型的评
PDFa day ago
如何促进群体生活的美好
本研究探讨群体福祉的本体论空间，提出了一个在本体工程背景下表示集体福利、群体功能和长期贡献的框架。通过改进和扩展反事实福祉理论，论文提供了一种模型评估群体兴盛，强调群体的功能性和历史影响，从而推动了对群体福利和社会机构的结构化推理。
PDFa day ago
通过整合趋势和波动与注意力机制来增强短期交通预测
本研究解决了在交通流预测中长期趋势与短期波动之间相互作用所带来的挑战。提出了一种混合深度学习框架，通过并行处理两个输入特征，结合长期趋势和短期波动信息，并应用Bahdanau注意力机制以增强关键时间步的关注，从而显著提高模型预测交通拥堵等瞬
PDFa day ago
保障自主人工智能：生成型人工智能代理的全面威胁模型与缓解框架
本研究聚焦于生成型人工智能（GenAI）代理在企业环境中带来的独特安全挑战，填补了传统系统未能解决的新兴威胁空白。文章提出了一种专门针对GenAI代理的全面威胁模型，并识别了9种主要威胁，强调了代理的自主性、持久记忆、复杂推理及工具集成所带
PDFa day ago
保护生成性人工智能多智能体系统免受工具占用攻击：一种零信任注册基础的方法
本研究针对生成性人工智能多智能体系统中的工具占用攻击这一安全挑战，提出了一种基于零信任的工具注册系统，以提高安全性。该系统采用中心化的工具发现和动态信任评分机制，有效防止工具占用，从而为多智能体系统在生产环境中的安全工具集成奠定基础。
PDFa day ago
利用进化智能系统捕捉ATTAS飞机的气动特性
本文针对精确建模气动系数这一关键问题，提出了一种新颖的进化型二次量子模糊神经网络（eT2QFNN）模型来描述ATTAS飞机的气动特性。研究表明，与传统模型相比，eT2QFNN在处理不确定性和数据噪声方面表现出更强的鲁棒性，且在较少规则的情况
PDFa day ago
概率与因果可满足性：约束模型
本研究解决了概率和因果推理中的可满足性问题的复杂性，填补了在不同模型约束下的理论空白。通过固定结构因果模型的图形结构，以及引入小模型研究，本论文揭示了可满足性在不同设置下的复杂性特征，尤其是在紧凑边际化条件下。研究结果对理解可满足性复杂性及
PDFa day ago
大规模动态任务分配的自动决策
该研究解决了动态任务分配问题（DTAP）在资源与任务实时匹配中的不足，尤其是面对真实场景时的挑战。论文提出了一种基于深度强化学习的决策支持系统，利用图结构和有效的奖励函数，使代理能够学习高效且可推广的任务分配策略。实验结果表明，所提出的方法
PDFa day ago
通过多模态视觉-时间转换器和生成性人工智能增强外科文档记录
本研究解决了外科视频自动摘要的需求，旨在改善手术文档记录、支持外科培训并促进术后分析。提出了一种多模态框架，结合计算机视觉与大型语言模型，生成全面的视频摘要，并在CholecT50数据集上表现出色，显示出其在外科报告中的潜在影响。
PDFa day ago
人工智能代理能否设计和实施药物发现流程？
本研究聚焦于人工智能在药物发现中的应用，尤其是使用大型语言模型的自主代理系统的潜力。论文提出了DO Challenge这一基准测试，旨在评估AI代理在复杂药物筛选场景中的决策能力，并展示了Deep Thought多代理系统在该测试中的优异表
PDFa day ago