- 医学成像负责任基础模型的伦理框架
医学影像领域的基础模型(FM)具有巨大潜力,但在临床实践中的部署需要广泛的道德考虑。本文旨在强调与基础模型相关的道德问题,并提出一个框架来指导其在医学中的负责任发展和实施。我们仔细研究了诸如患者数据隐私、偏见缓解、算法透明度、可解释性和问责 - 重构心身形象:将形式系统应用于心与物质的关系
本文旨在通过使用集合论和范畴论的基本形式理论,展示一个简单的框架,以澄清和指导我们关于心智与物质关系的理论。
- 推进人工智能安全的人工智能系统评估框架:术语、分类、生命周期映射
该研究提出了一个 AI 系统评估的框架,包括协调术语、鉴定要素和建立映射,以促进跨学科的合作和综合评估。
- Evalverse:大规模语言模型评估的统一和可访问库
Evalverse 是一个集成多个分散评估工具为一体的新型库,通过与 Slack 等通信平台的集成,使了解人工智能知识有限的个人能够轻松请求和接收详细报告,因此,Evalverse 成为一个综合评估工具,为研究人员和从业人员提供了一个集中和 - 超越一刀切:多领域、多任务的嵌入模型选择框架
提出了一个系统化的方法,以帮助选择最有效的嵌入模型进行自然语言处理(NLP)任务的开发框架,解决了专有和开源编码器模型的泛滥所带来的挑战。
- GPTA:用于与 LLM 协同增强下游神经网络的生成提示调整助手
GPTA 是一个通过预设前缀加强下游任务模型的训练的大型语言模型辅助训练框架,通过最小化对 LLM 的数据暴露,解决了在下游任务模型训练中应用 LLM 所面临的安全和法律挑战。GPTA 采用了一种新的协同训练方法,通过参数梯度优化下游模型和 - 探索中文大型语言模型的隐私保护能力
我们设计了一个三层渐进式框架,用于评估语言系统的隐私,以解决大型语言模型在隐私保护方面的问题。观察结果显示,现有的汉语大型语言模型普遍存在隐私保护方面的缺陷,可能在基于这些模型的应用中带来相应的隐私风险。
- COLINGLexDrafter: 用检索增强生成技术为立法文书进行术语起草
通过提供现有定义和基于文档上下文定义新术语的框架,LexDrafter 框架在起草立法文件时支持协调一致的法律定义,避免歧义。
- ACLFundus: 简单易用的高质量新闻爬取器
该论文介绍了 Fundus,一种用户友好的新闻爬取工具,用户只需几行代码即可获取数百万篇高质量的新闻文章。与现有的新闻爬取工具不同,我们使用手工制作的定制内容抽取器,专门适应每个支持的在线报纸的格式指南,从而优化我们的爬取质量,以获取完整且 - 导航公正:AI/ML 发展中从业人员的理解、挑战与策略
AI 实践者对 AI/ML 的公平性的理解、挑战、后果和策略以及进一步研究领域的识别,为确保 AI/ML 的公平性提供了宝贵的真实世界视角。
- 可信 AI 之旅 - 第一部分:实用框架的追求
本研究综述了值得信赖的人工智能(TAI)及其各种定义,提出了离开支配和工程语境中的责任或伦理人工智能等术语以明确任何混淆的建议,并强调了公平性、偏见、风险、安全性、可解释性和可靠性等关键属性和特性以发展一个普遍框架来处理这些问题,同时考虑了 - COLING何时使用 “更多语境” 有助于辨别嘲讽?
通过整合多种上下文,本研究探索了现有方法在讽刺识别中的改进,并在三个讽刺识别基准测试中取得了最先进的性能,并展示了添加更多上下文的好处,同时也指出使用更多上下文可能引入社会偏见的固有缺点。
- 多视图自编码器教程
本篇论文针对多模态建模提出了一个统一的数学框架,同时扩展了 exttt {multi-view-AE} 库的文档和功能,通过基准实验评估实现的性能,并作为该领域的教育资源,旨在建立多模态建模的一致基础。
- 一致性调节的视频生成
通过四个模块的新型框架生成高质量的视频,并且能够优化每帧视频中的背景和前景的一致性。
- 一个用于心理健康中大型语言模型的新颖细致对话评估框架
我们提出了一个新颖的框架来评估大型语言模型(LLMs)的细致对话能力,将其应用于心理健康领域,并发现 GPT4 Turbo 在特定主题上表现出与经过验证的治疗师高度相关的成绩,从而帮助研究人员开发更好的 LLMs 以更积极地支持人们的生活。
- 通过合作和互动代理学习使用工具
利用工具学习来增强大型语言模型作为代理人使用外部工具来扩展其能力。我们提出了合作互动的代理人(ConAgents)框架,将工具学习的工作流程模块化为基础,执行和观察代理人,并引入迭代校准(IterCali)方法,以适应工具环境的反馈。实验证 - DISORF:一个分布式在线 NeRF 训练和渲染框架,用于移动机器人
我们提出了一种名为 DISORF 的框架,用于实现资源有限的移动机器人和边缘设备捕捉场景的在线三维重建和可视化。该框架能够解决边缘设备计算能力有限和网络可用性不足的问题,并利用设备上的 SLAM 系统生成位姿关键帧,通过远程服务器在运行时利 - 用于稳健评估推理性能和推理差距的功能基准
我们提出了一个用于鲁棒评估语言模型推理能力的框架,使用功能变体基准。在静态问题版本与功能变体快照之间,解决推理测试的模型在性能上不应有差异。我们将 MATH 基准的相关片段重写为其功能变体 MATH (),其他基准的函数化会随之进行。通过对 - 大型语言模型如何处理多语种能力?
大型语言模型在跨多种语言表现出卓越的性能。本文探讨了大型语言模型处理多语言的方式,提出了一个处理多语言输入的框架,并利用该框架验证其有效性,并展示如何通过该框架有效提升多语言能力。
- CVPRLane2Seq: 通过序列生成实现统一的车道检测
通过序列生成任务,提出了一个新的车道检测框架 Lane2Seq,它能够统一各种车道检测格式,并使用简单的交叉熵损失函数,同时还引入增强学习来提高模型的性能。实验结果显示,该简单的序列生成范式不仅能够统一车道检测,还在两个基准数据集上取得了竞