- 以需求驱动的方式理解生成音频人工智能
本文通过对专业音频工程师的调查,确定研究优先事项和定义各种研究任务,总结了当前音频质量和可控性方面的挑战,并强调了数据集的可用性目前是实现高质量音频生成的主要瓶颈。最后,我们根据经验证据提出了解决一些问题的潜在解决方案。
- 基础模型与联邦学习的相遇:动机、挑战和未来方向
本文探讨了基础模型和联邦学习之间的相互作用,旨在深化其协同作用的理解并挖掘这两个领域的潜力,鼓励未来的研究方向,以进一步提高隐私保护和可伸缩性的人工智能系统的发展。
- GitHub 上的开放数据:发掘人工智能潜力
本研究分析了 GitHub 平台上的开放数据格局及用户分享数据集的模式,并披露了 GitHub 是世界上最大的开放数据主机之一,研究还公开发布了三个数据集以支持分析。该平台的数据资源对于加速 AI 研究尤为重要。
- VISHIEN-MAAT:滚动讲述可视化设计,用于向非技术用户解释连体神经网络概念
本论文提出了一种新型可视化设计,通过使用 scrollytelling 方法来为非技术用户有效地解释人工智能概念,研究结果表明,与在线文章等传统材料相比,使用我们提出的新型设计可提高非技术用户的感知和机器学习概念知识获取。
- ChatGPT Asks, BLIP-2 Answers: 自动提问,为丰富的视觉描述添砖加瓦
本文介绍一种在图像字幕生成中使用的新型自动提问方法 ChatCaptioner,利用 Prompt 和 BLIP-2 的答案获取新的视觉信息,并比较了 ChatCaptioner 和 BLIP-2 以及真实情况下的结果,结果表明 ChatC - AAAI多模态宣传处理
该论文探讨了通过 AI 处理多模态的宣传内容的方法,以分析并影响公众舆论,让机器更接近人类的理解水平。
- 随机性的无限
本文从随机性的定义出发,从应用的角度分析随机算法的结果,探讨了随机性的源和性质,发现了无限和随机性之间的关系,并从系统交互的角度总结了随机性的属性,即由随机生成的序列组成的集合具有渐进完备性质,最后强调了随机性在人工智能研究中的重要性。
- AI 大语言模型理解问题之争
研究人工智能中对大规模预训练语言模型是否在任何重要意义上可以称为 “理解” 语言,以及对应的关键问题和新的智能领域的发展。提出一种新的智能科学来提供关于知识的不同模式,以及它们的优势和限制,以及融合不同形式认知的挑战的见解。
- IndicSUPERB:印度语言语音处理通用性能基准
该篇论文主要介绍了自然语言理解和语音语言理解中使用的 GLUE 数据集和 SUPERB 基准集,同时提供了 IndicSUPERB 基准集,为印度语音语言理解模型的开发做出贡献。该论文探讨了使用自我监督模型在各种印度语言中进行的训练和评估, - Atomist 还是 Holistic? 诊断及愿景为更有成效的跨学科 AI 伦理对话
该研究讨论了 AI 研究中的伦理问题,介绍了零子派和整体主义派的核心信念和假设,并呼吁数据科学社区内的零子派和整体主义者在道德分歧中表现出更大的同理心,并提出了四个针对性的策略,以确保 AI 研究造福社会。
- 针对猜词挑战的零样本分类方法
本研究提出 Taboo 挑战赛,以培养 AI 领域的研究。我们介绍了 TabooLM,这是一种基于零射击设置的语言模型方法,可对 Taboo 挑战赛进行处理。通过与文献中的三个研究进行比较,我们得出结论,TabooLM 能够比现有方法更快、 - 探索民族志方法论、会话分析与人工智能之间的不相容性
本文探讨伦理方法论(EM)和对话分析(CA)中的主题与研究领域,以及如何在涉及人工智能(AI)研究及其相应领域的问题中遇到学科和概念上的问题和需要解决的潜在危险和机会。
- 人工智能的语言和文化内化
提出自动内在动机代理 (autotelic agents) 的 Vygotskian 模型,通过对话语言和实体环境交互学习,实现自我生成目标和内化交互成为认知工具,进而形成人工认知功能,从而推进社会化学习的人工智能研究应用前景。
- ACL视觉与语言导航:任务、方法和未来发展综述
本文综述了 Vision-and-Language Navigation(VLN)这一领域的现有研究,包括任务、评价指标、方法等,并通过结构化分析当前进展和挑战,强调了当前 VLN 的局限性和未来工作的机遇,是 VLN 研究社区的详尽参考。
- 体感人工智能综述:从模拟器到研究任务
本文对体感式人工智能领域进行了综合系统的调查和研究,包括对九个当前体感式人工智能模拟器的评估,以及对于该领域的三项研究任务,即视觉探索、视觉导航和身体问题回答的探索,并旨在为该领域模拟器和未来方向的选择提供建议。
- 利用深度强化学习进行星际争霸宏观动作选择
本研究采用基于深度强化学习的方法构建了一款名为 LastOrder 的机器人,旨在提高 StarCraft 游戏中宏观行动的选择。实验表明,LastOrder 在 AIIDE'17 StarCraft AI 比赛中排名前列,证明了该方法的有 - 无模型,有模型和通用智能
该研究回顾了人工智能研究的进展,特别是在模型自由学习和模型基础求解器之间的差距,并讨论了如何弥合这一差距以获得具有健壮性和普适性的智能系统。
- 机器学习犯罪观念的批评回应 (arXiv:1611.04135 补充)
该研究论文使用面部图像进行犯罪的自动推断,并强调 AI 研究的监管和重要性,但作者对一些媒体对研究动机和目的的错误解读感到困惑。
- TorchCraft:用于机器学习实时策略游戏研究的库
本论文介绍了 TorchCraft 库,该库可以使深度学习研究在 Real-Time Strategy (RTS) 游戏中起到更大的作用,并将 RTS 游戏作为人工智能研究的基准进行了论证,同时还描述了 TorchCraft 的设计和组成部 - 概念人工智能:来自设计理论的启示
本文提供了一个名为可感知智能的观点,讨论了一个以创造性数学为基础的 Brouwer 机器框架,并分析了在人工智能研究中常用的范例和技术与想象力建构主义的框架和理论的优缺点。