- CS-Bench: 大型语言模型的全面基准,助力计算机科学掌握
计算机科学(CS)是人类智能复杂性的证明,深刻推动了人工智能和现代社会的发展。我们引入 CS-Bench,这是第一个专门用于评估 LLM 在计算机科学领域性能的双语(中英文)基准,包括大约 5K 个精心策划的测试样本,涵盖计算机科学的 4 - GuideWalk:增强学习的异构数据融合 —— 多类文档分类案例
通过基于有意义的句子的图结构的嵌入方法,在大规模异构数据中高效提取信息,特别是文本数据的处理和分类问题中,展示出与其他算法相比显着更好的分类性能。
- ChatGPT 是否正在改变学术写作风格?
通过对从 2018 年 5 月到 2024 年 1 月提交的 100 万篇 arXiv 论文进行统计分析,我们评估了 ChatGPT 在其摘要中的文本密度,通过词频变化的统计分析。我们的模型在真实摘要和 ChatGPT 修改后的摘要(模拟数 - MM科学出版的未来:自动文章生成
介绍了一种利用大型语言模型的新软件工具,旨在自动从 Python 代码生成学术文章,这对生物医学信息学和计算机科学领域具有重要意义,可大大提高研究传播效率。
- 可微分编程的要素
通过大规模模型、海量数据集、加速硬件和可微分编程的变革力量,人工智能最近取得了显著进展。不仅可以以端到端的方式对复杂计算机程序进行微分,还可以优化程序参数。可微分编程建立在自动微分、图模型、优化和统计学等多个计算机科学和应用数学领域的基础上 - PST-Bench: 追踪和评估出版物的来源
本文研究了论文来源追踪的问题,并构建了计算机科学领域中高质量且不断增长的数据集 PST-Bench,通过 PST-Bench 揭示了不同主题之间不同的演化模式,并探讨了该领域的潜在方向。
- 逐流注意力的可解释 Transformer 模型用于通勤流预测
通过引入 TransFlower,一种可解释的、基于 Transformer 的模型,使用流量 - 流量注意力来预测城市通勤模式,我们的研究在运动力学方面取得了 30.8% 的改进,为城市规划和政策决策提供了重要的移动动态洞察。
- EMNLP整合性调查心理健康对话智能体以构建计算机科学与医学观点的桥梁
通过 PRISMA 框架综合文献综述,研究了 534 篇计算机科学和医学领域发表的关于建立与心理健康相关的对话代理的论文,发现了 136 篇重要论文,重点关注对话建模和实验设计技术的多样特征,建议以透明度、伦理和文化异质性为基础,实现心理健 - 物理、数学和计算机科学之间的跨学科互动建模
本论文通过对物理学、数学和计算机科学三个领域的引用流进行建模,并通过时间桶签名对这三个领域之间的引用互动进行量化。基于最近提出的中继链接框架的变体,本文提出了数值模型,试图解开这三个领域之间引用链接形成的基本原理。
- 机器学习应用于有形效果:揭示非法按摩行业的自然语言处理和触觉感知的计算机视觉
该论文通过使用计算机科学、计算机视觉和自然语言处理等技术探讨了如何利用计算机科学打击人口贩卖和如何利用计算机视觉实现触觉感应。其中包括使用自然语言处理技术监测美国非法按摩行业,以及创造触觉传感器和低成本六轴力矩传感器的方法和设计文件。
- 计算机科学 arXiv 上的预印本有多少被实际打印了,以及为什么
计算机科学领域的预印本在 arXiv 上发布后,通过引入基于语义的映射方法(使用了 BERT),我们发现所调研的预印本中的 66%发表时标题未变且 11%具有改变标题和其他修改。进一步的比较研究揭示了在计算机科学领域中,被发表的预印本具有充 - 计算机科学研究的映射:趋势、影响与预测
本文通过分析计算机科学领域当前热门的研究领域,探讨了导致这些研究领域出现的因素。利用包括论文、引用和资助信息在内的综合数据集,我们采用了决策树和逻辑回归等先进的机器学习技术,预测研究领域的趋势。分析结果表明,研究论文中引用数量(引用计数)在 - 应用众包技术丰富高等教育音乐知识库
本文描述了在计算机科学高等教育课程中采用众包技术作为作业的方法和经验教训。通过音乐的相关元数据,采用一种支持文化遗产领域众包的平台并使用语义网技术分析了众包结果。结果为机器学习模型提供了一个公开可用的标注数据集,并且在线调查的反馈得出了将众 - 广泛使用的面向对象编程语言的比较分析
本文提出了一个全面的框架来评估广泛使用的面向对象语言,这些语言基于其技术和环境特征进行评估。
- 机器学习和深度学习模型在多画家识别中的协同作用
这篇论文研究了利用人工智能和神经网络技术实现数字化艺术作品的分类和管理,以及通过使用迁移学习和机器学习方法实现画家的自动识别和分类,实现了 85% 的分类准确率。
- 从笔触到像素:AI 创作艺术中深度神经网络综述
本文探讨了 AI 生成艺术领域,深入研究了用于创造艺术的各种深度神经网络体系结构和模型,包括传统的卷积网络和最前沿的扩散模型,并且实例展示了这一领域的关键成果,总结了这些模型的优缺点,探讨了目前深度神经网络在短时间内所取得的显著进展,展现了 - 语言认知与语言计算 —— 人类和机器的语言理解
语言理解是认知科学和计算机科学领域的关键科学问题。本文比较了认知科学和计算机科学在语言理解方面的不同研究问题和方法,并探讨如何将两个领域的洞见结合起来,为构建智能语言模型和研究语言认知机制提供新的启示和展望。
- 第二届逻辑与编程实践研讨会论文集 (LPOP)
本文介绍了第二届逻辑与程序设计工作坊(Logic and Practice of Programming,LPOP)的论文摘要和立场论文,旨在作为计算机科学中使用逻辑作为实用工具的不同领域之间的桥梁,利用形式逻辑的公共语言交换思想。
- 生物机器人:一个新兴跨学科领域的视角
探讨生物机器人的概念在材料科学、信息科学和生命科学等之间的变化和交叉,以及生物学、计算机科学和机器人学的交叉研究可能带来的多尺度控制、自组装和形态与功能之间关系的问题。
- 高维空间中状态跟踪和参数估计的因子条件滤波
本文介绍了分解条件过滤器的新型滤波算法,用于同时跟踪状态和估计高维状态空间中的参数,是一种用于计算机科学、工程和地球物理过滤应用的有效工具。