- 一种简单、稳定、可复现的桥牌竞标人工智能基线
合作博弈、人工智能和桥牌叫牌技术的研究。通过组合现有方法,作者提出了一个简洁但有效的方法,在合作桥牌叫牌中表现出色,并开源了代码和模型,为未来的桥牌人工智能研究提供了基础。
- 计算广义卡方分布的新方法
我们提出了几种精确和近似的数学方法和开源软件来计算广义卡方分布的累积分布函数、概率密度函数和反函数累积分布函数,该分布在贝叶斯分类问题中出现。我们比较了这些方法与现有最佳方法之间的准确性和速度。
- Qadence:数字模拟程序的可微分接口
数字 - 模拟量量子计算(DAQC)是一种将数字单量子比特门与作用于相互作用量子比特寄存器的全局模拟量操作相结合的通用量子计算的替代范式。本文介绍了 Pasqal 开发的用于构建复杂的数字 - 模拟量子程序的高级编程接口 Qadence,通 - DocGen: 在 Python 中生成详细的参数文档字符串
文档义务阻碍了开源软件的有效利用。为了解决单一生成模型无法可靠产生详细函数参数的问题,我们提出了一种多步骤的方法,结合多个任务特定模型,每个模型都能产生 docstring 的特定部分,这些模型的组合确保了最终 docstring 中每个部 - 大规模时间序列的预测:基于特征的方法
在经济学及其他预测领域中,现实世界问题过于复杂,难以用单一模型假设一种具体的数据生成过程。两种基于时间序列特征的方法:基于特征的模型选择和基于特征的模型组合,对于预测大量时间序列时,各种方法的预测性能随时间序列的性质发生变化。本章讨论了最先 - Njobvu-AI:一个用于协作图像标注和计算机视觉模型实现的开源工具
Njobvu-AI 是一个开源工具,用于标记和组合训练数据、训练自定义算法和实施新的计算机视觉模型。
- Synthcity:促进不同数据模态中合成数据的创新应用案例
Synthcity 是一种用于机器学习公平性、隐私和数据增强的开源软件包,支持各种数据模态,包括静态数据、正常和非正常时间序列、带有审核的数据、多源数据和复合数据,并提供可持续的工具和研究,是一个快速实验和原型设计的巨大场所。
- VulCurator: 漏洞修复提交检测器
该研究提出了一种使用深度学习技术,基于源代码修改、提交信息和问题报告等更丰富的信息来自动检测漏洞修复提交的工具 VulCurator,并且在 F1 得分方面优于现有的基准方法高达 16.1%。
- HeRo 2.0:一种用于群体机器人研究的低成本机器人
本文介绍了一个新的低成本机器人平台,用于群体机器人应用,具有 3D 打印机身和开源软件,与 ROS(机器人操作系统)深度集成,并执行了实验以评估其功能和适用性。实验结果表明,该平台非常适合群体机器人的研究和教育。
- 通过主动学习提高文本分类中的概率模型
提出了一种将概率模型和主动学习结合起来的新算法,用于降低自动化文本分类的标注成本,实现对未标注数据和难分类文档的集中标注,性能可与最先进的方法相媲美,使用原有标注数据比最近发布的两篇研究中仅用一小部分标注数据得出的结论相同,并提供了 act - 基于 RaspberryPi 和 PiEEG 的脑机接口控制机器人
本文提出了基于 Raspberry Pi 单板计算机的开源软件和开发的扩展板,用于读取和分解 EEG 信号,并举例使用这些信号控制 LED 和玩具机器人。最后讨论了近未来大脑 - 计算机接口的前景和使用实时 EEG 信号控制外部机械物体的各 - EMNLP本地 CPU 上运行的极速翻译
为了给予用户控制并展现速度,我们研发了一款名为 translateLocally 的开源翻译软件,可在桌面和笔记本电脑上运行。即使在 10 年前的硬件设备上,translateLocally 实现了类似云端的翻译速度和质量,而且适用于 Li - ACL基于代码更改的自然语言注释更新学习
本文提出一种通过学习不同的自然语言表征和代码表征之间的关系,生成一系列编辑操作来更新现有自然语言注释的方法,并在开源软件项目集合上进行多个实验和对比,结果表明该模型性能优于其他算法。
- DS3: 一种面向系统级领域特定片上系统仿真框架
通过开发系统级领域特定 SoC 仿真框架,具有加速常用核心的处理元素并实现动态资源管理,促进异构 SoC 的利用,优化功率性能。该框架的优化潜能得以释放,可广泛应用于无线通讯和雷达处理等多个领域,并以开源软件的方式分享,激发相关领域的研究。
- 带有有界用户贡献的差分隐私 SQL
本文提出了一种通用可扩展的方法,用于在数据库上执行差分隐私聚合,即使个体可以与任意多个行关联,将其表达为关系代数操作符并在 SQL 引擎中实现,测试了 typial queries 在工业基准测试上的效用,并通过随机测试框架验证其正确性,描 - 一个手动维护的开源软件漏洞修复数据集
通过运用漏洞评估工具,我们从国家漏洞数据库和专为开发监测的 Web 资源中手动收集并精选了一批开源软件漏洞的数据集,共映射到 205 个不同的开源 Java 项目中的 624 个漏洞, 并且可通过支持脚本自动检索相应的存储库的实际内容,并补 - 基于效用的模式挖掘综述
该综述论文旨在提供一种对效用矿山(UPM)的综合和有结构的概述,包括其概念,方法和现有的高效用模式,采用的技术和算法等,同时考虑其高影响应用的实际挑战和开放问题。
- 为文件存储服务透明压缩数百 PB 级别的图像文件的系统设计、实现和部署
Lepton 是一个开源的容错系统,它用算术编码替换了 JPEG 压缩的最底层 —— 霍夫曼码,使得原始 JPEG 文件的确切字节可以快速恢复,并且可以流式解码。它在压缩效率方面与最优先前的作品相匹配,而且解码速度更快九倍以上。
- ATR4S: Scala 中具有最先进的自动术语识别方法的工具包
本研究提出了一种名为 ATR4S 的开源软件,涵盖 15 种自动术语识别(ATR)方法,并实现从文本预处理到术语候选人收集,评分和排名的整个流程,与其他可用的 ATR 工具相比,ATR4S 具有更好的平均精度,并可高度可扩展,模块化和可配置 - BUbiNG:面向大众的大规模网络爬取
描述了我们的下一代网络爬虫 BUbiNG,BUbiNG 是一个基于 Java 的开源分布式网络爬虫,使用大型硬件可以遵循严格的礼貌规则爬取每秒数千个页面,分布式任务分配基于现代高速协议以实现非常高的吞吐量。