Acceleron: 加速研究构想的工具
提出了一种基于大型语言模型的研究思路写作代理 ——ResearchAgent,它在科学文献的基础上自动生成问题、方法和实验设计,并通过连接学术图谱中的信息和从基于实体为中心的知识库中提取的实体进行逐步改进。此外,通过与多个 ReviewingAgents 进行反复讨论和反馈来借鉴人类改善思路的方式,还利用与人类偏好一致的大型语言模型为评估提供标准。在多个学科的科技出版物上实验证明了 ResearchAgent 的有效性,通过人工和模型评估结果生成了新颖、明确和有效的研究思路。
Apr, 2024
这篇论文探讨了如何通过将大型语言模型(LLMs)与流行的学术写作工具 Overleaf 集成,以提高学术写作的效率和质量,并提出了 OverleafCopilot 工具作为海量语言模型和 Overleaf 的第一次无缝集成,从而使研究人员能够在撰写论文时充分利用语言模型的强大功能,通过有效的桥接方案、高质量 PromptGenius 网站以及可定制的代理指令系统来帮助研究人员快速构建自己的个性化代理,旨在改革学术写作实践,使研究人员在更短的时间内生成更高质量的论文。
Mar, 2024
本研究介绍了一种利用 BERT 模型开发 AI 代理程序,结合人类团队设计全球发展证据综合产品的方法,探讨了活性学习策略的影响,结果表明,将 BERT-based AI 代理程序纳入人类团队可以降低人类筛选工作量 68.5%,而采用高优先级 (HP) 策略的活性学习方法可以进一步减少 78.3%。
May, 2023
研究探讨使用增强的集体智能的应用,结合人类和大型语言模型在协同创意中的表现,进一步介绍了一个名为 Polis 的实时集合工具,并总结出三个挑战以期设计并完成实验。
Mar, 2023
通过在 LLMs 中引入可扩展的工具集,将研究重点从追求全知问题解决者转变为专业的工具使用者,以增加科学推理对于 LLMs 的可行性,并构建了一个名为 MathFunc 的涵盖了超过 30,000 个样本和约 6,000 个工具的工具增强训练语料库,在此基础上开发了 SciAgent 用于科学问题的工具检索、理解和使用,并构建了跨越五个科学领域的基准测试 SciToolBench 来评估 LLMs 在工具协助下的能力,通过 SciToolBench 上的大量实验证实了 SciAgent 的有效性,特别是 SciAgent-Mistral-7B 在绝对准确率上比同样大小的其他 LLMs 高出 13% 以上,此外,SciAgent-DeepMath-7B 的性能远远优于 ChatGPT。
Feb, 2024
我们提出了《Algorithm of Thoughts》,这是一种新的通过算法推动大型语言模型的算法推理路径的策略,以在上下文学习中扩展其思路探索,并超越了早期单查询方法和最近的多查询策略。
Aug, 2023
本文介绍了一种名为 PaperRobot 的自动研究助手系统,它通过构建全面的背景知识图谱、预测新的创意链接、以及基于记忆 - 注意力网络来生成新论文的关键要素,从而实现对大规模人类写作论文的深入理解,并通过图注意力和上下文文本注意力进行多角度分析和生成。经过图灵测试,PaperRobot 的生成摘要、结论和未来工作部分以及新标题被选择的概率分别高达 30%,24%和 12%以上,超过了人工写作的水平。
May, 2019
通过对包含 400 万多个专利文本中的概念的大规模技术语义网络进行统计分析,我们发现了概念创新速度持续减缓和新概念原创性下降的证据。这些趋势可能归因于人类智慧在超越前沿技术空间方面的局限性。为了维持创新,我们建议开发和实施具有创造功能的人工智能,以增强创新过程的各个方面,包括学习、创作和评估。
Mar, 2023