- FlashRAG: 一个高效的检索增强生成研究的模块化工具包
我们提出了 FlashRAG,一个高效且模块化的开源工具包,旨在帮助研究人员在一个统一的框架内复现现有的 Retrieval Augmented Generation 方法,并开发自己的方法。工具包实现了 12 种先进的 RAG 方法,并收 - NeMo-Aligner:高效模型对齐的可扩展工具包
用于大规模语言模型对齐的 NeMo-Aligner 工具包可以高效地扩展到使用数百个 GPU 进行训练,支持 Reinforcement Learning from Human Feedback (RLHF)、Direct Preferen - LitLLM: 科学文献综述工具包
利用大型语言模型(LLM)的检索增强生成(RAG)原理和专门的提示与指示技术,我们提出了一个工具包来减少文献综述的时间和工作量,建立了我们的工具包作为一种高效的替代方法。
- OpenICL: 一种面向上下文学习的开源框架
介绍了 OpenICL 工具包,旨在提高 In-context Learning 和大型语言模型的评估,是一种灵活的架构,用户可以根据需要轻松组合不同的组件。 OpenICL 在分类,QA,机器翻译和语义解析等 NLP 任务上验证了其有效性 - ExtremeBERT:定制 BERT 预训练加速的工具包
本文介绍了 ExtremeBERT,一款用于加速和定制 BERT 预训练的工具包,旨在为研究界和工业界提供易于使用的 BERT 预训练工具包,以便使用有限资源在自定义数据集上训练流行语言模型。实验表明,与原始 BERT 论文相比,使用我们的 - SAMP:自适应混合精度模型推理工具包
本文提出了一种自适应混合精度 (SAMP) 工具包来控制量化率,以平衡效率和性能,可以轻松量化模型进行推理。实验结果表明,SAMP 工具包的加速比优于 PyTorch 和 FasterTransformer,同时保证所需性能。此外,SAMP - NECE:叙事事件链提取工具
NECE 工具包是一款自动提取和对齐时间排序的叙事事件工具,具有人工校对验证和应用潜力,可用于问题回答和偏见分析。
- MMHuSpaCy:一种工业级匈牙利自然语言处理工具包
本篇论文介绍了 HuSpaCy,这是一个针对匈牙利语的工业级自然语言处理工具包,包括词干提取、形态句法分析、实体识别和词嵌入等组件,并以 spaCy 的 NLP 组件为基础构建,能够高效而准确地完成文本处理任务。
- OpenPrompt:一个面向 Prompt 学习的开源框架
本研究提出了一个名为 OpenPrompt 的工具包,可以针对预训练的语言模型进行提示学习,具有高效性、模块化和可扩展性,使用户能够快速部署提示学习框架并在不同的 NLP 任务上进行评估。
- 用 Emukit 仿真物理过程
本文介绍了 Emukit—— 一个高度可适应的 Python 工具包,可用于丰富不确定情况下的决策制定,包括贝叶斯优化、多保真度模拟、实验设计、贝叶斯积分和灵敏度分析等领域的研究,同时用户可以轻松地为新问题原型化新的决策制定方法。
- EMNLPSummerTime: 面向非专家的文本摘要工具包
SummerTime 是一个用于文本摘要的完整工具包,包括各种模型,数据集和评估指标,可与 NLP 研究人员设计的库集成,并提供易于使用的 API,以定位和搜索自己数据中最佳模型,并可视化不同,同时提供解释以帮助用户了解模型的行为并选择最适 - PaddleSeg: 图像分割高效开发工具包
介绍了一个用于图像分割的高效开发工具包 PaddleSeg,并展示了基于该工具包训练出的分割模型在精度等方面的竞争力。
- ACLNeurST:神经语音翻译工具包
NeurST 是一个面向 NLP 研究人员的开源神经语音翻译工具包,主要侧重于端到端语音翻译,并提供特征提取、数据预处理、分布式训练和评估的逐步指南,旨在为该领域建立可靠的基准,并持续更新其性能。
- SimulEval:一款用于同时翻译评估的工具包
SimulEval 是一个易于使用、面向同时文本和语音翻译的通用评估工具包,通过客户端执行自定义策略实现同时解码,自动执行同时解码并收集几个流行的延迟度量。
- 使用单个(稳健的)分类器进行图像合成
研究人员通过开发鲁棒分类框架展示了在图像合成中应用分类器的实用性,并通过对分类器进行对抗性训练,实现了对输入显著特征的直接操作。
- ACLTexar: 一款模块化、通用、可扩展的文本生成工具包
Texar 是一个开源工具包,支持广泛的文本生成任务,旨在将任何输入转化为自然语言,包括机器翻译、摘要、对话、内容操作等。它以模块化、通用性和可扩展性为设计目标,提取了不同任务和方法学的共同模式,创建了高度可重用模块的库,并允许任意模型架构 - NIPSDex: 深度强化学习复杂环境下的增量学习
介绍了针对连续学习方法培训和评估的 DEX 强化学习环境工具包以及增量学习方法的巧妙应用,该方法可以通过从解决类似的较简单的环境中学习的最佳重量初始化来解决挑战性环境,并通过提供十种 DEX 环境的强大基线方法表明增量学习可以产生远远优于标