BriefGPT.xyz
大模型
Ask
alpha
关键词
data quality control
搜索结果 - 4
ICLR
增强基础模型联邦微调中的数据质量
当前基础模型训练的情况表明,公共领域数据已接近枯竭,因此需要在多个专门化和高质量的私有领域数据源之间加强合作。为了解决本地训练模型而不共享私有数据所带来的质量控制问题,我们提出了一个针对基础模型的联邦微调的数据质量控制流程。该流程通过计算反
→
PDF
4 months ago
ICML
合成孤独:探索用于语法纠错的合成数据的负面影响
本文研究数据质量控制(噪声注入和平衡数据)对基于真实数据和合成数据训练的语法纠错模型的影响,并比较了两种方法的效果,结果表明,与真实数据情况相同,数据质量控制方法对真实数据训练的模型有积极影响,而对合成数据训练的模型影响为负。
PDF
a year ago
ANALOGYKB:使用百万级知识库开启语言模型的类比推理
提出了一个基于知识图谱的百万级类比知识库 ANALOGYKB,能够发现两种类型的类比,成功地让模型在类比推理任务中超越了之前最先进的方法。
PDF
a year ago
AAAI
现实世界中的不良内容检测的整体方法
我们提出了一种整体方法来构建一个强大和有用的自然语言分类系统,以进行真实世界的内容审核,该系统的成功依赖于一系列精心设计和执行的步骤,包括内容分类法的设计和标注指令,数据质量控制,捕捉罕见事件的主动学习管道以及各种方法,以使模型具有稳健性并
→
PDF
2 years ago
Prev
Next