BriefGPT.xyz
Ask
alpha
关键词
dataset aggregation
搜索结果 - 4
扩散遇到 DAgger:增强视觉手眼协调模仿学习
为了解决在执行过程中模拟训练策略中的错误累积问题,本研究提出了一种不需要昂贵代价的 Diffusion Meets DAgger(DMD)方法,利用扩散模型生成能够覆盖分布外状态的样本,从而实现从少量示范中获得稳健性能,实验证明 DMD 比
→
PDF
4 months ago
基础方舟:积累和复用知识以获得卓越和稳健的性能
通过聚合多个公共数据集并从专家注释中积累知识,我们开发了 Ark 框架,在医学成像领域实现了优越且稳健的性能以及超越专有模型的表现,这拥有重要影响力,以促进开放科学并推动深度学习民主化。
PDF
9 months ago
关于 Gibbs 算法的验证:训练数据集、测试数据集及其聚合
研究了 Gibbs 算法的训练数据依赖性,使用期望经验风险作为性能衡量标准,得出了 GA 的敏感性,并研究了数据集聚合和评估 GA 泛化能力的不同指标,建立了 Jeffrey's 散度、训练和测试误差之间的联系。
PDF
a year ago
EMNLP
一种通过用户交互学习语义解析器的模仿游戏
本文介绍了一种通过用户直接学习语义解析器的 “人在循环” 方法,在此过程中,语义解析器应该自我观察其不确定性并在不确定时提示用户演示。为了解决演示稀疏性问题,提出了一种新颖的注释高效的仿真学习算法,该算法通过混合演示的状态和自信的预测来迭代
→
PDF
4 years ago
Prev
Next