BriefGPT.xyz
Ask
alpha
关键词
learning frameworks
搜索结果 - 3
一种基于人工比较的概率对齐方法
探究人类比较对传统监督微调过程的改善条件,提出一种连接机器学习和人类反馈的两阶段框架,并利用概率二分法通过学习低维表示和使用人类比较来改善模型对齐,进而减少样本复杂度,实验证明该框架在降噪数据和高维模型中的优势。
PDF
4 months ago
IJCAI
利用人类指导提升深度强化学习任务
本文综述了五个最近的学习框架,这些框架主要依赖人类指导,而不是传统的一步一步的动作演示,评估了每个框架的动机、假设和实现,并讨论了可能的未来研究方向。
PDF
5 years ago
物联网通信的学习:有限资源和异构性
本文介绍了适用于物联网应用的多种学习框架,分别研究了机器学习、顺序学习和强化学习的优缺点、适用性及关键结果,并引入基于认知层次理论的新框架来处理物联网的异构性和资源限制,最终展示了在物联网中使用认知层次理论的关键结果。
PDF
8 years ago
Prev
Next