BriefGPT.xyz
Ask
alpha
关键词
human in the loop
搜索结果 - 3
人机交互中大型语言模型对心理理论的能力:一种幻象?
通过研究大型语言模型在人机交互中的应用,本文探讨了理解机器生成行为的能力,特别是在承认他人心理状态方面,发现大型语言模型缺乏对无关紧要或微小变化的不变性。
PDF
6 months ago
AAAI
利用未标记的数据进行高效反馈的基于人类偏好的强化学习
本文提出了两个损失函数,利用未标记的轨迹集参与奖励学习过程,并结构化奖励模型的嵌入空间以反映状态空间与操作距离之间的结构,旨在提高样本效率和奖励恢复能力,该方法在基于机械臂操作的领域上比当前的最优算法 PEBBLE 表现更好。
PDF
a year ago
NIPS
通过有效主动学习和人在环节中提高电话会话中的命名实体识别
本文介绍了一种采用人类辅助学习的主动学习框架,以识别更有可能包含注释错误的数据样本进行重新注释,从而显著提高特定实体类型的 F1 分数。该方法只需对整个数据集的约 6% 的训练实例进行重新注释即可取得良好效果。
PDF
2 years ago
Prev
Next