BriefGPT.xyz
Ask
alpha
关键词
deer
搜索结果 - 3
DEER: 变延迟强化学习的抗延迟框架
提出了一种名为 DEER(Delay-resilient Encoder-Enhanced RL)的框架,用于增强可解释性并解决随机延迟问题,通过使用预训练编码器将延迟状态及其不同延迟导致的可变长度的过去动作序列映射到隐藏状态,从而有效地缓
→
PDF
a month ago
着眼决策感知和通用化的大规模语言模型工具使用
通过提出一种决策感知和具有一般化的工具使用框架(DEER),本文旨在增强开源 LLMs 在操作工具方面的能力。通过构建工具使用样本和新颖的工具采样策略,DEER 在各个数据集上证明了其有效性和显著优于基准模型。
PDF
4 months ago
EMNLP
DEER: 描述性知识图谱用于解释实体关系
本文提出了 DEER(用于解释实体关系的描述性知识图谱),采用一种自我监督学习的方法来提取关系描述,并使用基于转换的合成模型生成关系描述,最终成功构建了一个开放而丰富的知识图谱
PDF
2 years ago
Prev
Next