BriefGPT.xyz
Ask
alpha
关键词
eureka
搜索结果 - 2
Eureka:通过编码大型语言模型实现与人类水平的奖励设计
Eureka 是一个由 LLMs 支持的人类级奖励设计算法,通过利用 GPT-4 等最先进的 LLMs 的无需提示、代码编写和条件改进能力,进行奖励代码的进化优化,从而生成可用于强化学习的复杂技能获取奖励函数。在一个多样的包含 10 个不同
→
PDF
9 months ago
EMNLP
EUREKA: 基于 KNN 方法和扩充的欧盟委婉语识别
EUREKA 是一种基于集成的方法,用于自动检测委婉语,通过对潜在委婉语术语 (PET) 的模型表示和语义相似句子的表示进行分类, EUREKA 能够在公共排行榜上取得最高得分 0.881 的状态
PDF
2 years ago
Prev
Next