BriefGPT.xyz
Ask
alpha
关键词
agent communication
搜索结果 - 2
PLAYER*: 提高基于 LLM 的多智能体通讯与互动在谋杀推理游戏中的效果
基于大型语言模型(LLM)的代理通信和社交互动的最新进展,尽管这些进展,但在涉及竞争和协作的动态环境中构建面向推理的 LLM 代理仍然具有挑战性,由于受到知情图搜索方法的局限性。我们提出了 PLAYER*,这是一种基于任意采样的规划器的新型
→
PDF
2 months ago
MM
具有连贯言者的交互世界中的交流出现
本文提出了一种新的模型和训练算法,在以原始像素为输入的环境中,利用学习到的表征空间的结构产生更一致的发言者,稳定学习,并提出了一种用于度量文本独立性的新型基于对齐的指标,相比策略梯度和其他竞争基线,我们的算法在通信效果方面有了大幅提升。
PDF
6 years ago
Prev
Next