BriefGPT.xyz
大模型
Ask
alpha
关键词
model privacy protection
搜索结果 - 2
TeaMs-RL:通过强化学习教授 LLMs 更好地自我指导
通过使用增强学习直接生成基础指令数据集,TeaMs-RL 方法能够在单一微调步骤中提高大型语言模型的能力,减少人为参与需求、模型查询次数以及提高模型隐私保护能力。
PDF
4 months ago
EMNLP
可调的软提示是联邦学习中的信使
通过可调整的软提示实现参与者之间的信息交流,以在损失较少的全局模型的基础上保护全局模型,减少联邦学习中的通信和计算成本。
PDF
8 months ago
Prev
Next