BriefGPT.xyz
大模型
Ask
alpha
关键词
underlying support values
搜索结果 - 1
细调 vs 触发,语言模型是否能理解人类价值观?
未来我们将探索 fine-tuning 和 prompt tuning 在处理句子中潜在支持值的任务中的潜力,同时对大型语言模型与强化学习对齐在此任务中的能力进行初步尝试。
PDF
4 months ago
Prev
Next