BriefGPT.xyz
Ask
alpha
关键词
black-box tuning
搜索结果 - 4
CPT:黑盒优化的一致代理调谐
黑盒调优方法中的一种,通过使用冻结的大型黑盒模型和另一个冻结的小型白盒模型确保一致性,以改进任何涉及逻辑分类任务的模型性能。
PDF
5 days ago
具备偏好排名的 Prompt-Tuning 决策 Transformer
本文提出了 Prompt-Tuning DT 算法,使用轨迹段作为提示来指导强化学习(RL)代理获取环境信息并通过黑盒调整来优化提示,以提供更多相关信息和指导代理走向特定任务的方向,在低数据情况下仅学习 0.03%的参数即可实现与全模型微调
→
PDF
a year ago
基于提示的黑盒调参:从三个正交视角提高模型的泛化能力
本文提出 BBT-RGB, 一套用于提高黑盒优化效率和性能的简单而相辅相成的技术。我们的实验结果表明,该方法在各种自然语言理解和推理任务中具有很好的有效性。
PDF
a year ago
利用预训练语言模型的快速调优竞赛解决方案技术报告
本报告是关于在预训练语言模型中应用黑盒调整以进行 few-shot 学习的研究。 我们提出了基于 LMaaS 场景的解决方案,包括多标签词、P0 选择、滚动更新策略、MLP 分类器的多任务损失以及使用集成方法进一步提高广义化能力。 最后,我
→
PDF
2 years ago
Prev
Next