BriefGPT.xyz
Ask
alpha
关键词
adversarial feedback
搜索结果 - 2
从对抗性反馈中的上下文对决强盗问题的近乎最优算法
通过创新性对抗反馈的鲁棒情境对决算法,本研究在学习人类反馈中探索大型语言模型的对齐方法,并证明了在存在或不存在创新性对抗反馈的情况下,算法具有接近最优的后悔界限。同时,在各种类型的创新性对抗反馈中,实验结果表明该算法优于现有的对决算法。
PDF
3 months ago
ICLR
端到端对抗文本转语音
该研究提出了一种基于端到端的方式来从文本或音素中生成语音的方法,使用逐字符或逐音素音频输出序列,通过可微分的对齐策略来保证高保真度音频的生成,实现了在不需要多阶段训练和额外监督下,比之前的技术达到了相似的高质量合成音效。
PDF
4 years ago
Prev
Next