BriefGPT.xyz
大模型
Ask
alpha
关键词
listener
搜索结果 - 2
ICCV
语言模型能否学会倾听?
基於語言模型和量化的原子運動元素,我們提出了一種生成聽眾適當面部反應的框架,以回應演講者的言談,並展示了模型在定量指標和定性用戶研究中生成流暢且反映語義的聽眾動作的能力。
PDF
10 months ago
针对低资源语言的文本转语音自动 MOS 预测的资源有效调整策略
通过对 BVCC 和 SOMOS 数据集进行 wav2vec 2.0 预训练和微调,实现了针对 LRL West Frisian 的零样本 MOS 预测。研究表明,在 30% 的数据使用量之后,使用更多的数据并没有显著性的提高性能;同时,对
→
PDF
a year ago
Prev
Next