BriefGPT.xyz
Ask
alpha
关键词
long audio recordings
搜索结果 - 1
IJCAI
在多模数据融合中进行长音频采访与问题的时间对齐:一个案例研究
我们提出了一种名为 INDENT 的模型,利用交叉注意力模型和句子的时间顺序先验信息学习语音嵌入,从而在长篇音频记录中根据文本查询定位问题的位置。该模型在文本查询中相较于基于启发式方法的模型显著提高了有效性(R-avg 提高了约 3%),并
→
PDF
9 months ago
Prev
Next