BriefGPT.xyz
Ask
alpha
关键词
ted
搜索结果 - 2
任务感知分层蒸馏:语言模型压缩的 “减法即增益
本研究提出一种名为 TED 的任务感知分层蒸馏方法,通过使用任务感知滤波器,选取有用于目标任务的知识来减小知识差距,从而在学生和教师之间减小知识差距并帮助学生更好地适应目标任务,在连续预训练和微调的两种情况下,TED 都比现有的蒸馏方法表现
→
PDF
2 years ago
LRS3-TED: 用于视觉语音识别的大规模数据集
介绍一个包含 TED 演讲视频中的面部轨迹,字幕和单词对齐信息的大规模新型多模态数据集,适用于视觉和视听语音识别的研究。
PDF
6 years ago
Prev
Next