- 无模型强化学习在光学自动实验控制中的应用
我们使用强化学习和虚拟测试平台实现自动调整光纤对激光的耦合效率达到 90%,证明强化学习在实验室降低工作负荷上的可行性。
- 直接通过自我奖励对比提示精制的大型语言模型对齐
通过对比提示对生成的偏好数据进行评估,并计算自奖励分数,最终使用 DPO 算法结合此自奖励分数来有效地对齐大型语言模型,实现了不依赖人工标注的偏好数据的 DLMA 方法能够超越 RLHF 方法。
- 学习如何通过韩语翻译朝鲜语
本研究通过构建共比赛语料库,从而为朝鲜语神经机器翻译模型提供北韩语言的数据训练。我们手动创建评估数据,研究适用于朝鲜语的自动对齐方法,最后证实了使用朝鲜双语数据训练的模型能够显著提高其翻译准确性。
- ICML音频与谱对准的混合方法
使用神经网络作为 Dynamic Time Warping (DTW) 方法的预处理步骤,可以生成鲁棒的、适应性强的自动音乐配准。
- 自动对齐方法用于摘要语料库构建
本文提出了使用会议摘要生成自动转录报告的方法。使用自动预对齐方法使数据批量化对齐,最大化语料库的规模,以及使用人工标注者进行更准确地校对。作者还评估了自动对齐和自动摘要的表现,并证明自动对齐可大幅度提高所有 ROUGE 得分。
- 语音与嘴唇的动态时间对齐
本文介绍了一种基于深度音频视觉特征的音频到视频对齐方法,通过自动化的对齐实现了音频与唇形的对应,解决了后期制作中语音与唇形不匹配的问题。
- 使用法语翻译扩充 Librispeech:一种用于直接语音翻译评估的多模态语料库
本文介绍了使用 LibriSpeech 增强现有单语语料库的方法,建立起一种包含源语言中的语音与目标语言中的文本的大型开放式平行语料库,并给出了相应的处理细节和手动评估结果,该平行语料库可以用于直接语音翻译或其他口语翻译实验。
- EMNLP一种无监督概率模型用于低资源语言的语音到翻译对齐
本论文提出一种模型,结合 IBM Model 2 和 k-means 聚类,使用动态时间规整作为距离度量,在极低资源情况下,该模型比神经模型表现更好,可用于将翻译的语音数据自动对齐。