Nov, 2023

使用 Transformer 架构和序列对齐进行字符级孟加拉文转音标转写

TL;DR通过使用基于 Transformer 的序列到序列模型,本研究在单个解码器和编码器层中仅使用了 850 万个参数,实现了汉语中每个单词的国际音标,并在 DataVerse Challenge - ITVerse 2023 公开排名中以 0.10582 的字错误率获得了第一名。