带权有限状态转录器的三元组合

Feb, 2008

3-Way Composition of Weighted Finite-State Transducers

Cyril Allauzen, Mehryar Mohri

TL;DR本文提出了一种称为 3-way composition 的加权转换的组合算法，相较于标准组合算法更为快速，其复杂度为 O（|T|_Q * min (d (T_1) * d (T_3), d (T_2)) + |T|_E）, 在多种应用中具有显著的性能优势。

Abstract

Composition of weighted transducers is a fundamental algorithm used in many applications, including for computing complex edit-distances between automata, or string kernels in →

weighted transducers 3-way composition algorithm machine learning speech recognition

发现论文，激发创造

加权有限自动机组合的语音识别

基于加权有限自动机和有限状态转换器的语音识别框架，可以用于统一表示识别中使用的各种信息源和数据结构，包括上下文相关单元、发音字典、语言模型和格点。可进行信息源的组合和其应用的优化，在识别期间动态组合语音观察和信息源。

Mar, 1996

在 GPU 上合成有限状态转换器

本论文介绍了第一篇知道的 GPU 实现权重有限状态转换器组合操作的方法，并讨论了用于在此体系结构上实现最佳性能的优化。我们展示了我们的方法可以比串行实现快 6 倍，并且比 OpenFST 快 4.5 倍。

May, 2018

一种用于带权重写规则的高效编译器

该研究介绍了一种新的算法，用于将上下文相关的重写规则编译成有限状态转换器（FSTs），能够更有效地进行自然语言和语音处理，并且扩展该算法以允许编译加权规则成加权的 FSTs。

Jun, 1996

可微分加权有限状态转换器

该论文提出了一种使用加权有限状态转录器（WFSTs）进行自动微分的框架，使它们可以在训练期间动态使用，该框架可以探索新的结构化损失函数并结合各种序列级损失函数使用剪枝和回退等方法，在字短语的潜在分解学习方面具有很大的优势，同时提出了一种卷积 WFST 层，可用作传统卷积层的替代，用于手写识别和语音识别的实验中表现良好。

Oct, 2020

带权有限状态转移器表示的交易

这篇研究论文介绍了一种复杂的法律交易模型，以加权有限状态转换机表示，所使用的数学算法可以提供可操作的法律洞见。

Feb, 2023

RNN-Transducer 损失函数的强大可扩展 WFST 框架

本文提出了一种基于 WFST 框架的 RNN-T 损失简化开发的方案，并介绍了两种基于 WFST 的 RNN-T 实现，通过引入 W-RNNT 损失的示例说明了可扩展性优势，最终展示了 NeMo 工具包中所有实现的 RNN-T 损失。

Mar, 2023

使用形式语言进行组合基准测试

本研究从形式语言的角度出发，使用确定性有限状态转换器进行实验，研究了神经网络在学习复合性时的可学习性限制，发现关键在于转换器的转换覆盖率，限制为每个转换至少有 400 个示例。

Aug, 2022

基于模糊双支持向量机的三路不平衡学习

本文提出了一种新的三态模糊隶属函数和三态模糊双支持向量机，将三态决策与机器学习中的标准二元分类模型 SVM 相结合，解决了 SVM 需要改进的不平衡分类问题。通过对 47 个不同数据集的比较实验，并从相同数据集中导出不同的不平衡比率的数据集，结果表明，所提出的模型显著优于其他传统的基于 SVM 的方法。

May, 2023

复合词变压器：学习在动态有向超图上组合全歌曲音乐

该论文提出了一种新型 Transformer 解码器架构，其用于不同的前馈头来模拟不同类型的 tokens，以及一种扩展 - 压缩技巧将邻近的 tokens 分组成复合单词的序列，表现出比现有模型更快和同等质量的学习能力.

Jan, 2021

在 GPU 上使用有限状态转导进行解码

通过 GPU 实现 Viterbi 算法和前向 - 后向算法对加权有限状态自动机进行加速，取得了至多 5.2 倍于串行实现输出速度，并对 OpenFST 实现达到 6093 倍的加速效果。

Jan, 2017