BriefGPT.xyz
大模型
Ask
alpha
关键词
automatic speech processing
搜索结果 - 3
大型语言模型用于口吃语音的错断检测
通过将自动语音识别系统生成的假设候选项和从音频编码模型提取的声学表示输入到大型语言模型(LLMs)中,我们将多标签异味检测任务作为一种语言建模问题进行了研究,并在包含英语和德语结巴语音的三个数据集上对系统进行了优化,以预测异味标签,实验结果
→
PDF
18 days ago
针对低资源且野外环境下的丹麦儿童 - 临床家谈话的语音检测:一个案例研究
本文研究在野外临床数据中使用预训练语音模型进行分割和分辨,提出了少实例阈值适应方法,并发现默认分类阈值下的模型在患者群体中表现较差,错误率与患者病情的严重程度直接相关,而研究表明三分钟的临床医生 - 儿童对话足以获得最佳分类阈值。
PDF
2 years ago
定义 AI 增强的 CAI 工具的最大可接受延迟
本研究探讨了计算机辅助口译工具的系统延迟对译员的认知影响,结果表明译员可以在 3 秒的延迟下进行同时口译,这一结果高于目前可用人工智能技术的典型延迟并为研究更高延迟的基于语境的语言模型提供了前提。
PDF
2 years ago
Prev
Next