BriefGPT.xyz
大模型
Ask
alpha
关键词
linguistic expertise
搜索结果 - 3
多个来源胜过一个:在低资源词汇标注中整合外部知识
通过协调多个语言专业知识源,我们解决了低资源语言自动数据驱动预览中的数据稀缺问题,并在词级准确性方面获得了 5 个百分点的平均绝对改进,对横跨六种低资源语言的多样化数据集而言,这些增强在最低资源的 Gitksan 语言中表现尤为明显,我们实
→
PDF
16 days ago
通过本地样本混合改善混合语言仇恨检测:印地语 - 英语混合场景的案例研究
在这篇论文中,我们通过严格的实证实验填补了多语言语言模型在混合代码环境中对恶意检测的评估不足,并观察到加入少量本地恶意样本以及仅使用本地样本对于提高混合代码恶意检测的效果以及可视化注意力对于定位表达恶意意图的词语在混合代码语境中是有帮助的。
PDF
a month ago
面向多语言代码混合语音的自监督语音表示微调进行语言分离
探讨利用大型自我监督预训练架构(WavLM)从已经训练好的语音表示中提取信息,以发展连续多语言语言标示系统,用于多语言转换的标注过程,在南非五种语言(isiZulu、isiXhosa、Setswana、Sesotho 和英语)的语料库中展示
→
PDF
7 months ago
Prev
Next