BriefGPT.xyz
大模型
Ask
alpha
关键词
interlinear glossed text
搜索结果 - 5
我们能教语言模型术语化濒危语言吗?
利用大型语言模型以及上下文学习的方法实现自动生成线性化标注文本的任务,无需传统训练,减少了研究人员的使用成本。
PDF
7 days ago
Wav2Gloss: 从语音生成词汇顺序排列的文本
语言灭绝、线性标注文本、Wav2Gloss、语音标注和端到端系统的比较和分析以及为未来 IGT 从语音生成的研究奠定基础的基准测试。
PDF
3 months ago
ACL
GlossLM:面向低资源的多语言预训练用于语言互译注释
我们编译了最大的现有的跨语言翻译数据语料库,从多个来源收集了超过 450k 个样例,覆盖了 1.8k 种语言,以便进行跨语言转移和跨语言翻译生成的研究。然后,我们对这个语料库的部分内容进行大规模多语言模型预训练,并进一步对特定语言进行微调。
→
PDF
4 months ago
SIGMORPHON 2023 内语注释共享任务:基线模型
本文描述了 SIGMORPHON 2023 共享任务的基线系统,利用 Transformer 架构并将文本生成视为序列标注任务,旨在自动化语言文献编制过程,以节省注释者的宝贵时间和精力。
PDF
a year ago
低文档化语言 NLP 中语言专业知识的意义
本研究指出,利用语言学家的专业知识,IGT 数据可以成功应用于 NLP 项目中,但需要定义任务、语言专业知识和任务评估等步骤,本文以 Gitksan 语 Morphological Reinflection 系统为例详细介绍。
PDF
2 years ago
Prev
Next