BriefGPT.xyz
Ask
alpha
关键词
mt5 model
搜索结果 - 3
ACL
通过上下文一次性演示实现适应性跨语言文本分类
通过在分类任务中介绍上下文一次性跨语言转换(IC-XLT),可以通过训练模型学习上下文示例,然后在推断时通过在目标语言中预置一次性上下文演示来适应目标语言,提高评估的 mT5 模型的跨语言能力,超过基于提示的模型在经过微调的零和少样本情景中
→
PDF
3 months ago
PRESTO: 一个用于解析现实任务导向对话的多语言数据集
本研究介绍了 PRESTO,这是一个基于 550K 个虚拟助手和人之间的上下文多语言对话的公共数据集,用于研究语言理解的挑战性问题,包括流畅性、代码切换和修订等。mT5 模型在该数据集上的表现证明了其中的语言现象具有挑战性,尤其在低资源情况
→
PDF
a year ago
印尼语多语 T5 转换器
本文研究了将 mT5 多语言模型适应为仅针对印尼语的预训练 T5 模型,通过对多语言模型与本模型在情感分析、问题生成和问答三个任务的表现进行比较,结果表明可以生成一个更小的预训练模型并在 comparable yields 的同时减小模型大
→
PDF
a year ago
Prev
Next