BriefGPT.xyz
大模型
Ask
alpha
关键词
t5 models
搜索结果 - 3
通用多意图条件槽位填充
本文提出了一种更普适的槽位填充方法,通过将其视为 JSON 生成任务,并使用语言模型进行处理。本文结合 DBpedia 和现有的槽位填充数据集以及 GPT-3 生成属于该领域的数据集,使用 T5 模型进行训练,并发现加入 prompt 后两
→
PDF
a year ago
ACL
SKILL: 大语言模型结构化知识注入
本研究旨在探讨结构化数据如知识图谱和文本等对大语言模型(LLMs)内部化知识的差异,提出了一种将结构化知识注入 LLMs 的方法,并通过在不同知识图谱数据上的预训练和多个自然语言任务的性能比较,证明了该方法的有效性。
PDF
2 years ago
ACL
使用自我训练提高数据到文本生成的组合泛化能力
本文研究了结构化意义表示到自然语言生成中 T5 模型的泛化问题,提出了基于模板的输入表示和基于 fine-tuned BLEURT 的自训练方法来改善模型的泛化和性能,在少样本场景下通过常用的 SGD 和 Weather 基准测试取得了比强
→
PDF
3 years ago
Prev
Next