BriefGPT.xyz
大模型
Ask
alpha
关键词
data creation pipeline
搜索结果 - 2
EMNLP
提升大型语言模型的数据生成能力
本文提出了一种统一的数据创建流程,只需一个格式示例,适用于包括传统上问题较多的任务在内的广泛范围,通过实验证明使用指令跟随型大型语言模型创建的数据比使用人工标注的数据在分布外评估上表现更好(高达 17.5%),同时在分布内任务上保持可比较的
→
PDF
8 months ago
IJCAI
一个高效的数据创建流程,为大型语言模型生成高质量的金融指令数据
通过创造一个数据创建流程,将大规模语言模型 fine-tune 为金融相关任务,本研究使用 ChatGPT 在 AI 投资者和金融专家之间开展对话,并结合金融专家的反馈,生成了一个包含 103k 条对话的稳健指令调整数据集。通过采用 GPT
→
PDF
a year ago
Prev
Next