BriefGPT.xyz
Ask
alpha
关键词
self-instruct
搜索结果 - 4
机器教学:增强了指令对齐的代码 LLM 微调的模拟器
通过使用 Robo-Instruct 方法,我们可以使用小型的开源权重语言模型生成域特定的机器人程序,以实现与专有权重语言模型相媲美甚至超过其性能。
PDF
a month ago
Seal-Tools: 自助工具学习数据集用于代理调整和详细基准测试
本研究提出了一个新的工具学习数据集 Seal-Tools,它包含了自学习的类似 API 的工具。通过提供大量的工具和实例,Seal-Tools 不仅能实现数据的大规模生成,还能展示工具的实际应用。为了确保可靠性,我们提出了一种自学习方法来生
→
PDF
2 months ago
半指导:连接自然指导和自我指导的大型编码语言模型
指令调优在大规模代码语言模型(Code LLMs)中对程序合成任务至关重要。本文提出一种名为 Semi-Instruct 的方法,通过将自然指令中不规范代码转化为正确的指令 - 代码对,并设计了一种新颖的测试用例构建方法来验证生成代码的正确
→
PDF
4 months ago
自我指导:用自动生成的指令对齐语言模型
使用 Self-Instruct 框架,可以将预训练模型与指令对齐,提高模型的指令遵循能力,无需过多人为指令数据,可用于 finetuning,大大提高了模型的通用性。
PDF
2 years ago
Prev
Next