关键词supervised fine-tuning
搜索结果 - 89
  • ICML文本序列化与传统表格机器学习范式的关系
    PDF11 days ago
  • 超越答案所学:基于反思的数学推理语言模型训练
    PDF13 days ago
  • 大型语言模型作为软性推理器的系统分析:以三段论推理为例
    PDF13 days ago
  • 训练代码大型语言模型时,揭示监督微调和强化学习之间的相关性
    PDF16 days ago
  • 什么是最好的模型?用于大型语言模型的应用驱动评估
    PDF16 days ago
  • PLUM: 偏好学习加测试用例产生更好的代码语言模型
    PDF19 days ago
  • 鹦鹉:多语言视觉指令调整
    PDFa month ago
  • 基于 Bert、Roberta 和 Xlnet 的分子性质预测集成模型
    PDFa month ago
  • 利用图像理解的自我训练增强大型视觉语言模型
    PDFa month ago
  • 指令 CP:将大型语言模型快速转换为目标语言
    PDFa month ago
  • 从人类演示中学习奖励优化 SFT 数据:提高 LLM 对齐的方法
    PDFa month ago
  • 自动为涵盖不同粒度的 LLLs 生成大量上下文驱动的 SFT 数据
    PDFa month ago
  • ACL分散 - 合并:通过减少对齐税来推动指令调优的极限
    PDFa month ago
  • 直觉微调:将 SFT 和 RLHF 统一为单一流程
    PDFa month ago
  • NIFTY 金融新闻头条数据集
    PDFa month ago
  • RLHF 工作流程:从奖励建模到在线强化学习
    PDF2 months ago
  • 意大利语的先进基于自然的交互:LLaMAntino-3-ANITA
    PDF2 months ago
  • 对新知识进行细调的 LLMs 是否鼓励产生幻觉?
    PDF2 months ago
  • Open-SQL 框架:在开源大型语言模型上增强文本到 SQL 转换
    PDF2 months ago
  • ACL利用大型语言模型检测德语泰勒克通道中超越关键词偏见的阴谋论
    PDF2 months ago
Prev