关键词supervised fine-tuning
搜索结果 - 89
  • 预训练语言模型中的非英文对齐引导
    PDF2 months ago
  • 格鲁吉亚语中的同音词义消歧
    PDF2 months ago
  • ACL一种基于偏好的增强翻译的范式与大型语言模型
    PDF2 months ago
  • 自主探索避免陷阱:以细粒度奖励提升语言模型的推理能力
    PDF3 months ago
  • 通过监督微调向大规模语言模型注入新知识
    PDF3 months ago
  • 用于鲁棒语言模型微调的自动数据整理
    PDF3 months ago
  • ACL增强大型语言模型的翻译能力的新范式
    PDF3 months ago
  • 小到大 (S2L):通过总结小模型的训练轨迹,为大型语言模型进行可扩展的数据选择
    PDF4 months ago
  • 无参考单块偏好优化与胜负比率
    PDF4 months ago
  • 关于本质和前景的研究:大型模型的对齐方法调查
    PDF4 months ago
  • 使用强化学习训练大型语言模型进行推理
    PDF4 months ago
  • 平衡增强、无害性和通用能力:通过直接 RLHF 提高对话式 LLMs
    PDF4 months ago
  • 对大型语言模型进行少样本多语言 NLU 分析与适应:如今已经达到目标了吗?
    PDF4 months ago
  • 用 LLMs 进行的自述文本风格转换提炼
    PDF4 months ago
  • PeriodicLoRA: 打破 LoRA 优化中的低秩瓶颈
    PDF4 months ago
  • LLMs 数学推理中的数据能力边界的实证研究
    PDF4 months ago
  • 脑启发的两阶段方法:模拟人类思维过程增强数学推理
    PDF4 months ago
  • 基于子模块互信息的弱监督适用于冷启动主动学习
    PDF4 months ago
  • BIDER:基于关键支持证据的高效检索增强型 LLMs 中知识不一致性的桥接
    PDF4 months ago
  • 对大型语言模型对齐的 AI 反馈的关键评估
    PDF4 months ago