关键词supervised fine-tuning
搜索结果 - 89
  • 上下文奖励:基于动态偏好调整的多目标基础模型对齐
    PDF5 months ago
  • 文本到图像生成的自博弈微调扩散模型
    PDF5 months ago
  • EntGPT:将生成式大型语言模型与知识库进行链接
    PDF5 months ago
  • 利用强化学习从 AI 反馈中优化大型多模态视频模型
    PDF5 months ago
  • LLM 学生的政治偏好
    PDF5 months ago
  • LongAlign: 大型语言模型的长文本对齐配方
    PDF5 months ago
  • ACL为金融中的表格数据分析赋予语言模型工具使用能力
    PDF5 months ago
  • 监督微调进一步提升视觉基础模型
    PDF6 months ago
  • ReFT: 强化微调推理
    PDF6 months ago
  • 对比型偏好优化:推动机器翻译中 LLM 性能的边界
    PDF6 months ago
  • 金融情绪分析的预训练大型语言模型
    PDF6 months ago
  • 保留沉默特征以实现领域泛化
    PDF6 months ago
  • DeepSeek LLM: 以长期主义为基础扩展开源语言模型
    PDF6 months ago
  • 自我对弈微调将弱语言模型转化为强语言模型
    PDF6 months ago
  • AAAI利用混合自然语言反馈对语言模型进行微调的 LaFFi
    PDF6 months ago
  • GeoGalactica:地质科学领域的科学大型语言模型
    PDF6 months ago
  • 基于监督和自组织的上下文学习任务表现和模型校准
    PDF6 months ago
  • 平衡之艺:革新专家混合以保持语言模型对世界知识的对齐
    PDF7 months ago
  • ULMA:统一语言模型对齐与演示与逐点人类偏好
    PDF7 months ago
  • 大规模语言模型的数据管理:一项调查
    PDF7 months ago