关键词data construction pipeline
搜索结果 - 3
- Step-DPO:Step-wise 偏好优化长链推理的 LLMs
我们提出了一种名为 Step-DPO 的简单、有效和数据高效的方法,它将每个推理步骤作为单位进行优化,而不是对答案进行整体评估。通过构建 Step-DPO 的数据集,我们观察到自动生成的数据比人类或 GPT-4 生成的数据更有效,我们的发现 - 细节图像描述的基准测试与改进
图像标注长期以来一直被视为视觉理解的基本任务。最近,由于过时的短字幕基准和不可靠的评估指标,很少有大规模视觉 - 语言模型(LVLM)研究讨论模型的图像标注性能。本文提出了通过由人类专家注释的高质量评估数据集 GPT-4V 和 Gemini - PhotoMaker: 通过堆叠身份嵌入定制逼真的人类照片
研究对文本到图像的生成进行了进一步的提升,在保证高效率、有辨识度的身份和灵活文本控制性等要求的前提下,提出了 PhotoMaker 方法。通过将输入的身份图像编码为堆叠的 ID 嵌入来维护身份信息,该嵌入不仅可以全面地表达相同输入身份的特征