关键词weak-to-strong deception
搜索结果 - 1
  • 超(表)对齐:在弱到强的泛化中,强模型可能欺骗弱模型
    PDF19 days ago
Prev
Next