ACLJun, 2024

跨文化对齐是否改变语言模型的常识道德?

TL;DR用英文資源對日本語言模型進行對齊,並評估結果微調模型的通俗道德是否與日本文化保持一致,結果顯示,通俗道德的某些方面是可遷移的,但其他方面則不一定。