Jan, 2024

AI 是否能像人类一样写古代汉诗?基于图灵测试的实证研究

TL;DR本文通过研究一项重要问题,提出了 ProFTAP 评估框架,将其应用于目前的大型语言模型(LLMs)并发现最新的 LLMs 确实具备了与人类几乎无法区分的写作古典汉诗的能力,同时揭示多个开源 LLMs 能够胜过 GPT-4 在这一任务上。