BriefGPT.xyz
Ask
alpha
关键词
out-of-distribution dataset
搜索结果 - 2
自适应精调 Transformer 集成模型用于 LLM 生成文本检测
大语言模型生成文本内容的多样性接近于人类的能力,因此为了避免潜在的风险如社交媒体上的假新闻,需要有效的假文本检测。本研究通过在内部和外部分布数据集上测试五种专门的基于 Transformer 的模型来研究它们在 LLM 生成文本检测任务中的
→
PDF
4 months ago
评估 ChatGPT 和 GPT-4 的逻辑推理能力
本研究评估了 GPT-4 在逻辑推断任务中的性能,包括多项逻辑推断数据集的测试以及构建一个逻辑推理离散数据集进行实验。结论显示,尽管 GPT-4 表现优异,但逻辑推理对 ChatGPT 和 GPT-4 来说仍然是一项挑战。
PDF
a year ago
Prev
Next