BriefGPT.xyz
Ask
alpha
关键词
safety adherence
搜索结果 - 2
NewsBench:用于中国新闻编辑应用的判断写作能力和安全遵循的 LLM 系统性评估
该研究提出了 NewsBench,这是一个新颖的基准框架,用于评估大型语言模型(LLMs)在中文新闻写作能力(JWP)和安全性遵循(SA)方面的能力,填补了新闻伦理和人工智能利用风险之间的差距。通过对 11 个 LLM 的综合分析,发现 G
→
PDF
4 months ago
EMNLP
在高风险领域评估大型语言模型
高风险领域中的语言模型性能评估是一个重要问题,本研究对指导调优的语言模型进行深入分析,重点关注事实准确性和安全性,通过在法律和医学两个高风险领域的六个自然语言处理数据集上进行实验,发现目前语言模型存在的局限性,并强调了提高语言模型能力和改进
→
PDF
7 months ago
Prev
Next