当今大语言模型研究的优缺点和法律问题

Aug, 2024

当今大语言模型研究的优缺点和法律问题

Awes, Laws, and Flaws From Today's LLM Research

Adrian de Wynter

TL;DR本研究针对当代大语言模型（LLM）研究的科学方法进行了批判性审查，发现研究中存在缺乏可重复性和统计测试等问题。同时，文章提出需对LLM作为评估者的使用进行更多讨论与检验，且在推理能力的声明中普遍缺少人类评价支持。该研究强调了该领域在实践中需加强伦理和科学严谨性的重要性。

Abstract

We perform a critical examination of the scientific methodology behind contemporary large language model (LLM) research. For this we assess over 2,000 research works based on criteria typical of what is considered good research (e.g. presence of statistical tests and Reproducibility) a

发现论文，激发创造

2017年至2023年大型语言模型研究的文献计量学综述

本文通过对5000多篇学术文献的综合分析，提供了关于LLM研究的路线图，包括核心算法开发、自然语言处理任务、LLM在医学、工程、社会科学和人文学科中的应用等方面的研究趋势以及研究范式和合作模式的变化，为研究人员、从业者和决策者了解LLM研究的当前状态、影响和潜力提供了有价值的见解。

Apr, 2023

对大型语言模型评估的调查

大语言模型（LLMs）的评估方法是研究这些模型的重要组成部分，这篇综述介绍了评估LLMs的方法和维度，并总结了LLMs在不同任务中的成功案例、失败案例和未来挑战。

Jul, 2023

值得信赖的LLM：评估大型语言模型的对齐性的调查和指南

为了确保大型语言模型在实际应用中与人类意图保持一致，本研究介绍了对LLM值得信赖性进行评估时需要考虑的关键维度，包括对LLM的可靠性、安全性、公平性、抵抗滥用性、可解释性和推理性、遵守社会规范以及鲁棒性进行调查研究。通过对几个广泛使用的LLM进行测试，研究结果表明，总体上，更加符合人类意图的模型在整体可信度方面表现更好，但是模型对不同可信度类别的影响程度有所不同，这凸显了在LLM对齐方面进行更加细致的分析、测试和不断改进的重要性。本研究旨在为该领域的从业人员提供有价值的见解和指导，理解和解决这些问题对于在各种应用中实现可靠和符合伦理的LLM部署至关重要。

Aug, 2023

注意你的语言模型：对LLMs及其在NLP研究与实践中的事实核实

这篇文章提供了大型语言模型（LLMs）的定义，阐述了相关功能的假设，并概述了支持和反对它们的现有证据，最后给出了未来研究方向和其框架的建议。

Aug, 2023

评估大型语言模型：综述

该研究综述了大型语言模型的评估方法，并提出了知识与能力评估、对齐评估和安全评估三个主要方面的评估方法，以及涵盖能力、对齐、安全和适用性的综合评估平台的构建。希望该综述能够推动对大型语言模型评估的更多研究兴趣，以促进负责任发展和最大化社会利益，同时最小化潜在风险。

Oct, 2023

大型语言模型用于科学研究的跨学科视角

大型语言模型 (LLMs) 能够在不同学科领域发挥作用和限制，加强科学研究，例如通过总结大量出版物加速文献回顾，通过自动语法纠正提升代码开发，和优化科学写作过程。然而，LLMs 面临挑战，如依赖庞大且有时偏颇的数据集，以及出于使用而引发的潜在伦理困境。我们对LLMs在不同领域的影响进行重要讨论，从自然科学中帮助模拟复杂生物序列，到社会科学中解析大规模的定性数据。最后，我们提供一种细致的观点，认为LLMs既是科学进步的福音，也是其边界。

Nov, 2023

法律领域中法学硕士课程的评估伦理

大型语言模型在法律领域的适用性和性能的综合评估对学术讨论具有重要贡献。

Mar, 2024

由学徒到研究助理：大型语言模型推动研究

通过文献综述和第一手实验，本文研究了大型语言模型（LLMs）的潜力。尽管LLMs具有成本效益和高效性等优点，但也存在着诸如提示调优、偏见和主观性等挑战。该研究通过利用LLMs进行定性分析的实验提供了新的见解，强调了成功和限制。此外，本文还讨论了缓解挑战的策略，如优化提示技术和利用人类专业知识。我们的工作旨在将LLMs有机地融入人机交互数据工作，并积极促进其负责任的应用，以此回应关于LLMs在研究中负责任应用的持续对话。

Apr, 2024

从长期存在的问题到新兴的困境剖析大型语言模型的伦理

本文全面调查了与大型语言模型（LLMs）相关的伦理挑战，从长期存在的问题，如侵犯版权、系统性偏见和数据隐私，到新兴问题，如真实性和社会规范。我们批判性地分析了现有研究，旨在理解、审查和减轻这些伦理风险。我们的调查强调了将伦理标准和社会价值融入LLMs的开发中，从而引导负责任和道德对齐的语言模型的发展。

Jun, 2024

当今大型语言模型研究的优势、法律与缺陷

本文针对当前大型语言模型（LLM）研究的科学方法论进行了批判性审查，识别出在研究质量标准方面的差距。研究重点在于对2,000多篇文献的评估，表明LLM作为评估者的使用上升，而关于自发行为的主张则逐渐减少，强调了该领域需要更多的审查与严格性。

Aug, 2024