通过过多词汇探索ChatGPT在学术写作中的应用
本文通过对5000多篇学术文献的综合分析,提供了关于LLM研究的路线图,包括核心算法开发、自然语言处理任务、LLM在医学、工程、社会科学和人文学科中的应用等方面的研究趋势以及研究范式和合作模式的变化,为研究人员、从业者和决策者了解LLM研究的当前状态、影响和潜力提供了有价值的见解。
Apr, 2023
我们的研究显示,在人群工作者中普遍使用大型语言模型(LLM),而有针对性的缓解策略可以显著降低LLM的使用,但不能完全消除。在一个文本摘要任务中,未对工作者在任何方面指示LLM的使用,估计LLM的使用普遍程度约为30%,但通过要求工作者不使用LLM和提高使用LLM的代价(例如禁用复制粘贴)减少了约一半。副本分析进一步揭示了LLM的使用及其预防的见解:LLM的使用产生高质量但同质化的回答,可能会损害关注人类(而非模型)行为的研究并降低以众包数据进行训练的未来模型的质量。同时,防止LLM的使用可能与获取高质量回答的目标相悖;例如,要求工作者不使用LLM会导致摘要中的关键字数量减少,从而丢失了关键信息。我们的估计可能随着LLM的普及或能力的增加以及其使用方式的变化而改变。然而,在广泛采用之前,了解基于LLM的工具和用户的共同演变对于维护使用众包进行的研究的有效性至关重要,我们提供了一个重要的基线。
Oct, 2023
大型语言模型 (LLMs) 能够在不同学科领域发挥作用和限制,加强科学研究,例如通过总结大量出版物加速文献回顾,通过自动语法纠正提升代码开发,和优化科学写作过程。然而,LLMs 面临挑战,如依赖庞大且有时偏颇的数据集,以及出于使用而引发的潜在伦理困境。我们对LLMs在不同领域的影响进行重要讨论,从自然科学中帮助模拟复杂生物序列,到社会科学中解析大规模的定性数据。最后,我们提供一种细致的观点,认为LLMs既是科学进步的福音,也是其边界。
Nov, 2023
通过对950,965篇论文进行大规模分析,我们发现大型语言模型在学术写作中的使用不断增加,尤其在计算机科学论文中增长最快(最高达17.5%),而数学论文和Nature期刊的修改程度相对较低(最高达6.3%)。此外,我们的研究发现,更多使用大型语言模型的论文往往由经常发布预印本的第一作者、研究领域较为拥挤的论文以及长度较短的论文撰写而成。这些结果表明大型语言模型在科学写作中被广泛应用。
Apr, 2024
本研究解决了大型语言模型(LLMs)广泛应用所带来的众多挑战,包括学术诚信、版权和伦理问题等,填补了相关文献的空白。通过系统梳理和分析现有文献,我们提出了对特定LLMs的风险分类、成因及解决方案,以及更广泛的挑战和缓解策略。本研究的主要发现是这些模型的复杂性和潜在影响需要更深入的理解与应对。
Aug, 2024
本研究旨在总结大型语言模型(LLMs)在科学综述生成过程中的应用,发现了众多文献综述阶段可被自动化,并评估了当前相关研究的进展。研究表明,GPT-based LLM在文献综述自动化中占据主导地位,而现有文献中真正应用LLM的综述仅占少数,但预示着LLMs将在未来改变科学综述的开展方式。
Sep, 2024
本研究针对大语言模型(LLMs)在学术写作和演讲中使用的词汇进行首次大规模调查,揭示了LLMs如何影响这两种主要的语言表达方式。研究发现,LLM风格的词汇在学术摘要和口头报告中更为频繁地出现,这一趋势预示着LLMs对人类社会的潜在影响将持续增长。
Sep, 2024
本研究针对大型语言模型(LLMs)在天文学研究中应用的潜在问题与局限性展开探讨。通过对13位不同职业阶段天文学家的研究,分析了LLMs在多种研究任务中的使用效果及参与者的体验。研究表明,虽然LLMs在协助研究方面展现出巨大潜力,但仍需结合研究者的批判性思维和专业知识,以确保其作为辅助工具而非科学探究的替代品。
Sep, 2024
本研究针对大型语言模型(LLMs)在非计算机科学领域的影响进行了系统性分析,填补了相关研究的空白。通过对$106$个LLMs和约$148,000$篇引用LLMs的论文进行定量分析,发现自2018年以来,LLMs在语言学和工程等领域的使用频率显著上升,并揭示了这些领域大多采用无需进一步微调的任务无关型LLMs来解决特定问题。本研究揭示了LLMs在跨学科研究中的重要性和潜在影响。
Sep, 2024