西物：一种基于灵活和可学习的高能物理 LLM

Apr, 2024

西物：一种基于灵活和可学习的高能物理 LLM

Xiwu: A Basis Flexible and Learnable LLM for High Energy Physics

Zhengde Zhang, Yiyu Zhang, Haodong Yao, Jianwen Luo, Rui Zhao...

TL;DR发展了一种复杂的大型语言模型系统 Xiwu，通过种子裂变技术、即时学习系统和即时微调系统，实现了在高能物理领域中应用大型语言模型的最佳实践。结果表明，Xiwu 模型在高能物理知识问答和代码生成方面明显优于基准模型，为 HEP 领域提供了定制的大型语言模型。

Abstract

large language models (llms) are undergoing a period of rapid updates and changes, with state-of-the-art (SOTA) model frequently being replaced. When applying →

large language models xiwu high-energy physics llms just-in-time learning system

发现论文，激发创造

PIXIU：面向金融领域的大型语言模型、指令数据和评估基准

介绍了一个名为 PIXIU 的综合框架，包括首个用于金融领域的基于 fine-tuning 的 LLM（FinMA）、用于 fine-tuning 的指导数据和包含 5 个 NLP 任务和 1 个预测任务的评估基准。

Jun, 2023

从零开始预训练轻量级大型语言模型 MindLLM: 评估与领域应用

MindLLM 是一系列双语轻量级大型语言模型，通过从头开始训练模型以减轻培训和部署大型语言模型的负担并解决资源不足问题。该论文提供了大模型开发过程中的经验，并介绍了适用于较小模型的创新指令调整框架，同时探索了 MindLLM 在法律和金融等特定垂直领域的应用。

Oct, 2023

CMMLU: 用于测量中文海量多任务语言理解的工具

本文介绍了一个涵盖自然科学、社会科学、工程学和人文学科等多个领域的全面中文基准 CMMLU，并通过评估 18 种面向性能的多语言和中文 LLMs，在不同的主题和设置下评估它们的性能，结果显示，大多数现有 LLM 在提供上下文示例和思维链提示时仍然难以达到 50% 的平均准确性，而随机基准线为 25%，这凸显出 LLMs 有显着的改进空间。

Jun, 2023

基于 LLM 的数据增强方法提升跨语言表现

本研究探讨了利用大型语言模型进行数据增强在跨语言常识推理数据集中的潜力，通过使用包括 Dolly-v2、StableVicuna、ChatGPT 和 GPT-4 在内的大型语言模型来扩充三个数据集，确定了该方法的有效性，并比较了使用英语生成数据和将英语生成的数据翻译成目标语言。实验结果表明，使用 GPT-4 生成的合成数据进行训练的性能比其他模型优秀，ChatGPT 和 GPT-4 在大多数语言中生成的自然文本效果非常好，但在某些情况下，它们的效益会下降。

May, 2023

LLM2KB：利用调整指导上下文感知的大型语言模型构建知识库

使用大型语言模型构建知识库的 LLM2KB 系统有不同于基础模型的参数紧凑的注入模型，通过 LoRA 技术调整指令以便使用 Wikipedia 页面上下文实体，并在 LM-KBC 挑战中取得了 0.6185 的平均 F1 得分。

Aug, 2023

为地球科学知识理解与应用构建基础语言模型的学习

本篇论文中，我们针对地球科学领域开发了第一个大语言模型 K2，并建立了 GeoSignal 数据集用来调整 LLMs 的响应，以及 GeoBenchmark 数据集在地球科学方面对 LLMs 进行评估，并进行了 fine-tuning 操作，实验证明了我们的方法和数据集的有效性。

Jun, 2023

中文医药大语言模型中的健康相关原子知识的计算分析

通过构建基准测试并评估通用和专用语言模型，我们发现通用语言模型在原子知识和指令遵循能力方面表现更好，而专用语言模型在提供安全性方面表现较差，在提炼数据方面可以通过通用语言模型学习。此外，我们还发现提炼数据对于专用语言模型的微调效果最佳。

Oct, 2023

大型语言模型在扩展口语理解系统到新语言方面的应用

介绍了一种使用大型语言模型进行机器翻译的流水线，用于扩展语音助手系统的口语理解模型，提高了多语言场景和设备本地场景下的整体准确率。

Apr, 2024

HuaTuo：基于中医知识优化 LLaMA 模型

HuaTuo 是基于 LLaMA 模型，使用生成的 QA 实例进行监督微调，以提高其在生物医学领域任务中的表现，实验结果表明，HuaTuo 生成的响应具有更加可靠的医学知识。

Apr, 2023

大型语言模型在语言学习中的口语智能

评估大语言模型在教育中的功效，特别是在口语学习领域，引入新的多选题数据集评估模型在理解和应用口语知识方面的表现，研究不同提示技术对模型性能的影响，发现模型在音韵学、语音学和第二语言习得方面具有良好的概念理解，但在解决现实世界问题的推理方面存在限制，并初步探讨了对话交流的发现。

Aug, 2023