利用大型语言模型监控灾害期间的关键基础设施设施
通过对事先训练的大型语言模型(LLM)进行指令微调,将其嵌入灾害特定知识,从而实现对灾害相关推文的多标签分类,提高社交媒体数据在灾难情境感知中的效用。
Jun, 2024
在这项研究中,我们评估了大型语言模型(LLMs)分析历史软件供应链违规行为的能力。我们使用 LLMs 复制了 Cloud Native Computing Foundation (CNCF) 成员对 69 个软件供应链安全违规行为的手动分析,并根据四个维度开发了 LLMs 的提示:侵害类型、意图、性质和影响。我们报告了当源文章足够详细以便在手动分析员中形成共识时,LLMs 能够有效地描述软件供应链违规行为,但不能取代人工分析员。未来的工作可以提高 LLMs 在这个背景下的性能,并研究更广泛的文章和违规行为。
Aug, 2023
利用 FloodBrain 工具,我们测试了不同的大型语言模型作为生成洪水灾害影响报告的基础,与人工撰写的报告进行对比评估,并通过从网络上提取和整理信息来生成详细准确的报告,旨在提高大型语言模型在灾害影响报告中的应用,减少人道主义救援行动的协调时间。
Nov, 2023
我们提出了 PandemicLLM,这是一个新颖的框架,利用多模态大型语言模型将疾病传播的实时预测转化为文本推理问题,能够整合实时、复杂、非数值型信息,并在 COVID-19 大流行中得到应用。该研究揭示了适用大型语言模型和表征学习提升疫情预测的潜力,展示了人工智能创新如何加强未来的疫情应对和危机管理。
Apr, 2024
通过使用开放源代码的大型语言模型 LLAMA2,我们介绍了一种新的方法来从社交媒体帖子和直接应急信息中识别和分类紧急情况,旨在利用自然语言处理和机器学习的力量,为公共安全通信员和大规模人群在全国范围内的紧急情况提供帮助,并开发了一种语言模型,使其能够理解用户在 911 呼叫中描述的情况,使 LLAMA2 能够分析内容并向通信员提供相关指示,并在必要时创建工作流程以通知政府机构与呼叫者信息。这种语言模型的另一个好处是在 911 系统不堪重负时能够帮助用户提供简单的指导并向相关部门提供其位置和紧急信息。
Jan, 2024
该研究评估了大型语言模型对于改善交通事故管理中的机器学习过程的影响,研究了使用事故报告对事故严重程度进行分类时,由现代语言模型生成的特征在改进或匹配预测准确性方面的程度,并进行了多个比较以验证语言模型和机器学习算法的组合。研究结果显示,将语言模型的特征与直接从事故报告中获取的特征进行结合,可以在分配事故严重级别时提高或至少与机器学习技术的性能相匹配,尤其是在采用随机森林和极限梯度提升方法时。该研究对于展示如何将大型语言模型整合到事故管理的机器学习工作流程中,从而简化从非结构化文本中提取特征并改进或匹配事故严重程度预测的精度具有重要贡献。通过有效利用这些语言处理模型来改进事故严重级别分类的建模过程,该研究展示了工程应用实例。本研究为在传统数据基础上利用语言处理能力改进机器学习流程、进行事故严重程度分类提供了重要洞见。
Mar, 2024
大型语言模型在最近几年取得了迅猛的进展,其能力正在不断加速,通过各种基准测试,其能力接近于人类的水平。由于存在未解决的脆弱性和限制,人们在将这些模型应用于智能和安全关键应用之前需要谨慎。本文回顾了与 LLM 评估和脆弱性相关的最新文献,综合当前的研究进展,并帮助了解哪些进步对于在智能和安全关键应用中使用这些技术最为关键。这些脆弱性被分为十个高级类别,并与 LLM 的一个高级生命周期进行了叠加。还对一些常见的缓解措施进行了综述。
Dec, 2023