AnomaLLMy -- 通过低置信度的单词预测在黑盒 LLM 中检测异常的单词

Jun, 2024

AnomaLLMy -- 通过低置信度的单词预测在黑盒 LLM 中检测异常的单词

AnomaLLMy -- Detecting anomalous tokens in black-box LLMs through low-confidence single-token predictions

Waligóra Witold

TL;DRAnomaLLMy 是一种新颖的技术，用于通过 API 访问自动检测黑盒大型语言模型中的异常标记。通过利用低置信度的单词预测作为一种成本效益的指标，AnomaLLMy 识别模型行为中的异常，解决异常标记降低模型质量和可靠性的问题，通过在 cl100k_base 数据集上验证，AnomaLLMy 检测到了 413 个主要异常和 65 个次要异常，仅花费了 24.39 美元的 API 积分。本研究的发现有望增强大型语言模型的鲁棒性和准确性，特别是在分词器开发和评估方面。

Abstract

This paper introduces anomallmy, a novel technique for the automatic detection of anomalous tokens in black-box large language models (LLM

anomallmy automatic detection anomalous tokens large language models tokenizer development

发现论文，激发创造

利用 LLMs 进行表格数据的异常检测

利用大型语言模型（LLMs）来检测表格异常，并展示了预训练的 LLMs 在零样本批量级异常检测方面的效果，同时提出了一种简单但有效的数据生成过程和端到端微调策略来对齐 LLMs 检测真实异常的潜力。

Jun, 2024

大型语言模型中的故障令牌：分类体系和有效检测

使用三种不同的分词工具，通过实验对七种顶级常用大型语言模型进行研究，发现了异常标志词 “glitch tokens”，并在嵌入空间中发现了它们的聚类规律，通过提出的基于聚类的新技术 GlitchHunter 显著优于三种基准方法，为减少大型语言模型中的分词相关错误提供有价值的洞见。

Apr, 2024

用于预测和异常检测的大型语言模型：系统文献综述

通过系统性文献综述，全面考察了在预测和异常检测中使用大规模语言模型（LLMs）的应用，突出了现有研究的现状、固有挑战和未来发展方向。LLMs 已经在解析和分析大规模数据集以识别模式、预测未来事件和检测异常行为等各个领域展现了巨大潜力。然而，该综述指出了一些关键挑战，如依赖于大量历史数据集、在不同背景中的泛化问题、模型产生幻觉的现象、模型知识范围的局限性以及需要大量计算资源等，这些挑战阻碍了它们更广泛的应用和有效性。通过详细分析，本综述讨论了克服这些障碍的潜在解决方案和策略，如整合多模态数据，学习方法的进步以及强调模型可解释性和计算效率。此外，该综述还概述了可能影响 LLMs 在这些领域中发展的关键趋势，包括朝向实时处理、可持续建模实践的重要性和跨学科合作的价值。最后，该综述强调了 LLMs 对预测和异常检测可能产生的转变性影响，同时强调了持续创新、道德考虑和实际解决方案的需求以实现其全部潜力。

Feb, 2024

大型语言模型引导的时间序列异常检测的知识蒸馏

通过知识蒸馏，以大型语言模型 (LLM) 为基础训练的教师网络来训练学生网络以检测时间序列异常，利用原型信号和合成异常样本的策略，AnomalyLLM 在 15 个数据集中表现出最先进的性能，在 UCR 数据集中提高了至少 14.5％的准确性。

Jan, 2024

大型语言模型在临床文本匿名化中的潜力开发：一项比较研究

自动化临床文本匿名化有潜力在保护患者隐私和安全的同时促进医疗数据的广泛共享，本论文提出了基于大型语言模型的新评估指标，并通过与基准技术的比较研究证明了大型语言模型在临床文本匿名化领域的可靠性，为可信的临床文本匿名化铺平了道路。

May, 2024

LLMaAA：构建大型语言模型用于主动标注

通过使用大型语言模型作为注释者，并将其放入主动学习循环中，我们提出了 LLMaAA 方法，充分发挥大型语言模型的潜力并有效利用大量无标签数据，提高效率和可靠性，并且在命名实体识别和关系抽取等自然语言处理任务上取得了超过其他基线方法的更高性能。

Oct, 2023

AnomalyLLM: 动态图中使用大型语言模型进行少样本异常边缘检测

利用大型语言模型的知识，提出了一种名为 AnomalyLLM 的方法，通过与动态图配合使用，进行边缘重编程和上下文学习，实现少样本异常检测，并在实验中取得显著的性能提升和对新异常的优越结果。

May, 2024

大型语言模型可提供准确且可解释的时间序列异常检测

LLMAD 是一种新的时间序列异常检测方法，采用大语言模型（LLMs）提供准确而可解释的结果，通过在上下文中的检测来检索正面和负面的相似时间序列片段，并采用 Anomaly Detection Chain-of-Thought（AnoCoT）方法模仿专家逻辑进行决策过程，为用户决策提供解释。

May, 2024

推进异常检测：使用 LLMs 进行非语义金融数据编码

利用大型语言模型对金融数据中的异常检测进行研究，通过测试三个预训练通用句子转换模型和五个优化过的机器学习模型，发现大型语言模型对异常检测是有价值的，特别是在金融账目条目中处理特征稀疏性方面的有效性。

Jun, 2024

基于锚定的大型语言模型

本研究引入了基于锚点的 LLM (AnLLM) 模型，该模型利用了一种创新的基于锚点的自注意力网络 (AnSAN) 和一种基于锚点的推理策略，将序列信息压缩到锚点令牌中，从而减少键 / 值缓存并提高推理效率。实验证明，AnLLM 在保持可比精度的同时缩减了 99% 的键 / 值缓存，并实现了高达 3.5 倍的更快推理速度。尽管在精度上有轻微折衷，AnLLM 在计算效率和资源利用方面具有显著改善，展示了锚点式注意力方法在实际应用中对于实时推理的潜力。

Feb, 2024