- 参数化量子比特态的量子纠缠检测的经典贪婪算法
量子纠缠检测中的多臂赌博机问题探索与机器学习方法应用潜力的研究。
- 基于高斯过程的锂离子电池系统健康监测与故障分析
应用高斯过程电阻模型对锂铁磷酸盐电池的实测数据进行分析,实现了对时间依赖性和工作点依赖性电阻的有效分离,进而通过递归时空高斯过程开发了概率性故障检测规则,能够进行高效的在线监测,进一步深入了解电池组在实际应用中的失效过程。
- 揭示隐藏的意图:探索用于深入了解生成文本的提示恢复
本研究尝试超越检测 AI 生成内容的范畴,致力于恢复生成文本所用的提示,通过零样本学习、少样本上下文学习以及 LoRA 微调取得了令人满意的结果,并验证了使用半合成数据集的优势。
- 解耦泛化深伪造检测的伪造语义
我们提出了一种新颖的方法,通过语义解耦来检测 DeepFakes,提高检测的泛化能力。
- Bi-DCSpell: 一个双向检测 - 纠错交互框架用于中文拼写检查
中国拼写检查(CSC)旨在检测和纠正中文句子中可能存在的拼写错误字符。本文提出了一种双向检测 - 纠正框架(Bi-DCSpell),通过引入交互学习模块促进检测和纠正之间的双向特征交互,以改善它们的表示学习,从而在广泛使用的基准数据集上展示 - ACL通过通用语言模型实现的检测纠正结构用于语法错误校正
本研究介绍一种名为 DeCoGLM 的综合检测和纠错结构,通过使用 General Language Model (GLM) 为基础,提供了在单个模型中进行多任务学习的方法,并表明该结构在大型语言模型中的有效性,为语法纠错提供了一个有前途的 - 大型语言模型中用于低熵和无偏生成的水印
近期大型语言模型的发展突显了滥用的风险,并引发了对于精确检测大型语言模型生成内容的担忧。本研究提出了一种名为 STA-1 的无偏水印方法,该方法在检测过程中不需要获取大型语言模型,也不需要提示信息,并且对于水印检测的第二类错误提供了统计保证 - BiomedParse:一种针对一切地方一次性进行图像解析的生物医学基础模型
BiomedParse 是一个用于生物医学图像分析的全能工具,通过联合解决分割、检测和识别等主要生物医学图像模态,为高效准确的基于图像的生物医学发现铺平了道路。
- 针对矛盾对话的红队语言模型
通过探索一种新的矛盾对话处理任务,该研究试图检测和修改会话中的矛盾陈述,以减轻当前语言模型在对话中自相矛盾的问题,并通过开发一个数据集和一个 Red Teaming 框架展示了该任务的有效性,强调了在对话式人工智能中逻辑不一致问题的重要性。
- 利用量子迁移学习进行糖尿病视网膜病变检测
利用深度学习和量子转移学习的结合,我们的混合量子模型在检测和诊断糖尿病视网膜病变方面取得了显著的结果,潜在地能够挽救许多人免于失明的风险。
- 生成式人工智能时代的合成图像验证:暂有何窍门与何需进一步完善
该研究综述了关于合成图像的检测和归因方法,突出了它们的优点和局限性,同时指出并讨论了该领域的热门话题,概述了未来研究的有希望的方向。
- 将错误关系整合到提示中,以改进 LLM 对逻辑错误的分类
研究表明,使用对编程语法进行训练的 LLMs 可以有效地帮助开发人员,如生成编码问题示例或提供代码解释,此外,通过利用错误类型之间的关系,通过 LLMs 检测逻辑错误的方法比无关系描述的方法平均分类性能高约 21%,因此我们的研究可以帮助初 - 应用深度学习和放射学技术检测胰周水肿
该研究介绍了一种源自 255 名胰腺疾病患者的新型 CT 数据集,其中包括用于胰周水肿诊断的带有标注胰腺分割掩模和相应诊断标签的数据。通过该数据集,我们首先评估了基于线性 Transformer 的 LinTransUNet 模型在从 CT - 应用机器学习检测食品中的霉菌毒素:综述
从事机器学习方法在食品安全行业中,尤其是检测霉菌毒素和其他食品成分的存在方面的研究,探讨了近年来机器学习应用的优势、挑战和未来发展潜力,以及对数据和代码的公开获取有关的疑虑。研究结果显示,尽管多数研究主要利用神经网络进行霉菌毒素的检测,但在 - 构建对抗 LLMs 幻觉的基准和干预措施
大语言模型容易产生幻觉,本文提出了一种基于模型知识构建数据集的方法,用于在封闭式和开放式问答环境中检测和干预。我们对干预的不同选择,如干预组件(多层感知机,注意力模块,残差流和特定头部),干预的频率和强度进行了特征化,并发现干预的成功与组件 - 小型无人机定位与识别的多阶段融合架构:基于无源射频和 EO 图像的案例研究
使用无人机的无源射频和电光图像数据进行多阶段融合架构的开发,以提高整体跟踪和分类能力,并结合 RF 指纹识别为无人机提供唯一设备标识。
- 隐含有害内容的目标跨度检测
通过收集并标注三个主要的暗含仇恨言论数据集(SBIC,DynaHate 和 IHC),我们定义了一个新的任务,旨在识别暗含仇恨言论的目标,并利用人类注释和大型语言模型(LLM)的匹配分数来实现这一目标。实验表明,Implicit-Targe - HateCOT: 通过大型语言模型增强解释性的通用冒犯性言论检测数据集
社交媒体的普及性使得需要可靠高效地检测有害内容以限制其负面影响。本文介绍 HateCOT 数据集,该数据集包含 52000 个样本,来自多个不同来源,并使用 GPT-3.5-Turbo 和人工筛选生成解释。我们展示在 HateCOT 上对于 - TransLandSeg: 基于视觉基础模型的滑坡语义分割的迁移学习方法
使用迁移学习的方法,提出了一种基于视觉基础模型 (VFM) 的滑坡语义分割方法 TransLandSeg,其通过训练 SAM 的 1.3% 的参数数量,将其强大的分割能力成功转移到滑坡检测中,从而大大提高了模型的训练效率。通过对不同 ATL - WWWMCFEND:面向中文假新闻检测的多源基准数据集
我们构建了中国首个多源虚假新闻检测基准数据集 MCFEND,该数据集由来自多种社交平台、消息应用和传统在线新闻机构的新闻组成,并且这些新闻已经经过了全球 14 个权威事实核查机构的事实核查。我们对现有的多种中国虚假新闻检测方法在我们提出的数