AI 论文速递

最新

识别嵌套术语的方法
本文探讨了在RuTermEval竞赛中提取嵌套术语的问题。作者应用Binder模型成功地从非嵌套标签的平面训练数据中提取嵌套术语，并在竞赛中取得了最佳的术语识别结果。研究表明，所提出的几种方法在有效检索嵌套术语方面是可行的。
PDF2 days ago
成本-aware 提示优化
本研究解决了大型语言模型（LLMs）在提示优化中的高成本问题，提出了一种创新的算法CAPO，通过集成自动机器学习技术提高提示优化的效率。研究表明，CAPO在多个数据集和LLM的实验中，在11个场景中表现优于当前的最先进的离散提示优化方法，显
PDF2 days ago
你的注意力有多私密？隐私与上下文学习的桥梁
本研究解决了上下文学习（ICL）在正式隐私约束下的可行性问题，提出了一种差分隐私预训练算法并进行理论分析。研究发现，优化与隐私引入的噪声之间存在基本的矛盾，并且该方法在训练提示的对抗干扰下表现出鲁棒性，具有重要的实践意义。
PDF2 days ago
OPUS-VFL：激励垂直联邦学习中的最佳隐私-效用权衡
本研究解决了垂直联邦学习（VFL）系统中缺乏有效激励机制、隐私与效用权衡不足以及客户端资源异质性的挑战。提出的OPUS-VFL引入了一种新颖的隐私感知激励机制，根据模型贡献、隐私保护和资源投资进行奖励。实验结果显示，OPUS-VFL在效率和
PDF2 days ago
基于MindSpore框架的少量样本仇恨言论检测
本研究解决了社交媒体上仇恨言论检测在少量样本或低资源环境中表现不佳的问题。提出了一种名为MS-FSLHate的框架，该框架结合了可学习提示嵌入、CNN-BiLSTM骨干网络和同义词对抗数据增强，显著提高了检测的准确性和适应性。实验结果表明，
PDF2 days ago
基于W-PCA的无梯度代理模型以高效搜索轻量级语言模型
本研究针对轻量级语言模型的高效自然语言处理需求，提出了一种新颖的无梯度代理评估方法W-PCA。该方法通过利用参数计数和主成分数，优化了轻量级模型设计与评估的效率，显著减少了训练时间，并在GLUE和SQuAD数据集上取得了优于现有方法的测试成
PDF2 days ago
大型开源软件库中的缺陷命运预测：通过情感分析和BERT主题建模
本研究解决了大型开源软件库中缺陷相关结果预测的问题，包括解决时间、修复时间及缺陷最终状态。我们提出了一种新方法，结合情感分析及BERTopic模型，利用尚未解决的缺陷特征来增强预测的准确性。研究发现，情感分析在缺陷最终结果预测中具有重要价值
PDF2 days ago
软max注意力的普适逼近性
本研究解决了自注意力模型在序列映射中的普适逼近性问题。通过引入一种新的基于插值的方法，证明了两层自注意力和一层自注意力后接软max函数可以逼近任意连续函数。研究结果表明，仅使用两层多头注意力即可实现序列到序列的普适逼近，显示出该方法在上下文
PDF2 days ago
FairTranslate：一种用于评估机器翻译中性别偏见的英法数据集，突破性别二元性
本研究关注大型语言模型在翻译任务中对包容性语言的处理，特别是如何评估机器翻译中的非二元性别偏见。提出的FairTranslate数据集通过2418对英法句子及其注释，揭示当前主流语言模型在性别代表性方面存在显著偏差，强调了需要采取集中策略以
PDF2 days ago
基于元实体的三元组挖掘在医疗视觉语言模型对齐中的应用
本研究解决了现有医疗视觉语言模型在图像与文本对齐中存在的不足，尤其是在细粒度病理属性的区分上。提出的MedTrim方法通过元实体导向的三元组学习，能够更好地保留临床上重要的类内变异，从而在下游检索和分类任务中显著提升性能，对医疗影像解读具有
PDF3 days ago
无技术障碍的眼科图像分析临床友好平台
本研究解决了现有AI医疗影像模型在不同临床中心应用时需要重新训练的问题，限制了其广泛采用。通过GlobeReady平台，该研究提出了一种无需技术专业知识的眼病诊断方法，且在多种影像模式下具有高准确率，显示出对眼科护理的潜在支持能力。
PDF3 days ago
新型半监督社群检测方法：在结晶动力学下的Clique Annealing
本研究解决了现有半监督社群检测方法在社群核心候选选择不合理和可扩展性差的问题。通过将结晶动力学与社群检测相结合，提出了CLique ANNealing（CLANN）方法，该方法利用动力学原理优化社群核心的一致性，并实现邻近团体的合并与重新定
PDF3 days ago
通过不确定性量化实现联邦学习中的分配公正
本研究针对联邦学习中客户端公平性度量的选择问题，提出了一种名为UDJ-FL的灵活框架，实现多种基于分配公正的客户端公平性指标。研发中的技术既考虑了公平资源分配，也利用了基于不确定性的客户端加权，验证了UDJ-FL在实现公平性方面的有效性及其
PDF3 days ago
Ask2Loc：通过提问学习定位指导性视觉答案
本研究解决了在指导性视频中定位特定片段的难题，提出了一个新任务In-VAL，模拟人类与视频多次互动获取视觉答案的过程。通过Ask2Loc框架，研究引入了聊天、重写和搜索三大模块，有效应对用户意图模糊、字幕语言不全和视频内容片段化等问题，其性
PDF3 days ago
大型开源项目中的自动化缺陷报告优先级排序
本研究解决了大型开源项目中如何有效管理大量缺陷报告的挑战，尤其是在资源有限的情况下。提出了一种基于自然语言文本的自动化缺陷优先级排序新方法，利用TopicMiner-MTM进行主题建模和BERT进行文本分类，显著提升了优先级预测的精确度和可
PDF3 days ago
GraphEdge：边缘网络中的动态图划分与任务调度用于图神经网络
本研究解决了边缘计算中图结构场景下用户数据高度相关的任务调度问题，现有方法在此类应用中表现不佳。提出的GraphEdge架构通过分层遍历图切割算法优化图布局，并利用深度强化学习实现了高效的任务卸载策略，显著降低了任务处理时间和能耗。实验结果
PDF3 days ago
噪声对大型语言模型在抽象与推理任务中的性能影响及模型温度考虑
本研究探讨了大型语言模型（LLMs）在抽象与推理任务中的表现，尤其是在噪声和温度变化下的表现差异。研究发现，噪声的引入普遍削弱了模型性能，暴露了当前LLMs在处理输入扰动时的脆弱性，这一发现对提升模型的泛化能力和适应现实环境的能力具有重要意
PDF3 days ago
SARI：通过课程引导强化学习实现结构化音频推理
本研究解决了音频语言推理中强化学习模型推理能力如何转移的缺口，提出了SARI模型，通过课程引导的强化学习方法进行结构化音频推理。研究发现，该模型显著提高了推理准确率，并且明确的结构化推理和课程学习能有效增强音频语言理解能力。
PDF3 days ago
推理模型中的动态提前退出
本研究针对大型推理语言模型（LRLMs）在处理复杂任务时的效率和准确性问题，提出了一种简单有效的方法，通过在生成过程中动态提前退出，解决冗长推理链引发的过度思考与准确性下降的问题。实验表明，该方法在多个推理基准上显著提高了准确性，并减少了推
PDF3 days ago
支持数据框动态的人工智能辅助决策
本研究解决了当前人工智能决策支持系统在高风险决策中对不断变化的证据和假设之间互动支持不足的问题。我们提出了一种基于数据框理论和评估性人工智能范式的混合主动框架，该框架使人类与人工智能能够协作构建、验证和调整假设。通过开发一个人工智能辅助的皮
PDF3 days ago