- 在动态系统建模中可学习和可解释的模型组合
将不同类型的模型进行组合,提出了一种模型接口和新的通配拓扑方法,解决了代数环和不连续模型中的本地事件影响函数的挑战,并通过证明不同模型之间的连接拓扑关系来验证了方法的有效性。
- CVPR引导视觉转换器的视觉提示学习
通过在输入图像中引入视觉提示信息,本研究旨在为视觉变换器模型设计学习视觉提示,以引导其注意力集中在图像的特定区域,通过自监督学习的方式进行优化,实验结果表明该优化策略在各种预训练视觉编码器中的效果显著。
- ViSpeR: 多语言音视频语音识别
该研究在中文、西班牙语、英语、阿拉伯语和法语这五种常用语言上,对音视频语音识别(AVSR)进行了广泛而详细的研究。通过收集大规模的数据集并进行有监督学习模型的训练,在多语言环境中训练的 ViSpeR 模型在每种语言的最新基准测试中表现出竞争 - ACL对话中精细分析心理操纵的数据集
心理操纵是人际对话中一种具有挑战性的滥用形式,检测操纵性语言对保护潜在受害者至关重要;然而,自然语言处理领域目前在这一主题上面临资源和研究的匮乏。本研究通过引入名为 MentalManip 的新数据集,包含 4,000 个已标注的电影对话, - 波斯同音词消歧:利用 ParsBERT 提升句子理解力的新词义消歧数据集
我们引入了一个新的波斯同音异形词消歧数据集,对各种嵌入进行了全面探索,并通过余弦相似度和分类等下游任务来评估其有效性。我们训练了多种机器学习和深度学习模型进行同音异形词消歧,并在准确度、召回率和 F1 分数等方面对模型的性能进行了细致分析, - Spivavtor: 一种针对乌克兰文本编辑的指令调整模型
介绍了 Spivavtor,这是一个基于乌克兰语的文本编辑数据集和指导模型。Spivavtor 在乌克兰语中通过遵循指令进行文本编辑任务,通过评估在多种乌克兰语的文本编辑任务中的性能表现,如语法错误纠正、文本简化、连贯性和改写,并且展示其在 - COLING薛定谔的门槛:当 AUC 不能预测准确度
使用 AUC 度量方式评估和比较不同模型,但该方法在应用中可能与实际精度偏差较大,因此需探索不同的校准模式和测试校准数据与方法来获取更真实的模型性能。
- 图像地理定位估计中的区域偏见:以 SenseCity Africa 数据集为案例研究
人工智能的进展受到训练模型使用的数据集中的偏见的挑战。在图像地理定位估计中,模型通常使用特定地理区域(尤其是西方世界)的数据进行训练,因此他们可能难以理解未被充分代表的地区的复杂性。为了评估这个问题,我们使用最先进的图像地理定位估计模型(I - CommitBench:Commit 消息生成的基准测试
通过创建高质量数据集和目标性评估来自动化编写提交消息,从而节省软件开发人员的时间;本研究提供了一个新的大型数据集 CommitBench,采用了最佳实践方法,用于生成提交消息,并使用该数据集比较不同的模型,展示了基于源代码预训练的 Tran - 高斯过程预测与蒙特卡洛采样的融合
本文介绍了应用于科学和工程领域的模型,利用贝叶斯范式和高斯过程生成概率密度函数(pdfs),通过蒙特卡洛抽样来集成这些 pdfs,并通过线性和对数线性汇集方法介绍了对预测 pdfs 的输入相关权重的确定方法,使用合成数据集验证了这些方法的性 - 几何图神经网络综述:数据结构、模型与应用
基于几何信息传递的数学预备知识,本论文从现有模型的角度提供了对几何图神经网络的统一视角,并总结了其应用以及相关数据集,以促进后续方法开发和实验评估的研究,同时还讨论了几何图神经网络的挑战和未来潜在方向。
- 实验室大鼠自动癫痫检测的多模态机器学习框架
该研究论文提出了一种多模态机器学习系统,通过结合来自多个独特数据源和类型的结果以提高性能。通过对癫痫大鼠收集的多种类型的数据进行训练和分类,论文表明通过后处理和组合技术,该系统在分类准确性方面优于每个单独数据源的性能。
- 北明屋:学习舱系统
该论文描述了第一个开源的学软入口系统 Beimingwu,为学软范式未来的研究提供了基础支持。
- 解决非相交类别识别问题的代数方法
本论文提出了考虑各种模式识别模型,并提出了以识别算子和决策规则形式考虑模型的方法。在识别算子上引入了代数运算,并基于这些算子的应用创建了一族识别算法。同时对该模型构建了上估计,以保证扩展的完备性。
- ProLex:面向语言能力的词汇替换基准
通过 PropLex 基准和模型,我们提出了一项新的任务,即面向语言熟练度的词汇替换,并展示了使用特定任务合成数据对 Llama2-13B 模型进行微调的最佳模型,在 F-score 上超过 ChatGPT 平均 3.2%,并在 ProLe - 混合是你所需的一切:更便宜、更好的兆参数 LLM 的替代方案
研究表明,通过 “混合” 策略集成多个中小型模型可以在不增加计算资源需求的情况下,实现与较大型模型相媲美或超越其性能指标。
- 机器学习中数据的层次表示
当多个数据点有明确的判断结果的模型存在时,大多数模型可能表现出一种关系,即如果它们正确判断了一个目标,它们也会正确判断另一个目标。相反,如果大多数模型错误地判断了一个目标,它们也可能错误地判断另一个目标。我们提出了一种可视化目标之间层级关系 - Transformer 简介:自然语言处理视角
介绍了 Transformer 基本概念,描述了标准 Transformer 架构,包括一系列模型细化和常见应用,主要关注有助于理解 Transformer 及其变体的概念和对该领域产生影响的关键思想,从而揭示了这些模型的优势和局限性。
- 自然语言处理健壮性中的胜利回声间传来的疑虑
NLP 中的鲁棒性问题仍未解决,对模型鲁棒性的评估方法也需要重新评估。
- EMNLPATHENA: 数理推理中的思维扩展
使用注意力机制的 THought Expansion Network Architecture (ATHENA) 模型通过模仿人类思维扩展机制中的神经网络传播形式,解决实际世界的数学问题挑战,并在训练示例信息受限的情况下,在各种问题中取得了