specialization | BriefGPT - AI 论文速递

关键词specialization

搜索结果 - 16

使用同期定义和语义关系对语义变化类型进行分类
通过构建模型，本文提出一种检测词义变化类型的方法，利用同步词汇关系和词义定义的信息，通过在 WordNet 上使用同义词集定义和层次信息，在 Blank（1997）的语义变化类型数据集的数字化版本上进行测试，最后展示了感觉关系如何提高语义相
PDFa month ago
CVPR医学基础模型的低秩知识分解
本文通过知识分解的方法，设计了一种名为 Low-Rank Knowledge Decomposition (LoRKD) 的新型框架，将医学基础模型拆分为多个轻量级专家模型，以提高特定医学任务的性能和专业化，并在资源消耗上达到平衡。实验结果
PDF2 months ago
Sabiá-2: 葡萄牙大规模语言模型的新一代
Sabi'a-2 是一种基于葡萄牙语文本训练的大型语言模型，通过在各种考试中进行评估，包括巴西大学的入学考试、专业认证考试以及各种学科的研究生考试，发现 Sabi'a-2 Medium 在 64 场考试中有 23 场性能超过或与 GPT-4
PDF4 months ago
多线性专家混合模型：通过分解实现可扩展的专家专业化
通过使用 Multilinear Mixutre of Experts (MMoE) 层来缩放专家的数量，从而实现图像模型的细粒度特化，并通过定性和定量的证据证明了其与线性层具有相当的性能，同时进一步协助修正 CelebA 属性分类中的人口
PDF4 months ago
TMComposites: 专业特化 Tsetlin 机器的即插即用协作
Tsetlin Machines (TMs) 的组合（TM Composites）利用 TMs 的特化和判断能力，在团队合作中通过选择最自信的 TMs 来取得更优越的性能，提高了图像分类任务的准确性，并成为具有新的最先进结果的方法。
PDF10 months ago
IJCAI多智能体团队学习的更深层理解
研究团队结构在群体学习中的影响，结果显示，某些团队结构帮助代理程序学习特定角色，从而获得更有利的全局结果；然而，大型团队创建的信用分配挑战降低了协调性，导致大型团队表现不如小型团队。
PDFa year ago
基于图的时空预测中的局部效应控制
本文旨在理解全局性和局部性在基于图的时空预测中的相互作用，并同时提出了一种方法论框架来合理化在这些结构中包含可训练节点嵌入的实践，通过在多个实验中提供强有力的经验证据和指导，我们论证了如何将图形模型专业化以适应每个时间序列的规律，展示了这个
PDFa year ago
设计混合专家作为模块化多任务学习者
该研究提出了 Mod-Squad 模型，使用模块化结构将组内的专家与任务相匹配，并在训练过程中优化匹配过程以对抗多任务学习的挑战。实验表明本方法在任务数量和训练集规模扩大时表现强于其他方法。
PDF2 years ago
ACLMulti2WOZ: 一个强大的多语言数据集和面向任务型对话的预训练
本文介绍了 Multi2WOZ 多语言多领域任务导向对话数据集，并提出了一种用于传输任意下游任务的多语言对话 PrLM 的新框架，证明了在多数情况下，最佳表现是将（I）针对目标语言的会话专业化与（ii）少次转移结合在一起，并且我们展示了针对
PDF2 years ago
ICMLROMA：具有新兴角色的多智能体强化学习
本文提出了一种基于角色的多智能体强化学习框架，称为 ROMA，用于推进 StarCraft II 微观管理基准测试的艺术水平，该框架中的角色是新兴的，代理人倾向于在某些子任务上专业化，并添加了新的规则器来构建随机的角色嵌入空间。
PDF4 years ago
ICML有限宽度和输入维度的深度 ReLU 网络中的学生专业化
本文提出了一种通过梯度下降法训练 ReLU / Leaky ReLU 模型的方法，以实现两层和多层神经网络的节点专业化，证明了在适当的数据集和网络间条件下，该模型可实现特定形式的数据增强，获得固定大小的样本集，并展现出神经元节点的最小化分歧
PDF5 years ago
递归独立机制
本篇文章介绍了一种全新的循环神经网络结构 RIMs，该结构可学习反映环境动态的模块化特征，具有更好的泛化性和适应性，通过对 RIMs 的专业化策略，可以在某些变量因素在训练和测试过程中发生系统性变化的任务上实现显著的改进。
PDF5 years ago
一种面向分层决策系统专业化的信息论在线学习原理
研究信息 - 理论有限理性的决策者组合问题，并提出了一种基于在线学习规则的问题空间的分区方案，旨在通过特定线性策略求解提高效率和减少成本。该模型适用于分类，回归，强化学习和自适应控制等领域。
PDF5 years ago
ACL为词汇蕴涵专门化的词向量
该论文提出了一种新的后处理方法 LEAR（词汇蕴涵吸引 - 排斥），将任何输入的词向量空间转换为重视词汇蕴涵关系（LE）的不对称关系，通过将外部语言约束（例如 WordNet 链接）注入到初始向量空间中，LE 特化过程将真正的下位词 - 上
PDF7 years ago
ICML决定如何决策：人工神经网络中的动态路由
我们提出并系统评估了三种训练动态路由人工神经网络的策略：通过学习变换的图形，不同的输入信号可以采取不同的路线。我们发现，在训练用于分类图像的动态路由网络中，层和分支变得专门处理不同类别的图像。此外，给定固定的计算预算，动态路由网络往往比可比
PDF7 years ago
ACL领域专门化：神经机器翻译的后训练领域适应
本文提出了一种在机器翻译中称之为 “专业化” 的领域适应方法，对该方法进行了探索，并发现其在学习速度和适应精度方面的结果表现出色。该方法尤其适用于计算机辅助翻译（CAT）中的人类后期编辑工作流程，特别是在术语、领域和风格适应方面。
PDF8 years ago