neural models | BriefGPT - AI 论文速递

关键词neural models

搜索结果 - 421

WSDM拷贝还是不拷贝：神经序列推荐模型中的输出 Softmax 层是一个关键问题
最近的研究表明，现有的神经模型在处理顺序推荐任务中的重复项目时存在困难。然而，我们对这个困难的理解仍然有限。通过识别问题的主要来源 —— 输出 softmax 层中的单一隐藏状态嵌入和静态项目嵌入的相似性结构，本研究在该领域取得了显著的进展
PDF8 months ago
EMNLPRSVP：通过代理响应对比和生成式预训练实现客户意图检测
我们提出了 RSVP 框架，通过在自我认知的方式下利用代理响应进行预训练，以增强对客户意图的准确识别，并对两个真实世界的客户服务数据集进行了实验，结果显示 RSVP 在准确性、MRR@3 和 MRR@5 等方面明显优于现有方法。
PDF9 months ago
通过解耦上下文表示学习和结构信息传播重新审视图形意义表示
在自然语言理解领域中，神经模型和图形意义表达（GMR）的交叉点仍然是一个引人注目的研究领域。本文通过引入 DAGNN-plus，一种简单且参数高效的神经架构，将上下文表示学习与结构信息传播解耦，从而填补 GMR 的确切影响的空白。通过与各种
PDF9 months ago
PHYDI：使用参数化的超复杂神经网络初始化为恒等函数
通过研究参数化超复数身份初始化方法，提出了改善参数化超复数神经网络 (PHNNs) 在不同规模下的收敛性能，减少迭代次数并提高鲁棒性的方法。
PDF9 months ago
自动发音评估的新型损失函数：保留音素区分的序数回归
我们提出了一种训练基于回归的自动发音评估模型的方法，通过引入音素 - 对比次序（PCO）损失函数，从而更好地保留了音素类别之间的区分度和回归目标输出的顺序关系，并在一些现有的最先进模型上进行了可行性和有效性的实验证明。
PDF9 months ago
动态模块化推理用于构成结构化解释生成
我们提出了一个新的结构化解释生成任务的设置，以促进组合推理研究，并通过模块化的推理模型 MORSE 来提高神经模型的组合泛化能力。实验证明 MORSE 的动态推理模块和泛化能力的有效性。
PDF10 months ago
基于多标签的吉尔吉斯语主题分类评估
我们提供了一个针对柯尔克孜语的主题分类的新公共基准，介绍了一个基于来自新闻网站 24.KG 的收集和注释数据的数据集，并提出了多标记设置下新闻分类的几个基准模型。我们训练和评估了经典统计模型和神经模型，报告了分数，讨论了结果，并提出了未来工
PDF10 months ago
大型语言模型在信息检索中的应用：综述
信息检索系统和大型语言模型的融合，包括关键方面，如查询重写、检索、重新排序和阅读器，在这一快速发展的研究领域中提供全面的概述和深入的见解。
PDFa year ago
ICCVFunnyBirds：用于可解释 AI 方法的基于部件分析的合成视觉数据集
通过使用一个名为 FunnyBirds 的新型合成视觉数据集以及相应的自动评估协议，我们解决了解释性人工智能（XAI）领域中的一个挑战，该领域旨在揭示复杂深度神经模型的内部工作方式。使用我们的工具，我们对 24 种不同的神经模型和 XAI
PDFa year ago
VN-Solver: 基于视觉的图像组合优化神经求解器
基于视觉方法的神经模型解决图优化问题的性能与矩阵方法相当，为发展数据驱动优化求解器开辟了新的途径。
PDFa year ago
KDDMAP: 用于点击率预测的模型无关预训练框架
基于大规模用户点击日志的自我监督学习对于点击率（CTR）预测仍然是一个开放性问题，而我们提出了一个无模型的预训练框架，利用特征破坏和恢复，挖掘多领域分类数据的特征交互，并通过两种实用的算法（即遮蔽特征预测和更替特征检测）进一步优化 CTR
PDFa year ago
中文拼写检查的全面评估和分析研究
开发预训练模型和结合语音和图像信息使神经模型在中文拼写检查方面取得了高分，该研究通过构建不同目的的综合测试集，实现了这一典型模型范式并进行了实验，在结果的详细分析中发现了四个重要发现。
PDFa year ago
使用 ChatGPT 进行神经机器翻译数据生成和增强
使用生成式语言模型创造虚构平行语料库是对手动平行语料库的一个替代方案。我们的实验发现，虚构语料库可以为小型手动采集的语料库补充数据，从而提高翻译信号的质量。
PDFa year ago
验证神经模型训练数据的工具
为了评估神经模型的能力和风险，我们引入了一种名为 “Proof-of-Training-Data” 的概念，该概念包括了一些协议，使模型训练者能够向验证者证明所产生的一组模型权重的训练数据。我们研究了与大部分当前的大型模型训练程序兼容的 P
PDFa year ago
ACL带音韵特征的形态变化
本研究探索了通过不同方式获取亚字符音韵特征对形态学模型、尤其是重音和分析的效果，通过语言特定的语法从标准文字数据中引出音素数据，并用两种重音模型在八种语言中进行实验。
PDFa year ago
KDD基于神经模型的事实不一致分类及解释
本文提出一种基于物理学的方法，正式定义了文本中五种事实不一致的类型，并依此将一些文章注释为数据集。我们使用这个数据集来训练一个神经模型，以预测在 (索赔、上下文) 句对中的矛盾类型和矛盾实体类型 (当矛盾是由实体引起时)
PDFa year ago
美洲土著语言的神经机器翻译：介绍
介绍了用于低资源语言机器翻译的神经模型的挑战、概念和技术，最后讨论了 NLP 社区对这些语言的兴趣所带来的最新进展和发现。
PDFa year ago
STEPS：顺序任务中顺序推理能力的基准测试
提出了一个基于序列任务的具有挑战性的基准测试 STEPS，它包括两个子任务设置，聚焦于确定食谱中给定下一步的合理性和从多项选择题中选择合理步骤，通过实验结果说明了序列任务中的常识推理具有挑战性，并且提示方法在 STEPS 上仍然明显落后于基
PDFa year ago
Jambu 南亚语言历史语言数据库
Jambu 是一个统一了许多之前资源的、结构化和易于获取的南亚语言同源数据库，它包含来自 602 个方言的 287,000 个词元，这些词元分成了 23,000 个同源集。我们概述了必要的数据处理方法，并针对数据的印度 - 雅利安子集训练了
PDFa year ago
交互式文本摘要编辑
通过 REVISE 框架，将神经网络模型及人工编辑相结合，使得文本摘要的过程个性化，协作化和自适应化。
PDFa year ago