neural network model | BriefGPT

关键词neural network model

搜索结果 - 114

使用蒙特卡罗树搜索的策略梯度算法用于非马尔可夫决策过程
本文介绍一种结合 Policy Gradient 和 Monte-Carlo Tree Search 的混合策略，旨在克服两种方法在应对非马尔可夫决策过程上的困难，有效提升算法的效率。
PDF2 years ago
使用深度学习预测非平稳销售时间序列
该论文描述了一种深度学习方法，利用时间趋势修正在神经网络模型中预测非平稳时间序列。结果表明，在深度学习模型中加入时间趋势修正块可以显著提高非平稳销售的预测准确性。
PDF2 years ago
对比有监督蒸馏用于连续表示学习
本文提出了一种名为对比监督蒸馏（CSD）的训练过程，用于解决连续表征学习中的灾难性遗忘问题，如何通过利用蒸馏设置中的标签信息来降低特征遗忘并学习有区别力的特征，从而使学生模型从教师模型中进行对比学习，在视觉检索任务中缓解灾难性遗忘，且表现优
PDF2 years ago
CVPR在训练一次性全局网络时是否存在干扰现象？
该研究提出一种名为 Once-For-All (OFA) 的方法，使用逐步缩小（PS）的方法来训练子网口。他们发现在小的到中等大小的数据集上，没有足够的证据支持对抗干扰的缓解策略的必要性，并且利用名为 Random Subnet Sampl
PDF2 years ago
通过文本块的语义分类检测套用文本
介绍了一种名为 SemText 的分层神经网络模型，它使用一种新颖的 HTML 标签、类名和文本块的语义表示来检测 HTML 模板，在三个已发表的新闻网页数据集上训练并微调，在 CleanEval 和 GoogleTrends-2017 中
PDF2 years ago
具有对称性保持的神经网络模型实现精确的系统发育推断
本文提出了一种新的神经网络模型，在长支吸引（LBA）情况下优于标准的系统发育方法和其他神经网络实现方式，并且与现有的神经网络模型不同之处在于，我们的模型自然考虑到树的同构性，通过排列不变函数这一方法得出的结果在内存使用上更为高效，并可无缝地
PDF2 years ago
ICMLSAFL：一种自注意力场景文本识别器，有关注损失
本文提出了一个基于自注意力和 STN 的神经网络模型用于场景文本识别，引入 focal loss 训练模型以便更好地关注低频样本，在七个基准测试中得到了最佳结果。
PDF3 years ago
MM联邦 Dropout—— 一种简单的方法，在资源受限设备上实现联邦学习
本文提出一种名为 Federated dropout (FedDrop) 的联邦式学习方案，该方案利用经典的 dropout 算法进行随机模型修剪。该方案可在减少通信开销和设备计算负载的同时，表现出比传统的 FL 和具有相同概率的子网的 F
PDF3 years ago
MMEvilModel：将恶意软件隐藏在神经网络模型内
本文提出了一种新的利用神经网络模型来隐蔽地传递恶意软件的方法，通过将恶意软件嵌入神经元，使得恶意软件可以在不影响神经网络性能的情况下进行传递，同时再无需担心被杀毒软件检测到，实验结果验证了该方法的可行性，这种方法利用人工智能的广泛应用，成为
PDF3 years ago
ACL一个老师会怎样？预测未来的话语举措
本文介绍了一种基于自然语言处理和神经网络模型的未来对话策略预测方法，可提高课堂教学体验和学生参与度。
PDF3 years ago
WSDM基于注意力机制的神经重排方法用于旅途中的下一个城市推荐
提出一种两阶段的方法来解决旅游预订系统中下一个目的地城市推荐问题，采用启发式方法进行候选选择和基于注意力神经网络模型的候选人重新排序，使用该方法在 Booking.com 挑战赛上获得第 5 名，使用了学习排序方法和自然语言处理中的 tra
PDF3 years ago
TSSRGCN: 用于交通流量预测的时间 - 频谱 - 空间检索图卷积网络
该论文提出了一种基于神经网络模型的交通流预测方法，该方法可以提取交通流数据的空间和时间信息，进而通过结合两种图卷积网络方法来学习节点和边的表示，并利用基于周期的膨胀可变卷积模块来准确捕获每个节点上不同的时变趋势，实验结果表明该模型可以更好地
PDF4 years ago
自适应注意力的小样本分类
本文提出一种新的 few-shot 学习方法，通过优化和快速适应查询样本的表示来改进 few-shot 分类，所提出的自适应注意力模型还能够解释分类模型所寻找的证据。在各种基准 few-shot 分类和精细识别数据集上，实验证明了所提出模型
PDF4 years ago
元学习通过普遍的语言归纳偏好
介绍一种通过元学习来探索语言习得中归纳偏好的影响的框架，并展示了一个基于音节结构的案例研究来验证该方法传递了预期的语言归纳偏好。
PDF4 years ago
Deep Autotuner: 用于歌唱表演的音高校准网络
本论文介绍了一种基于数据驱动的自动音高校正方法，该方法利用歌唱声音和伴奏音频相应的频谱图之间的关系来预测音符级别的音高变化。该方法通过神经网络模型进行训练，包括卷积层和门控循环单元，可适用于自由即兴和协调音乐演唱。
PDF4 years ago
具有关注交互的非对称分层网络，用于可解释的基于评论的推荐
本文中，我们开发了一种新颖的神经网络模型，通过非对称注意模块恰当地解决了用户评价和产品评价的不同。多层次范式考虑到了不同的评价和句子的重要性和相关性。在各种真实数据集上的广泛实验结果表明了我们方法的有效性。
PDF5 years ago
端到端可训练的非合作对话系统
本文中，我们介绍了一种基于任务导向对话模型的非协作式对话模型，该模型使用一种分层意图注释方案来处理社交内容并设计了一种过滤器来筛选生成的回复，我们在两个非协作式任务数据集上测试了我们的模型，结果表明它优于多个基准模型。
PDF5 years ago
神经助手：联合行动预测、响应生成和潜在知识推理
本文介绍了神经助手：一种基于神经网络模型的任务导向对话系统，该系统采用了外部知识源，并联合生成文本响应和行动预测，以消除信念状态注释的需要，并实现更高的事实准确性和语言生成性能。
PDF5 years ago
EMNLP基于一致性线索的立场分类
本文提出了一种利用 BERT 表征和新颖的一致性约束进行立场分类的神经网络模型，并在包括辩论网站在内的多个网站上的数据集上进行了实验，证明了我们的方法比现有基线方法更为有效。
PDF5 years ago
使用多流自注意力和扩张一维卷积的最先进语音识别技术
提出了一种新的神经网络模型体系结构 Multi-Stream Self-Attention，通过进一步处理高度相关的语音传输帧来提高自我关注在语音识别中的效果，并在 LibriSpeech 语料库的测试干净数据集上实现了 2.2％的单词错误
PDF5 years ago