W-RST: 一种加权的 RST 风格的语篇框架

ACLJun, 2021

W-RST: 一种加权的 RST 风格的语篇框架

W-RST: Towards a Weighted RST-style Discourse Framework

Patrick Huber, Wen Xiao, Giuseppe Carenini

TL;DR本文针对数据驱动和基于语言启示的方法进行了深入探讨，研究了在加权 RST 框架中是否可以用自动生成的实值分数替代二进制重要性评估，并发现与基于核心性的方法相比，来自辅助任务的加权语篇树可以使关键的自然语言处理下游应用受益。我们进一步表明，实值重要性分布部分有趣地与人类注释者的评估和不确定性相吻合。

Abstract

Aiming for a better integration of data-driven and linguistically-inspired approaches, we explore whether rst nuclearity, assigning a binary assessment of importance between text segments, can be replaced by automatically generated, real-valued scores, in what we call a →

rst nuclearity weighted-rst framework discourse trees nlp downstream applications importance distributions

发现论文，激发创造

基于令牌加权的 RNN-T 模型用于学习有缺陷的数据

使用基于标记权重的 RNN-T 准则来缓解音频识别中的转录错误，并且在半监督学习中使用该方法可以显著提高准确性。

Jun, 2024

神经对话模型的实例加权：不是所有对话都是平等的

本文研究了利用加权模型解决神经会话模型训练过程中困难的问题，并在电影和电视字幕训练数据上证明该方法能提高模型性能。

Apr, 2017

单词不平等：适用于构建组合文档向量的分级加权模型

研究使用基于加权单词向量的模型，并使用多种分类器进行集成，以在影评数据集上提高 1.6％的性能，并在 Amazon 产品评论中提高 7.01％的性能，其中 tf-idf 等方法可以显着提高先前技术水平。

Dec, 2015

基于分组权值共享的领域知识利用及其在文本分类中的应用

该论文提出了一种新的方法 — 通过权值共享来利用诸如 WordNet 或 Unified Medical Language System（UMLS）等现有的外部语言资源来完善神经模型，从而提高分类任务的性能。

Feb, 2017

基于关键词权重排名的多领域文本分类课程学习方法

本文提出了一种基于关键词权重排序的课程学习策略来改善多域文本分类模型的性能，该方法在对抗训练的基础上，并且在 Amazon 评论和 FDU-MTL 数据集上的实验结果表明，它能有效地提高多领域文本分类模型的性能，并优于现有的方法。

Oct, 2022

针对第一阶段检索的上下文感知句子 / 段落术语重要性估计

本文提出了 Deep Contextualized Term Weighting 框架，可以将 BERT 的上下文表示映射到句子和段落的上下文感知权重，用于段落检索和一阶段检索算法，实验表明 DeepCT 的深层上下文理解显著提高了一阶段检索算法的准确性。

Oct, 2019

回归基础：计量分析统计和基于图的术语加权方案对关键词提取的影响

本研究比较了统计和基于图形的术语加权方法，揭示了较少知名的词汇特异性相对于 tf-idf 的优势，以及统计和基于图形方法之间的定性差异，并提出了有关从业人员的建议。

Apr, 2021

随机权重的合理有效性：多任务学习的试金石

本文提出随机加权方法（包括随机损失权重和随机梯度权重），并进行了收敛性分析和实证评估，结果表明随机加权方法具有可比拟的性能和更好的泛化能力，是多任务学习的重要基线方法之一。

Nov, 2021

弹性权重去除用于忠实且抽象的对话生成

提出了一种称为弹性权重剔除（EWR）的方法，该方法通过测量权重的不确定性来约束预先训练的模型参数，使得对话系统生成关于相关文件的信息时，不会产生错误或不可验证的信息。该方法使用 Flan-T5 作为主干语言模型，通过自动和人工评估表明，它在提高忠诚度方面具有系统性的优势。同时该方法还可以同时限制幻觉和提取响应，以防止浅层的复制和粘贴文档范围的情况。

Mar, 2023

一个词有多重？为单词语义感知调整词嵌入重量

该论文介绍了我们参与俄语单词词义感知和消除方面的 RUSSE'2018（Panchenko 等人，2018）的首个共享任务。我们通过使用词嵌入的重量平均值和神经机器翻译系统，在该任务中表现出了优异的结果并超越了先前年份基于语义嵌入的竞争性基线。

May, 2018