- 利用类比搜索引擎扩展科学创造力
通过一种全新的的端对端系统进行科学论文的模拟搜索,这个模拟搜索的成功可以被中间层次的问题抽象匹配的良好匹配度所中介,凸显了各种可能性。AI 搜索引擎可以在不需要人类参与的情况下,实现与人在循环系统中相同的准确率,从而加速科学创新。
- 利用高速网络的科学论文多任务推荐系统
本论文提出了一种基于深度学习的多任务推荐系统,用于从科学论文中提取关键信息,包括关键字、作者以及推荐评分等。系统采用 RNN、Highway 和 CNN 等多种深度学习技术,以端到端的方式学习上下文语义,解决冷启动等问题。
- ArgSciChat:一份关于科学论文争辩对话的数据集
本研究为缺少对话数据来训练这种代理而使科学学科(作为专家领域)的对话代理应用研究不足,提出了一种新的框架,用于在科学论文上收集科学家之间的对话,并通过 ArgSciChat 数据集进行了 extensive analysis,在此数据集上评 - SciBERTSUM: 面向科学文档的提取式摘要
SciBERTSUM 是一种针对科学论文的摘要框架,通过增加节嵌入层和应用稀疏注意力机制,在长文本(超过 500 句)中表现出更好的 ROUGE 分数。
- 如何选择基准论文?—— 识别论文作为基准的使用价值
该研究提出了一种自动识别科学论文中使用的基准线的方法,并开发了一个基于注意力机制的多模块神经分类器,能够更好地分类基准线文献,这是一项具有挑战性的任务。该研究对 ACL 文集语料库的 2075 篇论文进行了分类标注,并分析了分类器的错误,揭 - EMNLPCOVID-19 和其他新兴领域的开放领域问答
为了解决 COVID-19 疫情期间虚假信息泛滥的问题,本文利用开放域问答技术,构建了一个能够从大规模 COVID-19 科学论文中检索答案的系统,并结合有效的重新排序和多次回答技巧。实验表明,尽管数据量较小,该系统仍然可用于训练,成为用于 - ACL自动识别古怪的科学成就:这怎么获得了资金?!
本研究提出了一个基于机器学习的新型幽默挖掘方法,通过结合心理学、语言学与自然语言处理的最新进展,利用一万余篇滑稽论文构建数据集,成功实现自动检测幽默科学论文的任务,并有望在科学研究中发挥重要作用。
- ACL端到端自然语言处理知识图谱构建
这篇论文研究了从科学论文中构建 NLP 知识图谱的端到端构建方法,重点在提取四种类型的关系:任务和数据集之间的关系,任务和评估指标之间的关系,以及相同类型实体之间的关联关系。通过将 SciNLP-KG 框架应用于 ACL 文献库中的 30, - AAAI引用图增强科学论文摘要
本论文提出了一种基于引用图的摘要模型 CGSum,相对于基于输入文档内容进行摘要的方法,它可以更好的理解科技论文的含义并产生高质量的摘要,同时构建了一个包含 141K 篇不同领域的科技论文的数据集 Semantic Scholar Netw - 科技评论的基于方面的情感分析
利用基于方面的情感分析从科学评论中提取有用信息可以更好地判断接受 / 拒绝决策,并且发现审稿人之间的不一致程度可能与主席的意见不一致有关。
- ACL科技文献中引文意图分类的结构支架
本研究介绍了基于结构化支撑的多任务模型来识别科技论文中引用的意图,旨在提高科学文献个体阅读和自动化分析的效率。该模型在 ACL-ARC 数据集上取得了新的最高分 13.3% 的绝对增长,同时还引入了比现有数据集大五倍多、涵盖多个学科领域的引 - 基于深度神经网络学习技术的引用次数预测
本研究提出了使用神经网络预测论文未来引用次数的新方法,该方法有效地提高了年度和总引用次数的预测准确性。
- ACL分析时间序列文档集的动态和静态主题模型
本文提出一个动态和静态主题模型,能同时考虑时间上的主题演化和每个时间的主题层级结构,以此来分析结构化的时间序列文档。作者通过实验表明,该方法在科学论文集的主题提取方面优于传统模型,并展示了提取出的主题结构,以此来帮助对研究活动进行分析。
- SIRIUS-LTG-UiO 在 SemEval-2018 Task 7 中的应用:短依存路径卷积神经网络用于科学论文中的语义关系提取与分类
本文介绍了一种基于最短依赖路径和卷积神经网络的方法,用于在科技论文中进行语义关系的提取和分类。该方法在任务中排名第三,对于干净数据和有噪声数据的关系分类整体 F1 得分分别为 76.7 和 83.2。此外,对于干净数据的综合关系提取和分类, - ACL一种论述感知的长文本抽象摘要关注模型
本文提出了一种针对单个较长文档(如研究论文)进行抽象概括的模型,采用新的分层编码器对文章进行语篇结构建模,并运用有意识的编码器生成摘要,实验证明该模型显著优于现有模型。
- 使用卷积神经网络的数据驱动化化合物图分离方法
本文介绍了一种基于卷积神经网络的数据驱动方法,以训练这种分离器的端到端方式分离复合图,消除了手动设计特征和分离规则的需要,但需要大量注释的训练数据。作者在 ImageCLEF 医学数据集上评估了该技术,在 85.9% 的准确率上表现出色,并