用于支持对平行文本集合进行意义构建的交互式用户界面

Mar, 2023

用于支持对平行文本集合进行意义构建的交互式用户界面

An Interactive UI to Support Sensemaking over Collections of Parallel Texts

Joyce Zhou, Elena Glassman, Daniel S. Weld

TL;DRAVTALER 是一种基于核心对齐算法和现代 NLP 工具的混合倡议系统，用于帮助人们比较文献综述和对齐文本语段，以支持文本数据的语义化和对比文献属性。

Abstract

Scientists and science journalists, among others, often need to make sense of a large number of papers and how they compare with each other in scope, focus, findings, or any other important factors. However, with a large corpus of papers, it's cognitively demanding to pairwise compare and contrast them all with each other. Fully automating this review proces

avtaler literature review alignment algorithm nlp tools mixed-initiative system

发现论文，激发创造

文本语料的可视化、比较和理解

本篇研究论文探讨了利用自然语言处理技术在文本可视化方面的应用，除了传统的利用文本主题抽取与可视化的方法，更深入地进行了针对单词情感价值的比较，探究不同文本间的差异与重点。

Jul, 2022

在规模化环境下协助人类进行复杂比较的自动化信息比较

通过生成式大型语言模型和抽象总结以及标准驱动的比较终点，该研究开发了一种能够在不同领域进行高效信息比较的系统，利用语义文本相似性比较生成基于证据的分析，克服了模型推理中的信息上下文和令牌限制的困难，提供了可行的结果并实现了自动化的大规模信息比较。

Apr, 2024

RelevAI-Reviewer：一项关于调查论文相关性的人工智能评审基准测试

提出了一种自动系统，将调查论文审查任务概念化为一个分类问题，采用机器学习模型测定与指定主题相关的论文的相关性，并且通过使用 BERT 等高级语言模型，取得了优于传统机器学习方法的初步结果。

Jun, 2024

苹果与苹果的比较：从用户评论中生成具有观点感知的比较句子

通过对比评价句子帮助用户找到最合适的产品，我们的模型由三个部分组成：对比模块、生成模块和个性化解码方法，实验证实了我们的算法生成的对比评价句子相关且真实。

Jul, 2023

研究与读者之间的桥梁：一种多模态自动学术论文解读系统

我们引入了一个开源的多模态自动学术论文解读系统（MMAPIS），通过三个步骤，包括 LLMs 来增强其功能：首先，我们利用混合模态的预处理和对齐模块来提取纯文本、表格或图像；然后根据所属章节的名称对这些信息进行对齐，确保具有相同章节名称的数据被归类到同一节下；接下来，我们采用分层的话语感知摘要方法，利用提取的章节名称将文章分割成较短的文本段落，通过具体提示使用 LLMs 进行节内和节间的摘要；最后，我们设计了四种类型的多样化用户界面，包括论文推荐、多模态问答、音频广播和解释博客，广泛适用于各种场景。我们的定性和定量评估突出了系统的优越性，尤其在科学摘要中，它胜过仅依赖 GPT-4 的解决方案。

Jan, 2024

HADES: 同源自动文档探索和摘要

HADES 是一种自动文档比较工具，通过主题建模、文摘、关键词分析等多个步骤，使政策文件、法律法规和科学论文等大规模文献比较工作更加高效，同时具有交互式的 Web 应用程序和可视化功能，可公开访问 GitHub。

Feb, 2023

自动对齐方法用于摘要语料库构建

本文提出了使用会议摘要生成自动转录报告的方法。使用自动预对齐方法使数据批量化对齐，最大化语料库的规模，以及使用人工标注者进行更准确地校对。作者还评估了自动对齐和自动摘要的表现，并证明自动对齐可大幅度提高所有 ROUGE 得分。

Jul, 2020

自动摘要评估的对比研究和框架：LangChain 与混合算法

使用自动化论文评分、得分技术和大语言模型对用户对给定主题的理解进行分析，通过摘要和提取关键信息来评估用户对文档内容的理解。

Oct, 2023

研究论文的基于方面的文档相似度

本研究介绍了一种基于方面信息的相似度扩展方法，使用 Transformer 模型和 LSTM 基线评估了 172,073 份论文的相似度，结果表明 SciBERT 是最有效的系统，这种基于方面信息的相似度扩展方法可以为文献推荐系统提供更高的粒度和准确度。

Oct, 2020

PaperWeaver：将用户收集的论文与推荐论文的上下文相结合，丰富主题论文提醒

研究人员订阅 “论文提醒” 系统以获取最近发布的与其之前收集的论文相似的推荐论文，但由于现有系统仅提供论文标题和摘要，研究人员有时难以理解这些推荐论文与其自身研究背景之间微妙的联系。为了帮助研究人员发现这些联系，我们提出了基于用户收集的论文给推荐论文提供背景化文本描述的 PaperWeaver 系统。PaperWeaver 采用基于大型语言模型（LLMs）的计算方法来推断用户的研究兴趣，提取论文的具体上下文方面，并在这些方面上比较推荐与收集的论文。我们的用户研究结果（N=15）表明，使用 PaperWeaver 的参与者能够更好地理解推荐论文的相关性，并在与基线系统（基于推荐论文的相关工作部分）相比时更自信地进行分流。

Mar, 2024