- 生物医学领域的深度学习、自然语言处理和可解释人工智能
本文对人工智能及其在生物医学领域中的应用进行了介绍,着重讲述了深度学习、自然语言处理、可解释的人工智能等相关技术及其在生物医学领域的应用和重要性。
- LEAPMood:基于遗传算法驱动超参数调整的轻量高效架构,用于情绪预测
本文提出了一种基于 LEAPMood 的自然语言文本情绪预测方法,该方法使用字符嵌入、音素哈希和注意力等技术,结合基于遗传算法的超参数调整方法,实现了情绪识别和情绪预测,并在 DailyDialog 数据集上取得了精确度为 62.05%、内 - 使用文本数据进行因果推断的几点思考:人类受试者和组织化文本之间的相似之处
通过绘制人类主体和有组织文本之间的平行关系,我们探讨了文本数据在进行因果推论时的作用。文章强调了关键因果概念和原则,并提出了两种策略来更好地确定因果查询问题。我们希望本文能提高人们对在使用文本数据进行因果推论时阐述和澄清基本概念的重要性的认 - 使用遮罩语言建模进行偏见缓解的文本风格转换
本研究提出了一种用于减少偏见的文本风格转换模型,它结合了潜在内容编码和明确的关键词替换,可以更好地保存内容并保持良好的风格转移准确性。
- EMNLP离散变分自编码器在自然语言生成因素分离中的应用
本文提出一种基于变分自编码器(Variational Autoencoder)的新方法来实现对自然语言处理(NLP)系统的解释,并将文本语言特征建模为离散变量以实现学习解缠编码表示,实验结果显示该方法在多个基准测试和一个文本风格迁移后处理应 - ACL公共网络抓取语料库中的不良内容初步分析
本文探讨了当前神经语言模型的成功主要归功于训练语料库规模的不断增大。但是,我们扩大了对 Common Crawl 的探索,发现即使在过滤程序之后,它仍然包含大量不良内容,包括仇恨言论和性暗示内容。我们对这些内容对语言模型的潜在影响进行了讨论 - 10-Q 条目
本文提出了通过结合基于规则的算法和卷积神经网络图像分类器来对 10-Q 文件进行细分的解决方案,这可以作为一种快速数据检索方案,从大量的文本数据中提取文本数据用于训练 transformer 模型或适用于各种领域专注的自然语言处理应用程序。
- ACLPVG at WASSA 2021: 基于 Transformer 的多输入,多任务架构用于共情和痛苦预测
本研究使用多输入、多任务框架,对情感评分、情感和共情分类的 WASSA 2021 共享任务进行了解决方案,并将文本数据、心理测验得分、人口统计特征和原始情绪及共情的内在相互依赖性纳入考虑范畴,进而在困难的文本数据中预测了这些情绪的强度。
- EMNLP针对濒危语言文本的 OCR 后校正
针对极度濒危语言中大多数没有用于构建自然语言处理模型的数据的情况,本文提出了一种从不可读的文本数据中提取文本的方法,具体而言,在三种极度濒危的语言中创建了一个基准数据集,并针对数据不足的 OCR 研究有效性做了系统分析,开发了一种针对数据不 - ICLR表格与文本的开放式问题回答
该论文研究了开放式问答系统(QA)在同时检索结构化表格和非结构化文本数据时的困难之处,并提出了两种新技术以提高检索准确率,让模型的精确匹配得分提高至 27% 以上,这为该领域的未来研究提供了重要的参考价值。
- 基于 BERT 词向量集成的袋化支持向量机实现人格特质检测
本文介绍了一种基于深度学习技术的自动化文本人格检测方法,采用 BERT 语言模型提取文本数据中的上下文词嵌入,并结合心理语言学特征与 Bagged-SVM 分类器进行计算,实现高效人格预测模型,并在金标准文章数据集上对模型进行实验并证实其优 - MM语言嵌入中受生物启发的结构识别
本研究使用生物启发方法来遍历和可视化词嵌入,并显示了其可理解的结构。此外,我们的模型还生成可信的单词相似性排名。我们还展示了使用生物启发模型在不同的单词嵌入技术之间进行比较,以研究其对语义输出的影响,这可以强调或模糊文本数据中的特定解释。
- MM基于词嵌入 NLP 模型的网络文本中职业结构的存在
本研究基于大量文本数据分析职业在语义空间内的位置与社会地位,结果表明职业结构与传统社会阶层结构类似,同时指出组织力量是一个尚未得到充分探讨的因素。
- 利用辅助文本进行深度识别未见视觉关系
提出一种融合图像和文本信息用于视觉关系检测和场景图生成的深度模型,通过共同的文本图像表示方法实现文本补充图像数据,结果表明图像中没有的文本信息可以显著提高模型性能
- 我非我所写:隐私保护文本表示学习
该研究提出了一种文本数据双重隐私保护表示学习框架 (DPText), 可以实现高效保护用户隐私同时保证数据在情感分析和词性标注等任务中有较高实用价值。
- ASER: 一个大规模的事件性知识图谱
从 11 亿标记的非结构化文本数据中提取的 ASER(活动、状态、事件及其关系)是一个大规模的事件知识图谱,包含 5 类 15 种关系类型,194 百万个事件和 6400 万个事件之间的关系,填补了现有大规模知识图的空白。
- EMNLP利用弱监督学习概念抽象度
本文介绍了一种弱监督方法,用于在完全没有标记数据的情况下推断单词和表达式的抽象性质,利用最少的语言线索和概念在文本数据中的上下文使用,训练具有足够强大的分类器,取得了与人标记的高相关性,结果表明这种方法适用于其他概念属性、其他语言和资源缺乏 - 文本情感检测综述
文本情感检测研究综述表明,虽然目前已经有许多技术、方法和模型来检测文本中的情感表达,但人类情感的复杂性以及使用隐喻性语言等因素使得这些方法不足以应对这些复杂性,因此需要关注情感表达的语言细节。
- 文本文件的变分深层语义哈希
本文提出了一系列新颖的基于深度生成模型的文本哈希方法,并通过实验证明了深度学习在文本哈希中的有效性。
- EMNLP针对时间序列事件从文本中检测和解释原因
提出一种基于时间序列的 Granger 因果关系并结合文本数据进行因果关系的提取,建立事实间的因果联系,使用神经元的推理算法训练常识因果关系对下一个因果步骤的预测,并取得了实验证据支持该方法从时间序列文本特征中提取有意义的因果联系并生成适当