形式背景的仓库
本文介绍了形式概念分析及其应用。FCA 是由格论推导出来的应用数学分支,将概念作为人类思维的基本单位并将数据以物体属性的形式进行分析。本篇论文特别针对 RuSSIR 2014 而编写,讨论了信息检索、机器学习、数据挖掘和知识发现、文本挖掘等多个主题以及其可视化方面。
Mar, 2017
该研究提出了一种基于 FCA 的新方法,通过对文本语料库中的上下文信息进行建模和分析,以自动获取层次结构的概念分类。在旅游和金融领域应用比手工分类更有效。
Sep, 2011
本文提供了一种从自由文本中学习概念层次的 Formal Concept Analysis 和 WordNet 框架,并通过减少正式上下文来加速思想格框架的推导。
Nov, 2023
关系概念分析是形式概念分析的扩展,用于处理多个相关情境,该研究报告通过定义可接受的解决方案为概念格的家族,该家族属于初始情境确定的空间,不能扩展新属性,仅涉及家族中的概念,进一步证明这些可接受的解决方案是两个函数的共同不动点。
Oct, 2023
本文提出了 CoCon 数据集,该数据集包含了 35K 份数据集,方法,模型和任务,并将它们联系在 340k 篇学术出版物的全文中,进一步提出了一种用于预测 “组合研究工件使用” 的链接的任务,并提供了利用数据分析和机器学习开发代码的链接。
Mar, 2023
我们提出了一个新的引文语境分析框架,以文档级别的上下文提取和标记任务为核心,并发布了一个新的数据集 MultiCite,该数据集包含了超过 1200 篇计算语言学论文中的 12653 个引文语境,其中包括全文本的多个句子和多个标签的引文语境,可以用于训练经典的 CCA 模型,也支持开发超越固定宽度文本分类的新型 CCA 模型。
Jul, 2021
本文提出了一种新的引证内容分析(CCA)框架,用于语法和语义分析引文内容,以更好地分析研究行为的丰富社会文化背景。该框架可被视为引文分析的下一代,并简要回顾了传统社会科学中内容分析的历史和特点,以及它在图书馆与信息科学中的应用。基于对新方法的理论必要性和引文分析限制的批判性讨论,讨论了 CCA 的性质和目的,并提供和描述了进行 CCA 的潜在程序,包括识别参考范围的原则、二维(引文和被引)和两个模块(语法和语义模块)编码手册。同时对未来的研究工作和意义进行了探讨。
Nov, 2012
通过将数据集连接起来,从而代表每个数据集摘要信息的方法,旨在帮助创新思想和数据用户之间的沟通,使其能够使用或组合数据集来创建有价值的产品、服务和商业模式,提供适用于现实业务需求和应用的实用知识以及基础,并为将人工智能技术应用于数据提供现实基础。
Aug, 2022