- 学习发现知识:一种弱监督部分领域适应方法
本文介绍了一种简单而有效的基于自适应学习的域自适应方法,称为自适应迁移分类器学习(SP-TCL),用于解决弱监督下的部分域自适应问题,通过精心设计的损失函数发现准确知识并在遵循自适应学习方案下从源域中迭代地排除示例,实现了目标域的成功适应, - 基于文档的知识发现与微服务架构
基于微服务架构的知识发现中的关键挑战和应对方法,包括数字化、关键词提取、文档相似度计算、自然语言数据库查询以及独立提供抽取的信息,还提供了相应的参考设计指南。
- ACL基于知识的跨文档关系抽取
我们提出了一种新颖方法 KXDocRE,在跨文档关系抽取中嵌入了实体的领域知识,相比基准方法具有三个主要优势:1)它将实体的领域知识与文档的文本结合起来;2)它通过生成解释性文本来解释实体之间的预测关系;3)它在性能上优于先前的方法。
- LLM4ED:大型语言模型用于自动方程式发现
通过自然语言提示指导大型语言模型自动从数据中挖掘执法方程的新框架降低了学习和应用等式发现技术的难度,显示了大型语言模型在知识发现领域的应用潜力。
- 面向安全演化的基于人工智能(AI)的对话代理系统,支持青少年心理和性健康知识探索
通过对青少年与基于人工智能(AI)的会话代理之间的互动知识发现过程中的意外风险的讨论,本文呼吁对为保障青少年的安全与 AI 代理的进化进行讨论。
- AceMap: 学术图谱中的知识发现
科学文献的快速增长需要有效管理和提取有价值的见解。AceMap 是为了通过学术图来实现知识发现而设计的学术系统,它提供了高级数据库构建技术、创新的可视化和分析方法以及追踪学术观点演变、生成简洁摘要等先进分析功能。
- 一种用于机器学习中的高维数据集的基于对比的特征选择算法
通过选择最具信息量的特征并消除无关的特征,我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS,该方法能够在大型数据集上有效地降低计算成本,而且性能优于其他最先进的特征选择方法。
- 数据科学的价值观:数据科学的本质、价值和风险
数据科学是一个具有无限广泛的范围、规模、复杂性和能力的研究范式,通过知识发现在各个学科中广泛应用,具有巨大的潜力和风险,并将带领我们进入对世界的新认知方式。
- 用于改善分类任务可解释性的新型结构化论证框架
研究提出了一种新的结构化论证框架,名为扩展论证决策图($xADG$),它是 Dung 抽象论证图的扩展。$xADG$ 框架允许论点在其内部结构中使用布尔逻辑运算符和多个前提,从而产生更简洁的论证图,易于用户理解,并在分类任务中取得了强大的预 - ACL从技术领域的术语和短语中提取文本表示
本文提出了一种全无监督的文本编码方法,通过训练小型基于字符的模型重构预训练的嵌入矩阵,该方法不仅能够在技术领域匹配句子编码器的质量,而且比后者体积小 5 倍且速度高达 10 倍,解决了大规模技术领域下词汇量增加的问题。
- Covidia: COVID-19 跨学科学术知识图谱
本文提出 Covidia,COVID-19 研究的跨学科学术知识图谱,并设计了基于对比学习的学科分类和实体提取以及关系分类和本体管理的框架。基于 Covidia,我们还建立了知识发现基准,以发现 COVID-19 研究团体和预测潜在关联。
- 知识发现的因果模式归纳
本研究提出了一个数据集和模型 Torquestra,用于语义搜索和知识发现,有效挖掘具有相似因果意义组件的英文新闻文本。
- MM机器天文学:神经网络在天文学中的历史、基础知识与展望
该文讨论深度学习在天文学领域的应用,以及在天文数据训练深度学习模型方面的优势,并预测将会进入第四波基础模型迭代的天文连接主义时代。
- EMNLP高度技术领域的非监督术语提取
本文介绍了一个商业知识发现平台的术语提取子系统,采用全面且无监督注释器来跨越高度技术领域。该注释器通过将子词分词的新颖形态信号与使用通用领域预训练句子编码器计算的术语和主题以及内部术语相似度度量相结合,提取术语。通过在大型未标记语料库上运行 - 仅需深度学习:使用可解释的深度学习来解开 EEG-fMRI 之间的关系
本研究提出了一种基于 EEG 数据的可移动脑机接口技术,使用深度学习技术构建领域受限体系结构,恢复多个亚皮层区域活动并自动发现知识,为可穿戴的亚皮层活动扫描仪铺平了道路。
- MM基于支配关系的粗糙集方法:基本思想与主要趋势
介绍了基于支配关系的粗糙集方法 (DRSA) 作为一种机器学习和知识发现方法来处理多准则决策辅助 (MCDA) 并应用于知识发现和数据挖掘。回顾了 DRSA 的基本原理和主要概念,并重点介绍了该方法的发展和软件。并详细讲述了 Roman S - 学术文献中的方法实体:提取、评估和应用综述
本文系统评述了从学术文献中提取科学方法实体的方法和评估指标,重点关注了每种方法的利弊,并调查了提取的实体如何用于构建新应用程序,探讨了现有研究的局限性和潜在的下一步工作。
- 多模态知识发现和预训练的统一连续学习框架
该研究提出了将多模态预训练和知识发现统一到连续学习框架中的方法,以维护知识图作为基础,同时强化模型更新的外部知识引导作用在跨模态链接识别和预训练模型两方面取得了有效结果。
- 机器学习中知识与数据的融合
该研究总结和分析了现有文献,确定了研究空白和未来机遇。知识嵌入和知识发现是整合知识和数据的两种重要方法,结合知识嵌入和知识发现形成一个闭环的知识生成和使用,可以提高模型的鲁棒性和准确性,并发现之前未知的科学原理。
- 用于序列模式挖掘的内存高效字典树
本文研究了数据挖掘中的基础问题 Sequential Pattern Mining,并提出了基于 Trie-based 模型的数据集建模和挖掘算法,大幅提高了算法在时间和内存上的效率。实验结果表明我们的算法在实践中更快且更节省内存。