- 基于持续时间的 Vlog 叙述动作时间定位研究
本文研究生活时尚视频中的时间人类行为定位,提出一个基于预期持续时间的简单而有效的方法,该方法使用数据集手动注释的 13,000 个行动,并分析它的语言和可视模态交互,并通过实验证明,相对于以往方法,该方法具有补充信息,并且在时间行动定位任务 - GENOME: 用于叙事本体建模的通用方法论
该研究论文介绍了针对史诗的本体建模 - GENOME 方法的设计和开发,是第一个能够灵活集成通过重用或从头开始进行的知识建模的方法,成功地解决了已有方法设计上的不足和重用史诗本体模型的问题。
- 数据为先:自然语言项目的评估优先方法论
介绍了一种能应对大规模非结构化数据及 NLP 场景以及数据挖掘非技术层面问题的 D2V 方法论
- 一步式可凭借性多目标学习结合多样嘈杂标签样本
提出一步诱导式多目标学习(OSAMTL)来处理复杂嘈杂标签,并给出异构嘈杂样本(DNLS)的定义,进一步提出一步诱导式多目标学习与 DNLS(OSAMTL-DNLS)来扩展原来的 OSAMTL 方法以更好地处理复杂嘈杂标签。
- BERT 的可解释性幻觉
通过对 BERT 模型中的单个神经元激活的分析,我们揭示了一种 “解释能力幻觉”,揭示了 BERT 的嵌入空间的几何特性和文本语料库表示只代表英语句子的狭窄切片的事实,我们提供了模型学习概念的分类,讨论了解释研究的方法论含义,特别是在多个数 - EMNLP适用于命名实体识别的可解释性多数据集评估
本文提出了一种可解释的评估方法,用于对自然语言处理任务中的命名实体识别进行分析,以帮助读者更好地理解不同模型及其相对优劣之处。通过将我们的分析工具提供给其他研究人员,我们希望能推动这一领域的进步。
- PySCF 程序包的最新进展
本文介绍了 PYSCF 的设计和理念,旨在支持化学、材料、机器学习和量子信息等领域的 Python-based 电子结构计算,支持第一原理模拟和快速开发新的方法和复杂的计算工作流程。
- CausalML: 用于因果机器学习的 Python 包
介绍了 CausalML 这个 Python 包的关键概念、范围和用例,它实现了与因果推断和机器学习相关的算法,填补了理论方法和实际应用之间的差距。
- 节点属性社交网络中的社区发现:综述
本文介绍了社区检测的基本问题,即如何把社交网络中具有明确社交关系的社会行为者分成紧密相连和高度相关的群体,并详细介绍了使用节点属性的方法,对已知的方法进行分类,提供了每种方法的一般技术思想,分析了当前领域的状况并揭示了一些需要未来解决的问题 - ACL来自平行翻译的简单有效的释义相似度
从双语语料中直接学习释义句子嵌入的模型和方法,有效消除创建释义文本体的耗时环节。进一步地,该模型可用于跨语言任务,其性能优于且比最先进的复杂基线算法快几个数量级。
- 通过查询日志和问答论坛获取常识属性
该研究提出了 Quasimodo 方法,通过从非标准网络来源提取出的候选断言,结合百科全书、图书和图像标签等的统计提示,在进行验证步骤时,重点考虑与某些对象或概念通常相关联的显著属性。与先前的常识知识库研究不同,Quasimodo 着重于获 - 蒙特卡洛融合
提出了一种称为 Monte Carlo Fusion 的新理论和方法来解决分布式分析和推理的问题,并将其统一为一致的推理。
- 组合优化的机器学习:方法论地全景
本文调查了机器学习和运筹学社区最近尝试利用机器学习解决组合优化问题的努力,并详细阐述了一种将机器学习和组合优化更进一步集成的方法论。
- 评估和理解对抗性对数配对的鲁棒性
评估 “对抗性逻辑对齐” 的鲁棒性,发现经过训练的网络在该防御模型下仅达到 0.6%的准确性,探讨了攻击方法的方法论和结果,揭示了 ALP 易受到对抗攻击的原因。
- 基于声音视觉线索的情感唤醒 - 价值深度预测网络
本文全面描述了我们参与 2018 年一分钟逐渐情感行为挑战的方法。
- MM用于安全关键应用的神经网络:挑战、实验与展望
通过扩展现有认证标准中必不可少的可理解性、正确性和有效性等概念,我们提出了一种设计可靠人工神经网络(ANN)的方法论,并将其应用于一个具体的案例研究中,设计了一个高速公路 ANN 基础运动预测器,以确保安全特性,例如如果其右侧有其他车辆,则 - 网络搜索个性化度量
对 Web 搜索结果的个性化进行量化,发现 11.7%到 15.8%的结果表现出了个性化,而仅使用已登录的帐户和搜索用户的 IP 地址才导致了可测量的个性化结果。
- MM答案集编程的成就
本文介绍了一种应答集编程的方法论,该方法可以促进易于理解且可以证明正确的编码方案的设计。通过向正在形成的程序追加一个规则或一小组规则,并在其中包含一条陈述已经 “实现” 的注释,使我们能够以数学上精确的方式描述程序设计的细节。
- 随机森林指南
该论文综述了随机森林算法的理论和方法发展,重点讨论了参数选择、重采样机制和变量重要性测量等数学因素驱动该算法,并强调了其在分类、回归和变量重要性测量等方面的应用。
- Metropolis-Hastings 算法
介绍 Metropolis-Hastings 算法的基本原理及其在依赖模拟、任意分布和 R 代码实现方面的应用,并提供对该算法的最新扩展的参考。