- 知识生成不确定性演化的信任校准:一项调查
设计强大的可视化分析系统需要考虑用户信任,而不确定性和认知偏差会给此带来复杂性,分析人员选择可视化参数是按搜索任务评估解释与不确定性与认知偏差交互作用的一种简单方法。
- 利用多视角知识图谱嵌入实现文化遗产地理定位
本文提出了一种从各种数据源吸收文化遗产实体及其连接的多跳知识到地理本地化 KG 中的框架,并提出了一种基于地理及知识连接的文化遗产实体间相对距离的多视图学习模型。
- 连接 20 世纪初的法语词典与 Wikidata
本研究描述了一种新的词汇资源,通过将所有历史和地理部分的字典条目连接到当前数据源,建立一种可分析历史信息的自动化工具,并通过 Wikidata 标识符处理和分析实体,以概述字典中的可能应用程序。
- 策略优化中的不变性和奖励学习中的部分识别性
研究奖励学习中数据来源的可识别性,通过设计和选择数据来源,分析数据来源和后续任务的不变性,从而提高政策优化的性能
- ICLR基于经验的三明治上下界率失真函数
通过一种新的算法,本文提出了第一个普遍数据源(不一定是离散数据)的 R-D 函数的夹逼界算法,并在多个数据源上估计了 R-D 夹逼界,说明了神经数据压缩的优越性,并发现了改进图像压缩方法的潜在空间。
- 自杀意念检测:机器学习方法和应用综述
本文综合介绍和讨论了自杀意向检测的临床方法和基于机器学习的自动检测方法,以问卷、电子健康记录、自杀笔记和在线用户内容为数据源,引入和总结了几个具体的任务和数据集,总结了现有工作的局限性,并展望了未来的研究方向。
- KDD神经混合推荐:推荐需要合作
该文介绍了一种名为 NHR 的神经混合推荐框架,可用于商品预测问题。该框架利用神经网络从同一和不同的数据源中提取更详细的信息,以及在同样的问题上使用不同的损失函数达到评级预测问题,测试结果在真实世界数据集中显示了优异的性能。
- 关于利用影响力函数测量群体效应准确性的研究
本文研究影响函数在大规模数据集下的准确性,并发现对于大多数数据集,影响函数的预测效果与实际效果存在显著相关性,尽管可能存在较大的误差。
- 多智能体下分布式深度神经网络学习
提出了一种基于跨数据源的深度神经网络训练技术,旨在解决在健康医疗和金融等领域中标记数据和计算资源的短缺问题,并可以在数据敏感应用程序中进行分布式训练。
- 神经网络估计因果效应的迁移学习
本文提出使用传输学习算法和因果推断理论相结合的方法来估算异质性治疗效应,并在大规模选民说服实验和 MNIST 数据库上进行了模拟研究,结果表明该方法能够以更好的性能和更少的数据使用量超越现有的基准算法。
- KDD在线广告的数据质量评估
本文介绍了一种可以应用于在线广告中的数据源质量评估框架,该框架可以有效地评估特定数据源分类与真实情况的相似度,通过多种方法实现数据质量评估,并且介绍了将数据质量评估结果用于特定用户类别定位和预测在线广告受众的两个应用案例。
- 使用打分规则评估概率预测
本文介绍了 R 包中基于适当的评分规则进行概率模型比较评估的功能,涵盖了应用工作中的各种情况,并且提供气象和经济方面的案例研究和相关文献的指向。
- 信息检索的查询扩展技术:一项调查
本文探讨了从 1960 年至 2017 年信息检索中的查询扩展技术,包括核心技术、数据源、加权和排名方法、用户参与以及应用,揭示了其相似性和差异性。
- 结合搜索、社交媒体和传统数据来源来改进流感监测
本研究使用机器学习方法,结合多种数据源包括谷歌搜索、社交媒体数据和卫生部门数据等,提供实时和预测性的美国流感活动估计。通过将每个数据源产生的流感样病例(ILI)活动情况独立生成的多个估计值结合起来,使用机器学习集成方法生成准确的每周 ILI - 具有战略数据来源的最佳统计估计
提出一种最优机制,为统计估算器的数据源提供货币激励,以低成本提供高质量的数据,使支付总额和估算误差最小,广泛应用于线性回归和多项式回归,核回归和岭回归等估算器,并应用于各种目标,包括在预算限制下减少估算误差。
- 用 EMBERS 打败新闻 ': 利用开放源指标预测民事动荡
EMBERS 是一个 24x7 持续的自动化系统,使用 Twitter,新闻来源,博客,经济指标和其他数据源预测拉丁美洲 10 个国家的社会动荡,通过多次评估,我们证明了它的预测优于基准方法并有预测社会事件的能力。
- 从参与式感知到移动众包感知
本研究提出了基于移动感知和移动社交网络的移动群体感知(MCS)系统,旨在探讨人机智能在 MCS 中的潜力融合,该系统与参与型感知类似,但包含隐式和显式参与,并从移动社交网络和移动感知两个用户数据源中收集数据。未来的研究方向包括 MCS 中新 - WWW结合访问日志、页面内容和语义的用户建模
本文探讨了一种用户建模方法,该方法基于大型网站的访问日志和访问页面的内容,结合网页、用户和用户访问网站的语义信息。该方法对应于对大量用户的建模,并使用不同的数据源表示每个用户的特征, 在提供的目标用户子集特征的基础上进一步实现用户建模。该方