- 使用预训练的神经转换器进行新闻偏见检测的实验
比较几种大型的预训练语言模型在句级新闻偏见检测和子类型分类任务上的性能,并提供了定量和定性结果。
- CHIRON:长篇叙述中丰富的人物表征
通过基于 LSTM 的生成模块和领域特定的包含蕴涵模型的验证模块构建了 CHIRON,它是一种新的字符表格表示方法,用于提取和过滤关于复杂角色的文本信息,并且在掩盖字符预测任务中表现得更好和更灵活,同时还能用于自动推断角色中心性和与人类判断 - 声誉算法厌恶
人们通常不愿意在他们的决策中使用算法生成的信息,称为 “算法厌恶”。本研究研究了当选择遵循算法时,这种算法厌恶现象是如何产生的,并提出了一个模型,该模型基于工人对自己的私人信息和算法信号作出随机结果的预测。低技能工人与算法相比得到了更差的信 - 达尔文・图灵・道金斯:建立一般进化论
生物进化、达尔文进化、迷因、信息和计算机革命是本研究的关键词,通过 Alan Turing 和 Richard Dawkins 的见解,研究表明这些关键词不仅适用于 DNA 中存储的基因,还适用于我们大脑中存储的迷因和计算机中存储的信息。
- 白内障患者专家辅助聊天机器人
通过大型语言模型(LLMs)提供有经验支持的健康信息, 我们提出了 CataractBot,一个与印度一家三级眼科医院合作开发的专家参与聊天机器人,能够即时回答白内障手术相关问题,并异步提供经过专家验证的回答。在包含 49 位参与者的实地部 - 对分布变化下的无监督准确率估计进行梯度特征化
该研究论文研究了在不同测试环境中无法访问真实测试标签的情况下估计测试准确性的方法,通过使用神经网络的输出或提取特征来建立与真实测试准确性相关的估计分数,实验证明梯度提供的信息可以预测分布变化下的真实测试准确性,并提供了理论方面的洞见。
- EMNLP量化韵律与文字之间的冗余性
语调在某种程度上与言语本身及其前后的上下文的信息重复,但仍然包含超越语言的信息。使用大型语言模型,本研究通过英文有声读物中提取的韵律特征与 LLMs 嵌入之间的预测性比较,发现多个韵律特征(包括强度、持续时间、停顿和音调曲线)与言语的信息具 - 通过社区感知特征预测节点属性
提出一种基于社区结构的节点特征家族,探索它们的性质,并证实它们在分类任务中具有高预测能力,包含了无法由经典节点特征或节点嵌入(无论是经典还是结构化)恢复的信息。
- 揭穿虚假信息:利用 NLP 在假新闻检测中革命真相
互联网和社交媒体改变了人们在信息传播迅速的时代获取新闻的方式。虽然这种发展增加了信息的获取,但也带来了一个重大问题:假新闻和信息的传播。假新闻迅速在数字平台上传播,对媒体生态系统、公众舆论、决策和社会凝聚力产生了负面影响。自然语言处理(NL - 为何不为之做点什么?: AI 解释和用户行动的联系
本文介绍了一种框架,其通过映射解释中提供的信息以及用户行为的先前工作,并讨论了我们发现的关于向用户呈现信息的信息的差距。
- 在严重不确定情况下进行多目标决策
本文将近期发展的决策理论的不完全偏好和概率信息转移到多目标设置中,并通过利用可能的部分基数和部分概率信息,比帕累托序提供更详细的订单来比较决策。我们讨论了所提议的决策选项之间的一些有趣属性,并展示了如何通过线性优化来计算它们。最后,在比较不 - EMNLPSimANS: 简单的模糊负例采样在密集文本检索中的应用
提出了一种简单的 “SimANS” 方法用于负采样,通过使用新的采样概率分布来选择歧义性更大的负例,并显示相对于已有方法更加有效。
- ACL其他角色很重要!通过角色交互增强面向角色的对话摘要
该论文介绍了一种基于角色的对话总结的新方法,采用交叉关注和解码器自我关注交互来获取其他角色的关键信息,证明了其他角色信息可以帮助生成更完整语义和正确主题结构的总结。
- 关于信息和证明的关系
本文提出了一种基于证明的信息量度量方法,该方法以涉及待证公式的可能证明集合(即 “知识库”)定义概率度量,使用熵的方法计算信息量。
- 利用意义建构和叙事的图像理解系统
介绍人类理解世界的两个概念:Sensemaking 和 narrative。分析它们与信息、计算机系统和视觉叙事之间的联系,并提出利用 Sensemaking 和 narrative 组件来增强视觉叙事解决方案的想法。最后讨论了目前使用 S - ICML利用可利用信息解读数据集难度
本文提出了一个度量模型难度的方法,并使用输入属性的变换模拟模型难度,发现了广泛使用的 NLP 基准测试集中的注释缺陷。
- 何时需要记忆不相关的训练数据以实现高准确度学习?
本研究旨在探讨现代机器学习模型是否必须要记忆所有训练样本中的信息才能够准确学习,对于这个问题,我们提出了两个预测问题的简单变体并进行了探究,结果表明,即使高维度的样本信息熵远高于样本数且其中的大部分信息与任务无关,每个准确的训练算法必须在其 - 一种无监督的领域无关框架,用于自动检测文本中的说服策略
本文利用多类别分类问题的机器学习框架,探讨社交媒体上一些具有欺骗性、有误导性的文本的检测方法,利用已有的语料库【英文原文:lexical features】和提取文本固有结构的方法进行处理,并取得了良好的进展。
- KDD基于社交媒体分析的智能灾害响应 —— 综述
本文综述了利用社交媒体进行智能化灾难救援和响应的新前沿,研究了灾难的不同阶段在社交媒体上如何表现,建立了基于社交媒体的建议方法与首次救援组织之间的联系,并概述了当前挑战和未来研究方向。
- 有向网络的持久路径同调
利用 Grigor'yan, Lin, Muranov 和 Yau 构造的有向图同调研究持久化范畴中的非对称性,提出了持久路径同调,并在模拟和真实的有向网络上验证了其特征。