- ALiiCE:评估位置细粒度引文生成
大型语言模型可以通过生成带有引用的文本来增强可信度和可验证性。为了进一步探索细粒度引用的生成,我们提出了 ALiiCE,这是首个针对该任务的自动评估框架。我们的实验和分析证明了 ALiiCE 的有效性和合理性,同时也表明现有的大型语言模型仍 - 针对稀缺数据下核反应堆设计中材料性能的鲁棒预测 -- 研究材料蠕变破裂性能
基于元学习的不确定性和先验知识导向方法,针对核反应堆设计中材料性能的可信预测问题,在数据稀缺情况下,通过产生预测函数的分布来考虑不确定性,取得了比现有经验方法更好的断裂寿命预测结果。该学习方法可用于解决核工业中数据稀缺问题,提高核工业的人工 - 基于概率电路的可信度感知多模态融合
通过使用概率电路来进行预测分布的多模态融合,我们提出了一种可靠地推断可信度的融合方法,并在实验评估中证明了其与最先进方法在性能上的竞争力。
- 利用 Dropout-GAN 进行社交媒体机器人检测
利用生成对抗网络(GAN)的方法来检测社交媒体平台上的机器人活动,克服模式崩溃问题,通过将多个鉴别器与一个生成器训练并解耦鉴别器以进行社交媒体机器人检测,利用生成器进行数据增强,我们的方法在分类准确性方面优于该领域的最先进技术。我们还展示了 - 您信任 ChatGPT 吗?—— 人工智能生成内容与人类创作内容的可信度认知
研究表明,不管用户界面版本如何,参与者倾向于将人类作者和由大型语言模型生成的内容归于相似的可信度水平。他们对于人工智能生成的内容并不认为其能力和可靠性有所不同,但评价人工智能生成的内容更加清晰和吸引人。本研究的发现呼吁在评估信息来源时更加谨 - 跨编码器重新排序中基于多维相关性语句的文档增强
该论文提出了一种新颖的方法来考虑跨编码器重新排序中除主题外的多个相关性维度,并实验结果表明该方法在已公开数据集上的表现优于基于聚合和跨编码器的重新排序方法。
- ReadProbe:支持横向阅读的基于检索增强的大语言模型演示
本文介绍 ReadProbe,它是一款支持横向阅读的工具,使用 OpenAI 的生成式大语言模型和 Bing 搜索引擎,它能够生成有用的问题,搜索相关文档,并生成良好归因的答案,以帮助人们更好地评估在线信息。
- 关于 LLMs 的隐含风险评估:关于鲁棒性,一致性和可信度的实证研究
本研究使用自动化工作流程,对 ChatGPT、LLaMA 和 OPT 等主流 LLM 进行了数百万次查询,得出了 LLM 在稳健性、一致性和可信度方面存在的问题,提出了一种新的关联数据集索引来评估使用 LLM 进行学术评估的可行性。
- 完美的受害者:对性暴力受害者司法态度的计算分析
本研究致力于开发计算模型以分析以色列法院的法官在性暴力案件中对受害者的态度,核心问题是法官在裁定受害者信誓之时是否对强奸神话有共鸣。我们先针对评估法官对受害者可信度的态度进行本体论,然后创建一个人工注释数据集合以及相应模型用于提取法庭案件中 - 大型语言模型可以评估新闻媒体的可信度
本研究评估了 ChatGPT 对新闻机构的可信度评估能力,结果显示大型语言模型可用于事实核查应用程序。
- ACL通过对比学习检测新闻标题中的上下文引用
QuoteCSE 是一种对新闻文章引用的嵌入式对比学习框架,它基于正负样本的域驱动来识别新闻标题中的语境引用,从而提高报导的可信度。
- 一种用于分析葡萄牙语文本可读性的软件
该研究介绍了一种名为 ALT 软件的工具,该软件基于原始的易读性评估指标并针对葡萄牙语进行了改进,旨在降低沟通难度以增强信息传播和有效性,其起源于 Habermas 的 “交际行为” 理论,旨在通过多学科测量方法来衡量公共关系中所使用的沟通 - 自动可信度评估 COVID-19 新闻内容的用户体验设计
该研究通过提出的两项实证研究,评估了图形界面的可用性,并确定了评分标准、子标准和算法作者的重要性。最终,该研究提出了未来研究的建议,如主动记录与可信度相关的元数据,建立自动可信度评估的用户体验预测因素的明确的分层分类。
- 标题诊断:内容农场标题的操纵
该研究基于卷积神经网络开发了一个标题分类器,主要通过调查标题的词语分割、词性标注和情感特征等关键因素,以确定新闻文章的可信度,并将这些特征集成到分类模型中。经过实验证明,该模型的准确度可达到 93.99%。
- 机器翻译评估概述
自 20 世纪 50 年代以来,机器翻译 (MT) 已成为人工智能和开发的重要任务之一,并经历了几个不同阶段的发展,随着这些发展,评估方法在统计翻译和神经翻译研究中扮演着重要角色,该报告概述了评估方法的发展历程、研究方法分类和最新进展,并包 - ACL自我降低风险:报告 NLP 系统失败时需谨慎的原因
研究者应该小心关于自然语言处理技术限制的论断,本文提出了一些研究方向和沟通策略,以避免或驳斥这些论断,并维护领域的可信度。
- AAAI利用样本不确定性进行领域自适应人员再识别
本文提出了一种基于可靠程度估计和不确定度的无监督域适应 ReID 方法,用于削弱嘈杂标签的影响,提高准确性。实验表明,该方法在基准数据集上取得了最优结果。
- KDD互联网索赔数据集及其情感与可信度比较
本文介绍了利用 snopes.com 收集数据并构建数据集,帮助理解所谓 “假新闻” 传播背后的机制,我们还形式化定义了网络主张以及其可信度和情感,并探讨了情感与可信度之间的关系。
- 寻找可信新闻
本篇论文研究了如何在社交媒体中找出虚假新闻。作者提出了基于语言学、可信度、语义等各种特征来自动识别虚假新闻的方法,并使用三个不同的测试集测试了该方法,在高精度的情况下可以准确地区分真实新闻和虚假新闻。
- 使用 Rationale 正则化学习可靠的深度神经网络
提出了 CREX 方法,通过合理利用证据材料、避免数据依赖性偏见、依靠机器辅助生成、并配合专家审查,增强深度学习模型的可信度,相关实验也显示 CREX 在增加深度学习模型可信度方面具有显著效果。