- 自动生成的大型语言模型在自动事实检查中的应用:综述
通过调查生成型大型语言模型在事实核查领域的利用情况,本综述旨在提高对大型语言模型在事实核查中的运用的理解并促进进一步的发展。
- 基於機器學習的從多個推文參數中檢測客戶滿意度的方法
自互联网技术发展以来,客户满意度一直是公司发展中的主要因素之一。在线平台已成为分享评论的主要场所之一,Twitter 是其中之一,客户经常在这些平台上发布自己的感想。对于航空公司而言,在这些平台上的航班点评已成为问题。正面的点评可以帮助公司 - ICLR社交奖励:通过千万用户的在线创意社区反馈评估和增强生成型人工智能
社交奖励作为一种社区认可形式,是在线平台用户参与和贡献内容的强大动力。最近文本驱动的图像合成的进展开启了人工智能赋予用户创作原创视觉艺术,并寻求社区认可的协作时代。本研究在集体社区偏好的背景下评估这些模型带来了独特的挑战。现有的评估方法主要 - 双边市场中用户和创作者的匹配问题
许多当前的在线平台,包括社交媒体网站,是连接内容创作者和用户的双边市场。本研究提出了一个内容推荐模型,明确关注用户与内容匹配的动态,并具有用户和创作者可能永久离开平台的新特性。我们展示了两种实用算法,在考虑双边离开的情况下,在总体参与度方面 - DSA 透明数据库:社交媒体自我报告的内容审核行为审计
自 2023 年 9 月起,数字服务法案要求大型在线平台向数字服务法案透明数据库提交详细的每项内容审查行动数据,在网络关键领域引发了学术界的广泛兴趣。本研究通过全面分析欧盟内八个最大的社交媒体平台在数据库的前 60 天提交的 1.96 亿份 - 哪些语言线索使人们信以为真虚假新闻?认知和情感处理的比较
研究探讨了虚假新闻中语言线索的作用,发现用户在阅读较长的虚假新闻文章时更多地从事认知加工,而采用分析性词汇书写的虚假新闻引起更多的情感加工,这对于设计鼓励用户进行仔细思考的在线平台以防止其受骗具有重要意义。
- EMNLP为何应删除此文章?多语言维基百科编辑讨论中的透明立场检测
通过构建多语言数据集和联合预测模型,该研究提供了透明化内容审查的决策过程,以提高在线平台上内容的透明度和自动化审查研究的进展。
- 采样始终群体公平的个体公平排序
本研究提出了一种有效的算法,在保持个体公平的情况下,从一组项目中随机抽样出排名,以确保输出排名满足群体公平性限制,同时保证输出排名的期望效用至少是最优公平解的效用的 α 倍,进而实现在线平台的算法公平。
- 在推荐系统中插值项目和用户公正性
研究了在线平台中多种利益相关者之间的公平和协调问题,提出一种公平推荐算法来平衡商品销售和用户需求之间的矛盾,并设计了一种低遗憾的在线优化算法,以同时达到商品和用户的公平,最终通过电影数据的案例研究证明了该算法的有效性。
- 个性化系统中用户学习的因果估计
本研究提出了一种非参数因果模型来研究个性化系统中的用户行为,并介绍了新的实验设计,可以通过干预系统个性化来区分用户学习效应和个性化效果。模拟结果表明,所提出的新设计可以成功恢复感兴趣的动态因果效应。
- 在线表示很重要:搜索和推荐系统中的实用端到端多样化
为了在在线平台中提高用户的代表性,我们提出了一种端到端的多样化机制,包括检索、排名和负责平衡多样性和实用性的多目标优化;实验结果表明这种方法显著提高了多样性,并且在实用性方面具有中性到正面的影响。
- SIGIR公平排名中相关性的作用
本文探讨了线上平台提供的机会接触机制,阐述了其中的公平性问题,分析了评估排序指标时需要考虑的多个要素,结合一个案例研究证明了当前基于用户点击反馈的排序指标无法满足所有要求,为实现公平排序指标提供了新的思路。
- ICLRUATTA-EB:基于 BERT 的不确定性感知测试时间增强集成模型,用于社交媒体帖子中的常见心理疾病分类
本研究提出了 UATTA-EB 方法,利用深度学习模型分析 Reddit 用户在网络平台上的非结构化数据,精准识别和分类六种心理疾病(抑郁症、焦虑症、双相障碍、注意力缺陷多动障碍(ADHD)、创伤后应激障碍(PTSD)和无疾病),解决了模型 - 通过可控的查询生成提高搜索中的内容可检索性
在线平台中重要的目标是促进内容发现,然而,机器学习搜索引擎存在较高的检索偏差,我们提出了一种生成查询的方法,旨在改善训练数据和查询分布对检索能力的负面影响。在音乐、播客和图书等领域的数据集上,使用 CtrlQGen 明显减少了密集检索模型的 - 跨平台跨领域监督对比学习下的滥用语言检测
本文旨在解决不同在线平台上滥用语言的检测问题,提出了一种基于 SCL-Fish 的监督对比学习集成元学习算法,具有领域泛化目标并比先前的算法更加高效和优越。
- 边缘平台上的反社会行为外溢:社区封禁的无意后果
该研究使用差异法设计来研究被 Reddit 和 Facebook 封禁的三个社区迁移到边缘平台的用户,并发现与这些社区共同参与可能导致用户在 Reddit 上的毒性言论和违反平台规范的行为增加,并随着时间和曝光度而加剧。
- KDD通过仇恨言论规范化,在线帖子的仇恨强度主动降低
该研究旨在通过提出新颖的方法(NACL)来描述如何减弱网络上的仇恨言论。通过将其优化为更为平和的表述,而非采用一揽子禁止手段,从而向用户提供跨越到非仇恨言论的途径,并为在线平台提供更多监控改善用户行为的时间。
- MentSum:探索在线心理健康文章摘要的资源
为了帮助心理医生快速处理心理健康在线帖子,我们介绍了 MentSum 数据集,包含超过 24k 来自 43 个心理健康 subreddit 的用户帖子和 TLDR 小结,并进一步评估了抽取和抽象式自动摘要方法。
- AAAI重新考虑推特:在推文创建期间进行干预可减少冒犯内容
本研究在 Twitter 上进行随机对照试验,评估了一种新的干预方法,使发帖者有机会暂停并重新考虑他们的推文,结果发现接受干预的用户比未接受干预的用户发布的冒犯推文少 6%,该干预不仅减少了暂停后的危害推文的数量,还降低了未来的发布和回复数 - MM利用领域自适应技术对酒店嵌入进行匹配,用于下一个项目推荐
本研究基于 hotel2vec 模型,提出了一种简单的正则化方法,通过域自适应对不同品牌的酒店嵌入进行对齐,并探讨了在跨语言嵌入中使用的对齐方法。结果表明,该方法可以在两个品牌之间对齐两个嵌入空间,并在两个品牌中均实现良好的性能表现。此外,