- EMNLPInsightNet:从客户反馈中挖掘结构化洞见
用于提取结构化见解的自动化方法 InsightNet 能从客户评论中生成影响力,过程中克服了当前解决方案的限制,包括已确认主题的缺乏结构,非标准方面名称和缺乏丰富的训练数据。
- 大规模语言模型对图的调查
通过综述最新的最先进的用于图学习的大型语言模型,我们引入了一种新的分类方法,详细阐述了四种独特的设计,并探讨了每种框架的优势和局限性,同时强调了未来研究的潜在方向。
- 图结构化数据中的异常检测:一项调查
综述了基于图数据的异常检测技术,包括应用领域、假设和技术分类、改进方法的基本研究思路以及现有技术的优缺点,最后探讨了基于图结构数据的异常检测领域的未来研究方向。
- 通过自然语言处理进行计算机工作市场分析
利用自然语言处理技术从职位描述中提取相关信息,包括解决训练数据的稀缺性、标注指南的缺乏以及从职位广告中提取有效信息的不足等挑战,最终通过引入抽取方法和多个数据集相辅相成的检索增强模型来提高整体性能,并将提取到的信息置于特定分类体系中。
- 低质量数据的多模态融合:全面调查
基于低质量数据的多模态融合面临四个主要挑战:噪声多模态数据,不完整多模态数据,不平衡多模态数据和质量变化多模态数据。本文通过全面的分类对多模态融合的常见挑战和最新进展进行调研,为研究人员提供了了解该领域现状和发现潜在研究方向的方法。此外,本 - 社交媒体中分类人工生成和 AI 生成的选举主张
我们提出了一种用于分类选举相关言论的新颖分类体系,介绍了一个基于人工智能生成的推文数据集和机器学习模型来区分人类和人工智能生成的帖子,并识别特定的大型语言模型变体。
- 拍卖式联邦学习中的智能代理:一项综述
该论文提供了首次的智能代理人对拍卖联邦学习(IA-AFL)文献的综述,通过提出一个独特的多层次分类法,将 IA-AFL 的现有研究组织成为以利益相关者、采用的拍卖机制和代理人目标为基础的多角度视角,同时分析了现有方法的局限性、总结了常用的性 - SIGIR面向人类中心的主动对话代理
近期关于主动对话代理(PCAs)的研究主要集中在提高系统在用户表达需求之前,预测和计划行动序列以完成任务和实现目标的能力。这篇论文强调了朝着强调人类需求和期望,考虑代理的伦理和社会影响,而不仅仅关注技术能力的以人为中心的 PCAs 的重要性 - 可解释的生成人工智能 (GenXAI):调研、概念化与研究议程
生成人工智能(GenAI)标志着人工智能能够生成解决方案,从而实现能够认知的人工智能,但也引出了解释可解释性(XAI)的新需求和挑战。本文首先强调了 XAI 在 GenAI 的重要性,并介绍了解释要求的新颖性和涵盖的方面。接着,我们对现有的 - AI 数据准备:360 度调查
通过全面调查和分析超过 120 篇学术论文及 AI 专家的文章,本研究提出了对结构化和非结构化数据集的 AI 数据就绪度 (DRAI) 测量指标的分类法,旨在为 AI 训练的质量和准确性提供新的标准。
- 生成式人工智能搜索中敏感用户查询的分类和分析
本文通过在一个全国范围内的搜索引擎中开发和运营生成式 AI 模型的经验,特别关注用户查询的敏感性,提出了一种用于敏感查询的分类法,并呈现了来自实际用户的敏感查询的综合分析报告。
- 基于人工智能方法的专利综合调查
最近人工智能(AI)和机器学习在各个领域展示了具有变革性的能力。本研究概述了 2017 年至 2023 年间超过 40 篇论文中关于专利分析的最新人工智能工具,包括适用于专利图像和文本数据的方法。此外,我们提出了一种基于专利生命周期任务和人 - LLM 动力编码生成中的幻觉探索与评估
通过主题分析,我们对生成的代码进行了总结和分类,建立了包括五个主要类别的幻觉的综合分类法。基于结果,我们提出了一个评估代码 LLM 性能的基准,名为 HalluCode,并通过 HalluCode 和 HumanEval 进行了幻觉识别和减 - 基于大型语言模型增强强化学习的调研:概念,分类和方法
大规模语言模型在增强学习中具有广泛的预训练知识和高水平的通用能力,本文对现有文献进行了综述,概括了大规模语言模型增强学习与传统增强学习方法的特点,并提出了一个结构化的分类法来系统地分类大规模语言模型在增强学习中的功能和方法,并讨论了其潜在应 - 视觉 Transformer 网络的效率提升:设计技术与洞见
通过重新设计注意力机制,本研究对视觉变换网络(ViT)中的注意力机制进行了全面探索,以提高其性能。包括理论基础、基本概念、关注机制的系统分类以及性能评估等方面的综述。
- COLING任务导向的释义分析
通过文献综述和提出分类法,本研究对 25 个已知的改写(子)任务进行整理和组织。使用分类器识别给定改写实例适用的任务,发现已知改写语料库中特定任务实例的分布差异很大。这意味着在没有明确定义相应改写条件的情况下使用这些语料库会导致不可比较和误 - AI 神木:一个设计类别分析
通过构建一种设计方法论,本文研究了陶醉在人工智能设计中所扮演的角色,鉴别了增加或减少魔力和陶醉感知的设计方法,并通过分析设计与人工智能的交互项目,提出了七项设计原则,最后探讨了该设计方法论对设计 / HCI 从业人员特别是在支持探索和反思方 - ACL自然语言处理中的模糊类型分类
近期的研究指出,NLP 系统在理解人类语言时可能会遇到困难,因为它们可能无法像人类自然地处理语言的歧义。本文提出了基于英语的歧义类型分类法,旨在帮助 NLP 分析,并通过对数据集和模型性能进行更精细的评估。
- Transformer 中的推理:减轻伪相关性和推理捷径
用已知有误导性关联的数据集,在逻辑推理任务中训练两种模型:基于证明的生成式 Transformer 模型 WP-BART 和神经符号模型 SIP-BART。结果发现,SIP-BART 能够避免逻辑推理的捷径,而 WP-BART 无法。对于 - R^2-Bench: 参照感知模型在干扰下的鲁棒性基准测试
本研究评估了引用感知模型对各种扰动在通用和特定情境下的鲁棒性,提出了扰动的综合分类,并开发了一个多功能工具箱来合成和评估复合扰动的影响。通过该工具箱,构建了一个评估引用感知模型对嘈杂条件下的健壮性的基准,同时还提出了一种基于语言模型的代理机