- 正式辩证推理是否可以提升 LLMs 的性能?
介绍了一种计算论证语义引擎(MQArgEng)和初步研究,评估引入计算论证语义对大型语言模型性能的影响。实验结果表明 MQArgEng 在大部分考察的主题类别中提供了适度的性能提升,呈现出潜力并值得进一步研究。
- WWWGPT 生成文本检测:基准数据集与基于张量的检测方法
通过 GPT Reddit 数据集(GRiD)和新颖的 GpTen 张量基准模型,本论文提出了一种对 ChatGPT 生成的文本进行检测的方法,旨在评估检测模型在识别 ChatGPT 生成应答方面的性能。该数据集包含了基于 Reddit 的 - ICML控制随机性改善 Transformer 模型的性能
文中介绍了在自然语言模型的预训练阶段中,通过引入控制性的随机性(即噪音),可以提高模型的微调性能,并在具体的下游任务中探索噪音添加的效果。通过两个下游任务,即联合实体识别与关系抽取以及文本摘要,发现添加此类噪音能够提升性能。
- Transformer 的结构自监督目标
本文重点研究如何通过使用无监督原始数据来改善自然语言模型的预训练,使其更高效并与下游应用相匹配。在第一部分中,我们介绍了三种替代 BERT 的 Masked Language Modeling(MLM)的预训练目标,分别为 Random T - 基于树形表示与生成的自然语言与数学语言
本文提出一种将数学语言与自然语言一起表示和生成的语言模型,MathGPT,在数学表达式生成任务上表现出超越基准模型的性能。
- 利用大规模语言模型的有针对性网络钓鱼攻击
本研究旨在探讨自然语言模型如 GPT-3 和 GPT-2 生成有效钓鱼邮件的潜力,并提出了一个框架来评估其性能,我们的研究结果表明,自然语言模型生成的钓鱼邮件容易逃避垃圾邮件过滤器并且成功率高,在恶意目的下使用自然语言模型存在着重大安全和道 - 利用数据包络分析评估自然语言模型的资源和性能权衡
本文采用数据包络分析(DEA)对自然语言模型进行资源 - 性能交易的评估,得出了一组有效的性能和效率评估框架,并成功地应用于 14 个不同语言模型的实证结果,该方法可以平衡性能和资源消耗。
- 学习自然语言模型中的用户 - 实体差分隐私
本文提出了一种新颖的用户 - 实体差分隐私(UeDP)的概念,以同时为文本数据中的敏感实体和学习自然语言模型的数据所有者提供正式的隐私保护。为了保护 UeDP,我们开发了一种新算法 UeDP-Alg,该算法对用户和敏感实体采样过程进行紧密的 - EMNLPPHEE: 从文本中提取药物监管事件的数据集
本研究描述了 PHEE 数据集,该数据集包括超过 5000 个医疗案例报告和生物医学文献,是该领域迄今为止最大的公共数据集,用于药物安全、药物监测,从而可以通过自动化迅速识别安全信号。同时,我们还评估了目前的生物医学事件提取的方法,指出其局 - ZeroQuant: 大规模 Transformer 的高效和实惠的后训练量化
本研究提出了一种有效而实惠的后训练量化方法,ZeroQuant,用于压缩大型 Transformer-based 模型。ZeroQuant 采用细粒度硬件友好量化、层内知识蒸馏算法、优化的量化系统等三个主要组成部分,能够在尽可能减少精度损失 - 使用 seBERT 预测问题类型
本文介绍了一种基于 BERT 架构的新型模型 seBERT,通过对该模型进行 微调,针对 NLBSE 挑战任务的问题类型预测,我们的模型在召回率和精确度上 均优于基准 fastText 模型,最终取得了 85.7% 的 F1 分数,比基准模 - AAAI使用神经文本生成器欺骗在线作者归属模型:你是罗伯特还是罗伯塔?
本文探讨自然语言模型在生成具有被误认为是他人所写的能力的在线文本方面的潜力,发现当前的这类技术中 GPT-2 可成功地模拟与欺骗常见的作者识别的方法,说明了这类技术的巨大潜力和其实际应用如非法信息识别和犯罪取证的重要性。
- WWWWebFormer: 网页转换器,用于结构信息提取
本文介绍了 WebFormer,一种从 Web 文档中提取结构化信息的 Web 页面转换模型,借助自然语言模型和图注意力等技术,实现了序列化难以提取出的 Web 页面标记数据的结构化信息提取,通过 SWDE 和 Common Crawl 测 - ICLR利用目标信息的文本对抗攻击的改进和提升
本文研究了利用目标模型输出和数据对攻击率和查询率的影响,并表明两者都可以提高,同时附加查询的开销有限。
- EMNLP词汇特征更易受攻击,句法特征具有更强的预测能力
本文研究语言特征的易受攻击性,分析了特征值变化和预测功效变化等两个层面,结果表明词汇特征比句法特征更容易受到攻击,然而句法特征的微小变化却比词汇特征更能影响后续的分类表现。三个数据集的验证证实了这些结果。
- CVPR利用文本预测行动动机
本文介绍了在计算机视觉中应用自然语言模型,从大量文本中获取知识;通过将该知识转移到视觉任务中,可以帮助计算机视觉系统理解人们在图像中执行操作的动机,尽管完全理解动机仍然有很长的路要走。