natural language processing | BriefGPT

关键词natural language processing

搜索结果 - 2861

ACLBotEval: 促进交互式人工评估
自然语言处理 (NLP) 模型在交互任务的快速发展中越来越应用于越来越复杂的任务，我们开发了 BotEval，一个易于定制、开源的评估工具包，重点在于使人与机器交互成为评估过程的一部分，而不是仅对一个静态输入进行人工评判。通过评估各种聊天机
PDF2 days ago
基于章节命名实体和注意力模型的 ICD 编码改进
临床自然语言处理领域中，我们提出了一种改进的 ICD 编码方法，通过使用基于章节的命名实体和注意力模型，将出院摘要进行 ICD-9 章节的分类，并使用双向门控循环单元（GRUs）和变压器多头注意力架构开发关注模型，实现了 ICD 编码的显著
PDF3 days ago
FairFlow: 自然语言处理中基于模型的反事实数据增强的自动化方法
该论文提出了一种名为 FairFlow 的自动化方法，用于生成平行数据来训练反事实文本生成模型，从而减少人为干预的需求，并且展示了 FairFlow 如何显著克服了基于词典替换方法的局限性，同时保持良好的性能。
PDF4 days ago
TookaBERT：波斯语 NLU 迈向前进的一步
我们通过使用波斯语数据训练并引入了两个新的 BERT 模型，并将其与七个现有模型进行了比较，结果显示我们的更大模型在至少 + 2.8 个点的平均改进上胜过了竞争对手，显示了我们的波斯语 NLU 任务中新 BERT 模型的有效性和潜力。
PDF4 days ago
文本到电池配方：基于语言模型的自动提取和检索电池配方的协议
通过自然语言处理应用文献中自动提取实验研究数据的方法，提出了一种基于语言建模的自动提取端到端电池配方的 Text-to-Battery Recipe (T2BR) 协议，并通过对锂电池的案例研究验证。
PDF5 days ago
生成人工智能和大型语言模型的最新进展：当前状态、挑战和展望
研究人工智能生成模型和大型语言模型的当前状态、技术基础、应用和研究领域，以及相关的挑战、责任和伦理整合，并提供宝贵的研究启示.
PDF7 days ago
经济观察员调查为日本金融领域提供数据集和任务
我们构建了两个大型数据集，使用日本中央政府机构发布的材料，提供了三个日本金融自然语言处理任务，其中包括对句子进行三类和十二类分类，以及用于情感分析的五类分类任务。我们的数据集旨在全面而及时，利用自动更新框架确保最新的任务数据集随时对公众可用
PDF7 days ago
PERCORE：基于深度学习的波斯语拼写纠正框架及音标分析
该研究介绍了一种最先进的波斯语拼写纠正系统，将深度学习技术与音标分析完美结合，显著提高了用于波斯语的自然语言处理（NLP）的准确性和效率。该系统通过细调语言表示模型，将深度上下文分析与音标洞察力相结合，巧妙地纠正了非词和真词的拼写错误，并在
PDF7 days ago
PassTSL: 基于两阶段学习模型的人为生成密码建模
使用自然语言处理和机器学习方法模拟密码并破解，实验证明了该方法的潜力和可行性。
PDF8 days ago
LLAssist：利用大型语言模型自动化文献综述的简单工具
LLAssist 是一个开源工具，旨在通过利用大型语言模型（LLM）和自然语言处理（NLP）技术来自动化文献综述过程，从而显著减少全面文献综述所需的时间和精力，帮助研究人员更有效地处理不断增长的学术出版物。
PDF8 days ago
LLMs 作为函数逼近器：术语、分类和评估问题
自然语言处理从建模特定任务快速转向使用更一般的预训练模型，并将其微调为特定任务，现在我们似乎拥有了本质上具有广义模型特性的模型。本文认为这种模型模型失去了清晰度，导致了与其评估优点和缺点无关的类似 “人工通用智能” 的隐喻，因此建议从其近似
PDF9 days ago
自然语言处理中检索增强的生成模型：综述
大型语言模型和检索增强生成技术在各个领域取得巨大成功，但仍存在幻觉问题、知识更新问题和缺乏领域专长等关键问题。本文回顾了检索增强生成技术的显著技术，特别是在检索器和检索融合方面，并提供了教程代码以实现这些代表性技术。此外，本文讨论了检索增强
PDF9 days ago
医疗信函的自动编码与可解释性的比较研究
本研究旨在探索利用自然语言处理（NLP）和机器学习（ML）技术，通过可视化的解释能力和轻量级本地计算机环境自动编码医疗信件。
PDF9 days ago
提升检索的机器学习：综述和机遇
该研究介绍了一种形式化的检索增强机器学习（REML）范式，通过综合不同领域的机器学习文献，为研究人员提供了一个全面、形式化结构的检索增强模型框架，以促进跨学科的未来研究。
PDF10 days ago
ACL土耳其的快乐：土耳其委婉语数据集
该论文扩展了当前对潜在委婉语术语（PETs）在土耳其的计算处理的研究，引入了土耳其 PET 数据集，它是该领域中首个可用的数据集，通过创建土耳其的委婉语列表，收集实例上下文并对其进行注释，提供了土耳其的委婉和非委婉的 PETs 的例子，描述
PDF10 days ago
大型语言模型中不同自然语言处理任务的提示工程方法综述
通过总结 44 篇研究论文，本文讨论了大型语言模型在各个自然语言处理任务中的提示工程技术，包括 39 种不同的提示方法在 29 个不同的任务上的性能表现、使用的语言模型以及对特定数据集的可能最先进技术，并提供了任务分类图。
PDF10 days ago
Sharif-STR 在 SemEval-2024 任务 1 中：Transformer 作为文本语义关系细粒度评分的回归模型
使用 RoBERTa transformer 对语句级 STR（语义文本关联性）进行 fine-tuning 技术的研究，发现了这种方法在不同语言中取得了显著的性能提升，尤其在拉丁语言中取得了令人瞩目的成果。
PDF10 days ago
利用人工智能振兴濒危土著语言：技术与经验
自 2022 年起，我们一直在探索人工智能（AI）和现代自然语言处理（NLP），如大型语言模型（LLMs），可以用来促进和简化濒危土著语言的使用和记录的应用领域和技术。
PDF10 days ago
ACL估计序列标注的随机一致性
该研究介绍了一种新的随机标注模型，用于评估顺序注释任务的可信度，并通过模拟和基于语料库的评估验证了其适用性、准确性和效果。
PDF11 days ago
Sharif-MGTD 在 SemEval-2024 任务 8 中的应用：一种基于 Transformer 的机器生成文本检测方法
利用 RoBERTa 基础变压器作为强大的神经架构，通过精细调整来解决检测机器生成文本的问题，将其作为二元分类任务，并在 SemEval-2024 竞赛框架中的单语言英文子任务（Subtask A）中取得 78.9% 的准确率，在参与者中名
PDF11 days ago