- 基于语法对齐的解码
通过提出自适应采样算法(ASAp)来解决语法对齐解码(GAD)问题,该算法确保输出结果遵循给定的语法约束,同时与语言模型的条件概率分布相匹配,以高概率生成高质量的输出。
- 安全代码生成的约束解码
通过引入新的基准 CodeGuard + 和两个新的度量标准 secure-pass@k 和 secure@$k_{ext {pass}}$,本文展示了 Code Large Language Models 在生成安全和正确代码方面的能力, - 准确引导 LLMs 的快速非侵入式约束生成
为了确保大型语言模型生成的文本符合预期格式,本论文提出了一种名为 DOMINO 的创新解码算法,能够以完全子词对齐的方式执行约束,同时利用预计算和推测解码来几乎不增加开销,有时甚至实现接近 2 倍的速度优化,从而在很大程度上胜过现有方法。
- ICLR跨语言标签投影的约束解码
零 - shot 跨语言迁移利用多语言 LLMs 已成为一种流行的学习范式,适用于低资源语言没有标记的训练数据。然而,在涉及单词和短语细粒度预测的 NLP 任务中,零 - shot 跨语言迁移学习性能远远落后于有监督的微调方法。因此,通过使 - 基于草图引导的有限制解码方法,用于增强黑盒大型语言模型的性能而无需访问逻辑层
该论文介绍了一种名为 sketch-guided constrained decoding (SGCD) 的新型黑盒大型语言模型的约束解码方法,利用本地辅助模型改善未约束的黑盒大型语言模型的输出,使其作为进一步详细描述的 “草图”,从而在无 - 朝着可信赖的 AI 软件开发辅助
介绍了构建、训练和使用可靠的人工智能软件开发助理的整体架构,其中包括基于真实编码场景和复杂软件架构进行训练的 LLM,利用基于图形的代码表示进行高级语义理解,整合知识图谱以提供最新背景知识,并通过模块化的解码框架确保生成代码的正确性和安全性 - EMNLP一次性答案生成和证据检索
1-Pager 是第一个使用单个基于 Transformer 模型和解码过程回答问题和检索证据的系统,通过使用约束解码来增量地分割检索语料库以选择文档和答案字符串,我们展示了其在检索和答案准确性指标上与可比较的检索和阅读替代方法相竞争。1- - ACL揭示序列到序列模型在序列标注和结构解析中的真正潜力
本篇论文系统研究了利用包含解码技术的序列到序列模型(Sequence-to-Sequence,简称 S2S)开展的语音识别、命名实体识别、组成性和依赖分析等任务。作者设计和评估了三种不同的线性化模式及相对应的约束解码模式,进行了实验比较,结 - 利用大型语言模型改进长篇口语翻译
本研究旨在通过微调大型语言模型,将长语音自动识别转换成短模块,以提高翻译质量,在三种语言上表现实验效果优于自动标点基线,同时使用两种条件解码策略提高输出的良好性。
- 互动机器翻译中提供建议的简易引导解码
本文提出一种使用参数化的神经机器翻译目标函数的简单约束解码算法来改善翻译质量的方法,并在一个基准数据集上进行了验证,结果表明该算法在翻译质量和时间效率方面都优于现有方法。
- TIARA: 大规模知识库中鲁棒性问答的多粒度检索
本文提出一种新的知识库问答模型 TIARA,通过多粒度检索帮助预训练语言模型集中于最相关的知识库上下文,并应用约束解码来控制输出空间并减少生成错误。实验证明,TIARA 在 GrailQA 和 WebQuestionsSP 等基准测试中表现 - 自然语言编写商业自动化的无码低码范式
本研究提出了一种基于自然语言处理的业务自动化构建范例,通过应用大型自然语言模型将业务规则和自动化描述转换为业务规则引擎可解释的领域特定语言,以解决业务用户缺乏足够的编程能力的问题。实验比较了不同语言模型配置在不同目标领域下的性能,并探索了应 - 利用表达式树推断进行政策遵从性检测
本文介绍了一种从政策文本中自动推断出表达树的方法,使用有限状态自动机确保生成的有效性,自动评估显示 63%的表达树与黄金树在逻辑上等价,而人工评估显示 88%的表达树正确。
- ACL使用话语级别规划和美学特征的零样本十四行诗生成
本文提出了一个新的层次框架,用于生成十四行诗,不需要训练。该框架包括内容规划模块、韵脚模块和润色模块,并设计了受约束的解码算法以实现生成的十四行诗的韵律和韵脚约束。自动和人工评估表明,该框架比几个强基线更具连贯性、诗意和创造性。
- ACL探究对话回应中的人身攻击
本文提供了 ad hominems 的分类方法,并从语料库中提取样本来讨论人类和对话系统在 Twitter 上对特定话题的回应。本文还提出了一种约束解码技术,以减少生成的 ad hominems 数量。结果表明,Marginalized c - ACL训练神经机器翻译应用术语约束
本文提出了一种新颖的方法,在神经机器翻译中运行时注入自定义术语。作者通过训练神经机器翻译系统学习如何在输入时使用自定义术语,并比较实验证明这种方法不仅更有效,而且与自由约束解码一样快。
- ACL使用术语约束的神经机器翻译解码
本研究描述了基于有限状态机和多堆栈解码的受约束神经机器翻译解码方法,支持目标端约束以及对应对齐输入文本跨度的约束条件,在多个翻译任务上表现出较好的性能,通过注意力受约束解码的方式减少用户约束翻译时的错置和重复。