无监督文本生成的搜索与学习
本文研究无监督文本生成技术中的优化问题,提出利用学习模型平滑启发式搜索目标函数中的噪声以及与原始目标函数相结合来指导搜索,实验表明,这种方法可以略微提高搜索性能。
Mar, 2022
本文提出一种针对机器生成文档与人工撰写文档进行区分的无监督学习方法,通过利用高阶 n 元模型进行分类,并使用疑似标注文档来训练分类器的集合,成功实现了对疑似机器生成文档的准确评估,并且该方法可适用于各种规模的大型语言模型。
Nov, 2021
本教程关注于文本生成,这是一类自然语言生成任务,它以一段文本作为输入,然后生成一篇按照某些特定标准(如可读性或语言风格)改进的修订版本,同时保留原版文本的大部分含义和长度。
Oct, 2023
该论文提出一种搜索和学习的方法来解决低语义覆盖率问题,进而提高 data-to-text 生成中预训练语言模型的效率,并在 E2E 和 WikiBio 数据集上实现了高性能。
Dec, 2021
通过使用机器学习和大型语言模型,本论文介绍了一种知识工作者系统 Generate And Search Test,该系统能够高效地创建以前需要专家合作才能完成的解决方案。同时探讨了生成型人工智能和搜索引擎如何提供创意和验证事实、逻辑和语境,以消除人为偏见。
Jul, 2023
通过文本生成技术,使用编码器 - 解码器生成模型来增加受训人工智能代理的训练数据,从而实现更快地开发新功能。该方法需要直接优化,适用于有限的数据,并明显优于以往的受控文本生成技术。此外,生成的数据用作外在意图分类任务的附加训练样本,增强了低资源情况下高达 5%绝对 f-score 性能的表现,证实了该方法的实用性。
Oct, 2019
AI 和生成 AI 工具在研究发现和总结方面具有重要作用,通过生成语言模型可以更快地找到相关文献并提取研究论文的关键要点,对统计学家和数据科学家具有重要意义。
Jan, 2024
本文旨在通过学习简化的语义分离潜在表示来生成和控制自然语言句子,同时通过变分自编码器和全局属性判别器的组合来建立新的神经生成模型。该模型具有可解释性和高效性,可以生成符合要求的具有各种属性的句子。量化评估验证了该模型的生成准确性。
Mar, 2017