使用深度学习克隆意识形态和风格
研究了一种新的文体控制方法,使用现有的句子作为软模板,包括一种混合注意力 - 复制机制、弱监督学习及新的内容覆盖约束,结果表明该方法在餐馆和体育领域表现更好,在内容保真度和文体控制之间取得了较好的平衡。
Jan, 2019
通过端到端训练的两步生成模型,即首先由句子级内容规划器决定涵盖的关键词组和所需的语言风格,然后由表面实现解码器生成相关和连贯的文本,可以显著优于现有竞争模型,在 Reddit 的说服性论证、维基百科的正常和简单版本的段落生成以及科学文章的摘要生成等任务中得到验证。
Sep, 2019
本研究介绍了复杂文本风格转换任务的概念,并基于两个广泛适用的场景构建了复杂文本数据集。我们的数据集是这一类别的首个大规模数据集,包含 700 条改写句子和 1000 条《原神》游戏中的句子。虽然大型语言模型(LLM)在复杂文本风格转换中显示出了潜力,但存在数据隐私问题、网络不稳定性和高部署成本等缺点。为了解决这些问题,我们通过对比学习探索了小型模型(小于 T5-3B)通过隐式风格预训练的有效性。我们还提出了一种基于与人类评估对齐的文本生成质量自动评估方法,使用 ChatGPT。最后,我们将我们的方法与现有方法进行了比较,并展示了我们的模型在少样本文本风格转换模型方面达到了 state-of-art 的性能。
Sep, 2023
本文探讨了自然语言生成在任务导向对话中的应用,提出了三种序列到序列模型,并考虑如何实现内容和风格的分离,通过控制 36 个风格参数,实现对语义和风格的高度还原。
May, 2018
本文介绍了使用基于意识形态的预训练目标的预训练语言模型进行意识形态预测的新方法,并介绍了一个大规模数据集 POLITICS,该数据集包含超过 3.6M 篇政治新闻文章,并展示该模型在意识形态预测和立场检测任务上的性能优越性。
May, 2022
通过介绍 Artbreeder 上由 95K 用户生成的 680 万图片和 180 万提示的全面数据集,我们引入了一系列任务来识别多样的艺术风格、生成个性化内容并根据用户兴趣推荐风格。通过记录超越传统类别如 'cyberpunk' 或 'Picasso' 的独特用户生成风格,我们探索了用户全球集体创造心理的潜能。我们还评估了不同的个性化方法以增强艺术表达,并引入了一个风格地图集,以公共用户的方式呈现这些模型。我们的研究展示了文本到图像扩散模型发现和推广独特艺术表达的潜能,进一步使 AI 在艺术中具有民主化,促进更加多样和包容的艺术社区。数据集、代码和模型可以在此 https URL 获取,采用公共领域(CC0)许可证。
Jun, 2024
通过对人类写作文本和基于大型语言模型的生成文本进行比较研究,该论文展示了在不同文体中对于人类文本和生成文本进行分类的机器学习模型的效果,同时指出在故事写作方面识别生成文本的困难性,为未来在人工智能文本识别方面提供了启示和研究数据集。
Jul, 2023
本文提出一种迁移学习框架,通过更新模型参数的 0.3%来学习响应生成的特定风格属性,解决了在话务系统中保持一致的人物形象和风格的问题。研究表明,个性是改善会话系统参与度和用户体验的关键驱动因素。同时,本研究通过在 ROC 故事语料库中研究风格故事结尾生成问题,从 PERSONALITY-CAPTIONS 数据集中学习风格特定属性,并通过大量实验和评估表明,该新颖的训练方法可以提高风格生成的效果。
Oct, 2022