使用深度学习克隆意识形态和风格

Oct, 2022

使用深度学习克隆意识形态和风格

Cloning Ideology and Style using Deep Learning

Dr. Omer Beg, Muhammad Nasir Zafar, Waleed Anjum

TL;DR该研究使用 Bi-LSTM 模型基于特定作者的思想和风格生成主题非该作者编写的一篇文章。在训练语料库中包含特定作者的作品和现成的真实语料库以及使用预训练模型识别矛盾的语句，实现了字符级别的 perplexity 得分。

Abstract

text generation tasks have gotten the attention of researchers in the last few years because of their applications on a large this http URL the past, many researchers focused on task-based text generations.Our research focuses on text generation based on the ideology and style of a

text generation specific author bi-lstm training corpus perplexity score

发现论文，激发创造

数据到文本的生成与风格模仿

研究了一种新的文体控制方法，使用现有的句子作为软模板，包括一种混合注意力 - 复制机制、弱监督学习及新的内容覆盖约束，结果表明该方法在餐馆和体育领域表现更好，在内容保真度和文体控制之间取得了较好的平衡。

Jan, 2019

神经文本生成的句子级内容规划和风格规范

通过端到端训练的两步生成模型，即首先由句子级内容规划器决定涵盖的关键词组和所需的语言风格，然后由表面实现解码器生成相关和连贯的文本，可以显著优于现有竞争模型，在 Reddit 的说服性论证、维基百科的正常和简单版本的段落生成以及科学文章的摘要生成等任务中得到验证。

Sep, 2019

基于风格表示的机器生成文本的少样本检测

利用人类文本估计的写作风格来区分人类作者和机器作者，以及预测给定文档由哪个语言模型生成。

Jan, 2024

学习在任意书写风格中生成文本

通过对比训练的表示捕捉风格特征，从而引导语言模型以目标风格生成文本，实现满足作者特定风格的生成，而不需要微调底层语言模型。

Dec, 2023

通过潜在属性预训练，将小型语言模型专门化为复杂风格转换

本研究介绍了复杂文本风格转换任务的概念，并基于两个广泛适用的场景构建了复杂文本数据集。我们的数据集是这一类别的首个大规模数据集，包含 700 条改写句子和 1000 条《原神》游戏中的句子。虽然大型语言模型（LLM）在复杂文本风格转换中显示出了潜力，但存在数据隐私问题、网络不稳定性和高部署成本等缺点。为了解决这些问题，我们通过对比学习探索了小型模型（小于 T5-3B）通过隐式风格预训练的有效性。我们还提出了一种基于与人类评估对齐的文本生成质量自动评估方法，使用 ChatGPT。最后，我们将我们的方法与现有方法进行了比较，并展示了我们的模型在少样本文本风格转换模型方面达到了 state-of-art 的性能。

Sep, 2023

用神经自然语言生成器控制基于个性的风格变化

本文探讨了自然语言生成在任务导向对话中的应用，提出了三种序列到序列模型，并考虑如何实现内容和风格的分离，通过控制 36 个风格参数，实现对语义和风格的高度还原。

May, 2018

政治：基于同一故事文章比较的预训练模型用于意识形态预测和立场检测

本文介绍了使用基于意识形态的预训练目标的预训练语言模型进行意识形态预测的新方法，并介绍了一个大规模数据集 POLITICS，该数据集包含超过 3.6M 篇政治新闻文章，并展示该模型在意识形态预测和立场检测任务上的性能优越性。

May, 2022

Stylebreeder: 通过文本 - to - 图像模型探索和使艺术风格大众化

通过介绍 Artbreeder 上由 95K 用户生成的 680 万图片和 180 万提示的全面数据集，我们引入了一系列任务来识别多样的艺术风格、生成个性化内容并根据用户兴趣推荐风格。通过记录超越传统类别如 'cyberpunk' 或 'Picasso' 的独特用户生成风格，我们探索了用户全球集体创造心理的潜能。我们还评估了不同的个性化方法以增强艺术表达，并引入了一个风格地图集，以公共用户的方式呈现这些模型。我们的研究展示了文本到图像扩散模型发现和推广独特艺术表达的潜能，进一步使 AI 在艺术中具有民主化，促进更加多样和包容的艺术社区。数据集、代码和模型可以在此 https URL 获取，采用公共领域（CC0）许可证。

Jun, 2024

模仿游戏：在大型语言模型时代检测人类和 AI 生成的文本

通过对人类写作文本和基于大型语言模型的生成文本进行比较研究，该论文展示了在不同文体中对于人类文本和生成文本进行分类的机器学习模型的效果，同时指出在故事写作方面识别生成文本的困难性，为未来在人工智能文本识别方面提供了启示和研究数据集。

Jul, 2023

基于转移学习和 Adapter 的无监督神经风格文本生成

本文提出一种迁移学习框架，通过更新模型参数的 0.3％来学习响应生成的特定风格属性，解决了在话务系统中保持一致的人物形象和风格的问题。研究表明，个性是改善会话系统参与度和用户体验的关键驱动因素。同时，本研究通过在 ROC 故事语料库中研究风格故事结尾生成问题，从 PERSONALITY-CAPTIONS 数据集中学习风格特定属性，并通过大量实验和评估表明，该新颖的训练方法可以提高风格生成的效果。

Oct, 2022