- CVPRDocSynthv2:面向文档生成的实用自回归建模
通过开发一种简单且有效的自回归结构模型,本文在探索综合文档生成,即包括布局和内容的文档生成的更复杂挑战方面提出了名为 DocSynthv2 的新方法,通过关注文档内结构元素与文本内容之间的关系,我们旨在生成连贯且与上下文相关的文档,不依赖于 - 对于事实性、毒性、偏见和幻觉倾向进行的 Llama2、Mistral、Gemma 和 GPT 的基准测试
本研究主要介绍了用于评估大型语言模型在企业任务中安全性的十四个新数据集。我们采用了一种方法来评估模型的安全性,即其遵循指令和输出事实、无偏见、立足点的内容的能力。在此研究中,我们使用 OpenAI GPT 作为对比点,因为它在所有安全性层面 - MM幸存的男孩:从 LLM 中删除哈利・波特比报道中更为困难
近期的研究发现模型生成和回忆与哈利波特相关的内容,包括特定提及哈利波特和使用的模型。
- 您信任 ChatGPT 吗?—— 人工智能生成内容与人类创作内容的可信度认知
研究表明,不管用户界面版本如何,参与者倾向于将人类作者和由大型语言模型生成的内容归于相似的可信度水平。他们对于人工智能生成的内容并不认为其能力和可靠性有所不同,但评价人工智能生成的内容更加清晰和吸引人。本研究的发现呼吁在评估信息来源时更加谨 - ACL作者身份表达学习能捕捉到文体特征吗?
自动从作者的写作风格中脱离其内容是计算语言学中一个长期存在且可能难以逾越的问题。然而,最近可用的带有作者标签的大型文本语料库使得可以通过完全基于数据驱动的方式来学习作者表征,用于作者归属的任务,这个任务似乎更多地依赖于编码写作风格而不是编码 - 基于排序模块和语音增强的自动语音分离转换
本论文提出了一种语音转换模型,通过只使用两个扩充函数,自动将语音分解成四个部分,而不需要多个手工制作的特征或费力的瓶颈调整。所提出的模型简单但高效,并且实验结果表明,我们的模型在解缠效果和语音自然度方面均优于基线。
- 在线表示很重要:搜索和推荐系统中的实用端到端多样化
为了在在线平台中提高用户的代表性,我们提出了一种端到端的多样化机制,包括检索、排名和负责平衡多样性和实用性的多目标优化;实验结果表明这种方法显著提高了多样性,并且在实用性方面具有中性到正面的影响。
- COLINGCofeNet: 复杂引语提取的上下文和前标签增强网络
本文提出了上下文和先前标签增强网络 (CofeNet),针对文本中具有不同长度和复杂结构的引语进行提取,相比于基于规则和序列标注模型的方法,CofeNet 能够在 PolNeAR、Riqua 和 PoliticsZH 数据集上取得最先进的性 - 利用条件传感器官改进图像翻译
该研究提出了一种基于预先训练的模型的条件信息作为 'content' 的定义,并使用易于优化的重构目标对样式提取器和图像解码器进行训练的方法,以实现更高质量的多模态领域翻译。
- 分析英文维基百科上的 Wikidata 引用
本文研究了 Wikidata 在 Wikipedia 中的使用情况,提出了一种从读者影响程度角度的分类方法,并发现 Wikidata 内容与 Wikipedia 文章内容相结合的比例比之前的研究结果要低,并提出了关于如何更好地跟踪和支持 W - 生成对抗网络中的风格与内容分离
该研究提出了一种新的无监督算法 ——Style and Content Disentangled GAN(SC-GAN),该算法可以让训练的生成敌对网络(GAN)以一种分离风格和内容的方式学习数据的表征。
- EMNLP非平行文本风格转换中的解耦表征学习
本文提出了一个利用多任务和敌对目标进行辅助的简单但有效的方法,用于预测 label 和词袋模型,以此解决了语言模型中风格和内容的潜在变量发掘问题。同时有效地实现了风格迁移,并取得了较之前的最先进方法更好的迁移精度、内容保存和语言流畅度。
- IJCAIMIXGAN:跨域学习用于混合生成的概念学习
本文介绍了一项有趣的混合生成尝试:通过从不同的领域吸收不同的图像概念(例如内容和样式),从而生成一个学习概念的新领域。MIXGAN 可从两个领域分别学习内容和样式的概念,因此可以将它们加入新领域进行混合生成,即生成来自一个领域的内容和来自另 - 基于纹理合成的风格迁移
本文提出了一种新的图像风格转移算法,结合了纹理合成算法和卷积神经网络,通过保持选定区域的内容不变,同时在其他区域产生幻觉和丰富的风格,得到视觉上令人愉悦和多样化的结果,与最近的卷积神经网络风格转移算法相当竞争,且速度快、灵活性强。
- 玻璃天花板下的女性:维基百科中的性别不对称现象
评估维基百科文章中潜在的性别不平等,包括知名度、主题焦点、语言偏见、结构属性和元数据表现方面的差异。结果发现,维基百科中女性比男性更受关注,女性传记中更多有关家庭、性别和关系的主题,存在语言偏见和结构差异,需要注意性别问题对网络造成的各种差 - 探索社交网络中文本的传播性
本文旨在阐明病毒传播的概念,结合社交网络中内容的传播属性,通过机器学习方法初步分析预测病毒传播的影响因素。