- 任何文本的分段:一种用于鲁棒、高效和适应性句子分割的通用方法
利用新模型解决分隔文本中缺失标点符号的问题,并实现在不同领域的高效表现,以及在实际情况中文字格式不良的具有普适性的分词方法。
- EERPD:利用情绪和情绪调节提升个性检测
基于情绪调节的新的个性预测方法 EERPD 组合情绪特征和个性特征,从文本中提取少样本示例并提供 CoTs 过程,改善个性预测表现,显著提高了个性检测准确性和鲁棒性。
- 语言模型对道德的理解?走向鲁棒的道德内容检测
使用大规模语言模型和自然语言推理模型训练获得的抽象概念和常识知识,我们研发了多领域道德价值检测的多功能和强大方法,其中采用 GPT 3.5 模型作为基于零样本的无监督多标签道德价值分类器,消除了对标记数据的显式训练需求。与较小的基于自然语言 - COLINGSPACE-IDEAS: 空间创新中重要信息检测数据集
使用自然语言处理来检测文本中的显著部分已被广泛应用于减少信息溢出的影响。本研究介绍了一个用于检测与太空领域创新想法相关的显著信息的数据集 SPACE-IDEAS。SPACE-IDEAS 中的文本差异很大,包括非正式的、技术的、学术的和商业导 - CVPR你将永不独行:细粒度图像检索的草图与文本二重奏
这篇论文提出了通过合成模型和文本来改进细粒度图像检索的方法,创新性地将素描和文本结合起来,从而实现了以往无法实现的精确检索,同时提供了解决各种实际场景的解决方案。
- 美国手语视频文本翻译
手语转文字是一项关键技术,可以消除听障者之间的交流障碍。我们在最近发表的研究上进行复制并进行改进,通过使用 BLEU 和 rBLEU 度量来评估模型的翻译质量。在我们的消融研究中,我们发现模型的性能受到优化器、激活函数和标签平滑的显著影响。 - SpiRit-LM: 交叉融合的口语和书面语言模型
我们介绍了 SPIRIT-LM,这是一个混合文本与语音的基础多模态语言模型。我们基于一个预训练的文本语言模型扩展到语音模态,通过在文本和语音单元上进行连续训练来实现。语音和文本序列被连接为一组单词,并使用小型的自动化筛选的语音 - 文本平行 - 时态有效性变化预测
使用基于转换器的语言模型,我们提出了一项基于时态有效性的自然语言处理任务,评估机器学习模型检测引起时态有效性变化的上下文陈述的能力,并提出了辅助任务:预测时态有效性持续时间,以提高最先进模型的性能。
- DreamInpainter: 基于文本引导的主题驱动图像修复通过扩散模型
本研究介绍了一种新颖的任务 —— 基于文本导向的主题驱动图像修复,它将文本和示例图像结合起来进行图像修复。通过同时适应这两个条件,我们提出了一种两步法的方法 ——DreamInpainter,该方法通过计算密集的主题特征来确保准确的主题复制 - 降低集中度改善句子 BERT 语义空间
通过使用 Sentence-BERT 创建的嵌入表征语义空间的结构,我们发现其中普遍存在的高维度问题,即 hubness 会导致不对称的邻居关系,而减小 hubness 可以提供更好的文本语义表征。
- 去扩散使文本成为强大的跨模态接口
我们展示了一种以文本作为强大的跨模态接口的方法,通过将图像表示为文本,利用自然语言的可解释性和灵活性,我们使用一个自动编码器,将输入图像转换为文本,并通过固定的文本到图像扩散解码器进行重构,该过程称为 De-Diffusion。实验证实了 - 亲爱的,告诉我出了什么问题”,通过合作生成实现文本鉴别模型的全球解释
Therapy 是第一个针对文本适应性的全局模型无关解释方法,通过合作生成文本来跟踪分类器所学习的分布,无需输入数据集,提供对模型行为的全局概述。
- EMNLP多跳空间推理中的提取与推理解耦合
我们在这篇论文中探讨了利用信息提取和推理进行解耦来解决空间推理中遇到的挑战,并通过与无明确设计这些部分的最新技术基准进行比较,实验证明解耦的有效性,展示了增强模型在现实数据领域中的泛化能力。
- EMNLP阿拉伯方言识别审视:单标签分类的局限性
Automatic Arabic Dialect Identification (ADI) 系统无法准确区分阿拉伯语的微方言,我们建议将 ADI 任务构建为多标签分类任务并提供设计新的 ADI 数据集的建议。
- EMNLP面向语音单元和文本的联合语言建模
探索联合的语言建模方法,比较不同语音分词方法和语音 - 文本混合数据构建方法,通过自动指标评估联合语言模型的混合效果,在不同模态下对下游口语理解任务进行微调并测试其性能,结果表明通过混合我们提出的语音单元和文本的方法,联合语言模型在口语理解 - 朝向基于情绪的合成意识:使用 LLMs 估计情绪概率向量
利用 LLMs(大型语言模型)估计与文本相关的情感状态摘要。通过对亚马逊产品评论的情感分析,将情感描述符映射到 PCA 类型的空间中,并探索通过尾部提示来引发改进当前文本状态的行动描述,然而实验结果表明这并不是一项直接可行的任务。
- MM语义文本压缩分类
我们研究了文本的语义压缩,其中文本中包含的含义被传达给源编码器,例如用于分类。我们提出了一种利用句子嵌入和语义失真度量来保持含义的语义量化和压缩方法。我们的结果表明,与语义不可知基线相比,所提出的语义方法在所需消息表示的比特数量方面节省大量 - 利用标签信息进行多模态情感识别
通过利用标签信息进行多模态情绪识别,我们提出了一种新的方法,通过标签 - 令牌和标签 - 帧交互来学习每个话语的标签增强文本 / 语音表示,并设计了一种新的标签引导的注意融合模块,以融合具有标签意识的文本和语音表示进行情绪分类,实验证明该方 - 基于 Transformer 语言模型和 n-gram 困惑度的文本向量化
该研究提出了一种基于 n-gram 困惑度计算的向量值算法,以替代仅有一个困惑度值的标量困惑度,该算法考虑了概率、困惑度、文本、标记等方面,并将这些值合并为表示输入的单个向量。
- 生物医学图像和文本中的多模态深度学习综述
本综述研究了多模态深度学习(MDL)在医学图像和文本联合学习中的应用及其在医学中的潜在价值,并提出了未来方向和挑战。