- UzMorphAnalyser: 用词尾进行乌兹别克语言的形态分析模型
该论文提出了对乌兹别克语词汇进行形态分析、寻找词干、确定词性信息的模型,经过验证和评估后,该模型在词级别的准确度超过了 91%,并且已经以基于 Web 应用程序和开源 Python 库的形式提供。
- 基于视觉信息的流场图像超分辨率与四元数空间建模和动态流卷积
流动图像超分辨率(FISR)旨在从低分辨率流动图像中恢复高分辨率湍流速度场,通过综合考虑流动图像的独特可视化属性和形态信息,我们提出了第一个考虑流动图像可视化属性的 FISR 算法,通过四元数空间建模和动态流动卷积来改善 FISR 的性能。
- MIML: 微流控系统中基于机械特征的高精度细胞分类的多图像机器学习
通过开发一种新的机器学习框架,MIML,将无标记细胞图像与生物力学属性数据结合起来,从而利用每个细胞内在的丰富形态信息,解决无标签细胞分类的特异性和速度问题,该方法在细胞分类上达到 98.3% 的准确率,可广泛应用于疾病诊断和细胞行为的理解 - 多语言 BERT 模型的词形句法探测
本研究介绍了一个广泛的多语言探测词形信息数据集,利用预训练变形金刚模型(mBERT 和 XLM-RoBERTa),并应用两种方法确定输入中区别信息的位置以实现强大的性能。其中最显著的发现是前缀上下文持有比后缀上下文更多相关预测信息。
- ACL另一个对形态标记的死胡同?扰动输入和解析
通过对 14 个不同的 UD 文本库进行的对抗实验,本文证明通过对句子中的形态信息进行解析可以修正词性标记中的误差。但是在面对词汇错误时,它们会降低转换和基于图的解析器的性能。
- 三维患者特异性肌骨区建模与表征
本研究提出一种新的方法,通过对三维表面模型的几何分析和体积图像中提取的组织信息的整合,来支持诊断活动和随访检查,进而对手腕、脊柱等骨骼肌肉区域的形态和病理进行个体化表征,并具有足够的广泛性应用于不同的区域。
- 关于词形信息在上下文词形还原中的作用
本文通过实证研究,考察了在六种不同的语言上,使用不同的形态学特征开发上下文词形还原器对下游表现的影响,并发现:(i)为词形还原器提供细粒度的形态学特征在训练时并不那么有益,即使对于词汇连接语言;(ii)实际上,现代上下文词表示似乎隐式地编码 - ICLR我的身体是一个牢笼:形态在基于图的不兼容控制中的作用
本研究比较了使用图神经网络和 transformer 的多任务强化学习方法之间的差异,提出了 Amorpheus 算法,该算法忽略了 GNN 中的形态学信息,并取得了更好的性能。
- 使用黑盒上下文注入填补神经机器翻译中的性别和数量差距
提出使用黑盒方法向预训练的神经机器翻译系统注入缺失的语言特征,以实现控制生成的翻译的形态变化,我们对英文到希伯来文的翻译任务进行了评估,证明了这种方法是有效的,并且注入正确信息可以将翻译准确率提高高达 2.3 BLEU。最后,我们进行了生成 - 基于形态和外观卷积神经网络的子宫颈细胞细粒度分类
本研究提出了一种基于 CNN 的方法,通过结合细胞图像外观和形态学信息对 Pap 样本中的宫颈细胞进行分类,在 Herlev 宫颈数据集上验证了此方法的分类精度高于传统的手工特征分类方法,可用于宫颈病变的早期诊断。
- 隐含地将形态信息融入到词向量中
本文提出了三种新模型,通过隐性使用形态信息增强单词嵌入,实验结果表明隐性模型优于传统显性模型,表现优于所有现有模型,并能在单词嵌入训练过程中补充语义信息。
- EMNLP用于概率神经词嵌入的形态学先验
通过将形态学信息融合到词向量中,构建了一个统一的概率框架,其中词嵌入是一个潜变量,并以形态学信息提供先验分布。此方法改进了内在词相似性评估,也在词性标注下游任务中提高了性能。
- SILC:基于方向小波的普朗克内部线性组合宇宙微波背景温度图
利用方向和轴对称小波组合,本研究提出了一种新的内部线性组合算法 ——SKCL, 该算法利用小波的尺度分异和方向性将 CMB 的强度和前景分离,可以更好地本地化清理算法,并且有望在极化异质性方面具有应用前景。