- 大型语言模型:大规模隐私政策分析的新方法
利用大型语言模型(LLM)以替代传统的自然语言处理技术,在较大规模上从隐私政策中高效准确地提取隐私做法,并实现出色的性能评估和降低成本。
- 基于层次概率模型的无监督工作行为模式提取
提出了一种新的基于高斯过程半马尔可夫模型的工人行为模式提取方法,不需要预先训练,能够自动准确地将连续运动划分为不同的运动类别,并与隐马尔可夫模型进行参数互推,以实现准确的运动模式提取。该方法在实际生产现场的工人装配产品的运动数据上进行了验证 - 使用大型语言模型丰富机器学习数据集文档
本文提出了一种利用大型语言模型和提示策略自动提取文档中的关键维度,并将其用于丰富数据集描述的方法。通过此方法,可以创建机器可读的文档,改善数据集的可发现性,评估其符合当前的 AI 法规,并改善对其训练的 ML 模型的整体质量。
- 短程和长程医学影像时间序列的时空表示学习
基于医学深度学习,本研究提出了两种方法来分析短期和长期的时间发展,通过结合对比学习和时间嵌入以及遮罩和预测潜在帧表示,实现了对生理功能和疾病进展的自动化分析。
- 研究 Incel 社群激进化的词汇表
一项基于定性内容分析的研究,针对 2016 年至 2023 年期间最活跃的一些极端网络群体,提供了一个术语表及其定义,用于自动化分析,以支持进一步研究该社群中的激进化、去激进化和脱离行为。
- HypUC: 基于梯度提升校正的高维度心电图可靠回归的超细不确定性校准
通过提出 HypUC 框架,应用于医学时间序列的不平衡概率回归问题,我们引入了基于核密度的简单技术来解决数据不平衡问题。并使用概率回归框架对预测的连续值进行不确定性估计,并使用进一步校准方法来提高可靠性,证明了 HypUC 在大规模真实数据 - 染色一致性学习:处理数字病理学分割中的染色变异
数字病理学中的染色变异是自动化分析的一个独特挑战,本研究提出了一种新的框架,利用染色的特定增强和染色一致性损失函数来学习染色色彩不变的特征,在细胞和细胞核数据集上,与其他方法相比,该方法表现最佳。
- 实现全球范围的交通摄像头校准
通过利用街景图像重建度量的三维模型并精确校准 100 多个全球交通摄像头,本研究展示了一个可扩展的框架,以解决基于野外摄像头的精确校准挑战,并通过提取信息进行交通分析,从而开发出利用室外摄像头进行自动分析的潜力。
- MAGIC-TBR: 基于变形器的群体环境下身体行为识别的多视角注意力融合
提出了一种名为 MAGIC-TBR 的多视角注意力融合方法,通过基于变压器的方法结合从视频中提取的特征和相应的离散余弦变换系数,探索细节行为(如手势、整理或笨拙)的检测。在 BBSI 数据集上进行了实验,结果证明了所提特征融合与多视角注意力 - 使用可穿戴运动传感器评估自监督预训练对自动婴儿运动分类的影响
该研究探讨了如何使用自监督的预训练方法来提高婴儿可穿戴设备的自动化分析的分类准确性,研究表明使用上下文相关的预训练数据可以大大提高分类器性能。
- 分阶段学习 GAN,用于声波频谱图中的哨声提取
本篇研究提出了一种基于深度学习及生成对抗网络的哨声数据增强框架,可以在极少专家标注数据情况下产生视觉上具有吸引力的哨声数据及标签,以达到对人工智能进行哨声自动化分析的目的。
- 关于 LAION-2B 数据去重的研究
本文提出了一种算法链,能够对规模为 20 亿张图片的 LAION-2B 数据集进行有效的重复检测,并揭示了大量的版权问题,能够充分解决当前模型训练时所遇到的问题。
- 基于聚类的深度集成学习在网络模因情感分类中的应用
本文提出了一种混合模型(CDEL),并基于表情相似性聚类来增强模型,以实现在表情类别分类的有效性,具有深度学习和聚类算法的优点,从而在情感分类基准数据集上实现比基线模型更优越的性能和最新技术性能。
- KDD用预训练神经网络集成进行透射电子显微图像分割和质量检测
本专业研究了机器学习在电子显微数据集分析中的应用问题,因为这种类型的数据集具有许多挑战,包括训练数据集大小限制、试样质量及实验条件的变化等。研究发现,使用 EA 方案的集合设计比 ER 方式更适合处理这些问题,因为 EA 表现出更好的分类精 - 大规模细胞电子显微镜自动图像分析:文献综述
本文研究了大规模电子显微镜技术下生物医学图像分析的自动化方法和挑战,并讨论了近五年来在自动化人工智能计算机视觉、深度学习和软件工具方面所取得的进步,探讨了自动化图像获取与分析的整合,以实现毫米级纳米分辨率的高通量分析。
- 一种用于医学术语缩写消歧的神经主题注意力模型
提出了一种少样本学习方法,使用神经主题 - 注意力模型来改进具有主题信息的上下文化句子表示,以在短量非平衡训练数据集上显著提高医学术语缩略语消歧的性能,尤其是针对罕见意义,已有的稀缺注释数据集不准确和缺失,需要进行修正和补充。
- ICML亮场显微镜下花粉的无监督表达
本文介绍了第一个使用亮场显微镜进行花粉分析的无监督深度学习方法。使用 650 张图像,通过将花粉图像嵌入低维潜在空间并比较欧几里得和黎曼度量上的聚类,实现花粉的家族级别识别,并倡导将此系统用于环节只有小型或无标签数据集的花粉和其他微观生物结 - 通过人体姿态链接艺术
本文旨在解决基于视觉内容在艺术品中发现构图转移的问题,提出了一种基于人类姿态相似性的构图转移链接方法,证明显式人类姿态匹配比标准的基于内容的图像检索方法更优。
- 学生诊断推理自动分析的挑战
本文旨在自动化模拟诊断的认知活动以便为学生提供反馈,同时讨论了自动化识别认知活动所面临的三个挑战,并提出了各自的性能度量标准。此外,根据提供的诊断自述语料库的检测,作者评估了几种 RNN 神经网络架构,证明目前的技术无法解决一些挑战。
- EMNLP社交媒体上的因果解释分析
本文探讨了通过采用语篇分析构建自动化分析因果关系解释的方法,包括因果关系检测和因果解释识别,展示了完整流水线的应用程序,并探讨了在社交媒体上进行自动化分析的应用领域。