- GigaSpeech 2:用于低资源语种的演进、大规模、多领域的 ASR 语料库的自动爬取、转写和优化
这篇论文介绍了 GigaSpeech 2,一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库,它不依赖于配对的语音和文本数据。该论文还介绍了一个自动化的数据爬取、转录和标签优化流程,以及通过修改的 Noisy Student Tr - 深度学习模型自动评分类风湿性关节炎手部 X 光影像
我们开发了一个定制的自动化流程,可以预测手部 X 光片中的 van der Heijde 修正的 Sharp 评分和类风湿关节炎的严重程度,而无需首先定位关节。
- 基于半随机贴片采样的肺癌 WSI 中 TILs 的快速估计
我们的研究引入了一个自动化流程,该流程利用半随机补丁采样、补丁分类和 HoVer-Net 模型对肺癌患者中浸润肿瘤淋巴细胞(TILs)进行评估,从而实现对非小细胞肺癌(NSCLC)患者进行预后评估的过程的优化。该流程通过排除约 70%与预后 - Nellie:2D/3D 活细胞显微镜下的自动细胞器分割、跟踪和分级特征提取
动态细胞器的分析是一个巨大挑战,但对于理解生物过程至关重要。我们介绍了 Nellie,一个自动化无偏见的管道,用于分割、跟踪和提取多样化的细胞内结构。Nellie 根据图像元数据进行调整,消除了用户输入。Nellie 的预处理管道能够增强多 - LLM 对相关医学参考文献的引用质量评估框架和分析
使用大型语言模型(LLMs)回答医学问题,验证其生成的来源的相关性,并开源医学问题和专家注释的数据集以便进行未来评估。
- 从网络威胁情报报告中挖掘时间攻击模式
通过自动挖掘时间攻击模式,我们的研究旨在帮助安全从业人员从过去的网络威胁情报报告中挖掘有关恶意行为的结构化信息,并应用于优先处理和主动防御网络攻击。
- 从法律裁决中发现重要话题和选择性推论
通过自动化流程从法律决策文本中发现相关主题,方法包括使用主题模型生成特征,并通过惩罚回归和后选择显著性检验进行评估;实验证明该方法在域名争议和欧洲人权法院侵权案例数据集上识别出与结果显著相关的案例主题、可以手动解释的主题 - 词分布以及可以 - 标准化神经网络的自动优化
利用矩阵流形的几何性质,我们提出了一种自动优化方法,对神经网络的归一化参数进行优化。通过层次化的权重归一化以限制利普希茨常数并增强梯度的可靠性,使训练后的网络适用于控制应用。通过初始化网络和根据初始化网络的 2-2 增益对数据进行归一化,我 - 非对比增强计算机断层扫描自动小肾癌检测
该研究介绍了一种用于非对比度计算机断层扫描 (Non-contrast computed tomography, NCCT) 中肾癌检测的自动化流程,通过测试三种检测模型:形状模型、二维及三维轴向样本模型,从开放数据源和剑桥大学医院收集训练 - 多模态深度学习用于显性视频内容的提取和总结
通过多模态深度学习提取输入视频的露骨片段,并使用文本对其内容进行总结,以确定其适合年龄和年龄评级的研究论文。
- 大型语言模型能否给研究论文提供有用反馈?一个大规模实证分析
使用 GPT-4 模型创建了一个自动化平台,通过对科学论文的全文进行评论以评估 GPT-4 生成的反馈质量。 在两项大规模研究中,我们将 GPT-4 生成的反馈与人工同行评审的反馈进行了定量比较,并通过 308 名研究人员的用户研究了解了他 - 假设搜索:利用语言模型进行归纳推理
通过产生多个抽象假设并将其转化为具体的 Python 程序,进而为大型语言模型提高归纳推理能力,并利用自动生成的摘要或人工筛选的候选集来过滤生成的程序,从而在归纳推理任务中实现更高的准确性。
- 音乐视频自动转换为歌词视频
我们提出了一套设计指南,帮助创作者制作抒情视频,以确保歌词文本的可读性,并保持注意力的统一焦点。我们通过一个完全自动化的流程将输入音乐视频转化为抒情视频,并通过多样化的输入来源生成的抒情视频的用户研究结果表明,我们的流程能够有效地保持文本可 - 从野外获取证据进行的复杂索赔验证
本文提出了一种完全自动化的流水线,通过从 Web 检索原始证据来检查实际世界中的索赔,结果表明,我们的流水线可以提供可靠且相关的证据摘要,从而帮助事实检查员甄别真假索赔。
- 使用计算机视觉技术对 FRP 钢筋进行结构分析
本文提出了一种基于计算机视觉技术和玻璃纤维与环氧丝比之间的比率的自动化流水线方法,用于计算复合 FRP 钢筋内部结构的重心偏移量和截面特征变化,并讨论了在两个不同部位的交叉截面上实现的结果,最后为未来的工作提出了可能的方向
- ICLRAANG:自动辅助学习
通过提出的自动化管道方法,我们演示了辅助学习目标如何帮助数据获取困难或高度复杂的任务,并使在自然语言处理领域的预训练模型上的持续训练实验产生了强大的改进。
- 高分辨率多视角卫星图像自动 3D 恢复
本文提出了一种处理多视图卫星图像生成 3D 数字表面模型的自动化流程,其中包括自动地地理参考和基于匹配生成高质量密集点云。通过学习样本 LiDAR 数据的关键配置,我们根据结果的接近程度对图像对进行排名,并使用自适应 3D 中值滤波器融合多 - MM小行星自动侦测原型
本文提供了一种基于 Python 编写的自动化流水线原型来解决 NEAs 检测的问题,以替代人工检测的方法。
- CVPR从单个图像中重建特定类别的物体
本文介绍了一种基于像素输入和 3D 刚性类别的输出的自动化流程,通过从现有物体检测数据集中学习可变形的 3D 模型并结合底层模块进行高频率形状细节恢复,实现了在单幅图像中获取真实场景下物体的三维表面重建,通过在最近引入的 PASCAL 3D - 一种信息论算法用于发现恒星光度曲线的周期性
提出了一种基于信息理论的新度量学方法,称为 Correntropy Kernelized Periodogram(CKP),通过将交叉熵与周期核相结合,对光度曲线的周期性进行识别,并可以直接从可用样本中计算,用于自动化地鉴别灯变曲线中的周期