- 自动为涵盖不同粒度的 LLLs 生成大量上下文驱动的 SFT 数据
通过创造高质量的查询 - 回应对,我们引入了一种名为 AugCon 的新方法,能够自动生成多个层次上的具有高多样性、质量和准确性的上下文驱动的 SFT 数据。实验证明 AugCon 在生成高多样性、质量和准确性的 SFT 数据方面具有明显优 - 自动形成性评估中,您能否清晰表达该点子的能力是多少?
自动化方法在科学解释写作的形成性反馈研究中有着越来越多的应用,本研究通过一个辅助评分标准,研究了在学生科学解释文章上的自动化反馈,发现学生在文章的修订版本中普遍进步,重点关注了影响自动化反馈准确性的两个因素。
- 利用 LLMs-in-the-Loop 策略揭示社交媒体信息中的潜在论证
利用大型语言模型(LLMs)从社交媒体消息中提取潜在观点的通用 LLMs-in-the-Loop 策略,旨在解决社交媒体话语研究中手动编码方法的耗时和高成本问题。
- 提取、定义、规范化:一种基于 LLM 的知识图谱构建框架
通过自动化方法,提出了一个名为 EDC 的三阶段框架,能够从输入文本中提取高质量的三元组,并解决了以往方法在应对大型复杂模式时的困难,同时引入了训练部分以改进模型的抽取性能。
- CVPR学习动画油漆桶着色的包含匹配
介绍了一种新的学习基于包含关系匹配的 pipeline,通过整合粗糙的颜色变形和包含关系匹配模块,实现了更加细致准确的线框配色。还开发了一个独特的数据集,名为 PaintBucket-Character,包括渲染的线框艺术和配色的对应物,展 - 构建脊椎手术的数字孪生:概念验证
手术数字化是创建真实手术的虚拟复制品的过程,也称为手术数字孪生。它在教育培训、手术规划和手术任务自动化等领域具有重要应用。本文提出了一个针对在真实条件下进行的离体脊椎手术的手术数字化概念验证。所提出的数字化主要关注整个手术场景的几何形状和外 - GISTEmbed: 文本嵌入微调中的引导样本选择
通过引入 GISTEmbed,在对比训练中通过导向模型增强批内负例选择,从而显著减少数据质量问题引入的噪声,并改善模型微调,从而提供了对规模较小模型的显著改进的框架,借助资源密集型的大型模型的能力,GISTEmbed 有可能革新高效且规模较 - 作物和夫妻:使用相互关联的专家网络进行心脏图像分割
使用自动方法对心血管疾病进行诊断通常依赖于心脏图像分割的关键任务。我们提出了一种新的策略,使用专家网络对单个解剖结构(左心室、右心室或心肌)进行分割。给定一个输入的长轴心脏磁共振图像,我们的方法在第一阶段执行三元分割以识别这些解剖区域,然后 - UP-CrackNet:无监督像素级道路裂缝检测与对抗性图像恢复
过去十年中,开发了自动化方法来更高效、准确和客观地检测裂缝,以替代传统的手动视觉检查技术。在这些方法中,语义分割算法在逐像素裂缝检测任务中展示了有希望的结果。然而,训练这样的数据驱动算法需要大量人工标记的带有像素级注释的数据集,这是一个高度 - BoNuS: 边界挖掘用于核分割的部分点标签
本文提出了一种只需要部分点标签的弱监督核分割方法,命名为 BoNuS,并证明了其在核分割方面的卓越性能。
- 一种轻量级和无监督的方法,用于使用运营数据测量进行近实时行为分析
该研究提出了一种轻量级、无监督的方法,通过对大型计算系统的操作数据进行测量,实时检测异常行为并能够在较短的时间内做出适当反应。
- 印度 - 雅利安语言中的仇恨言论和冒犯内容检测:基于 LSTM 和 Transformers 的对抗
该研究在五种不同语言中展开了对仇恨言论的广泛比较分析,使用多种预训练模型评估其在这些语言中识别仇恨言论的性能,并为多语言环境下构建强大的仇恨言论检测系统提供了有益的见解。
- 深度学习螺旋臂与条状结构分割
我们提出了第一个用于分割银河螺旋臂和棒状结构的深度学习模型。经过专家天文学家的盲评估,我们预测的螺旋臂掩模优于当前的自动化方法(99% 的评估)和我们的原始志愿者标签(79% 的评估)。专家评价我们的螺旋臂掩模在 89% 的评估中被评为 “ - 机场使用对象检测进行安全围栏检查
自动检测安全围栏损坏的方法是使用自主机器人进行对象监测,通过优化的 YOLOv5 模型,我们实现了相对于基准线的 6.9% 平均精确度提升,并展示了模型的实时性能。
- QuickQual:轻量级、便捷的视网膜图像质量评分与预训练模型
我们提出了 QuickQual,这是一个简单的方法,通过一个预训练的 Densenet121 骨干网络加上支持向量机(SVM),在视网膜图像质量评分(RIQS)领域取得很好的性能,同时也将 EyeQ 从三分类转换为连续的逻辑回归任务,并且我 - 从叙事文本中自动获取行为模型
通过预测常识事件关系以及文本中的矛盾和相似之处,NaRuto 以无监督的方式从叙事文本中提取结构化事件,并生成基于计划语言风格的动作模型,实验结果显示在经典叙事规划领域中,NaRuto 能够生成比现有的全自动方法质量更好的动作模型,甚至与半 - 增强植入式心脏监护器数据的心电图分析:多标签分类的高效管道
本研究介绍了分析可植入心脏监测 (ICM) 数据的挑战和解决方法,并介绍了在此类数据上表现优异的分类方法,以辅助医疗保健专业人员对来自 ICM 的心电图进行分析。
- 上下文化主题一致性度量
本研究提出了一种基于 LLM 的方法,受到人类主题评估的启发,实现了语境化主题连贯性(CTC)度量,其在自动化主题连贯性方法方面表现出色,可应用于短文本,并不容易受到高分却无意义的主题干扰。
- DITTO-NeRF: 基于扩散的迭代文本到全向 3D 模型
提出了一种名为 DITTO-NeRF 的新型流水线,用于从文本提示或单个图像生成高质量的 3D NeRF 模型,并通过逐步重建规模、角度和遮罩等方案来解决 Image-to-3D 方法的低对应性和多视图一致性的问题,在保留微小边界角度信息的 - 一种新的专利相似度测量方法:语义距离和技术距离
提出了一种混合方法来自动测量专利之间的相似度,该方法考虑了语义和技术上的相似性,并使用 BERT 评估文本之间的语义相似度,使用 Jaccard 相似度计算 IPC 代码之间的技术相似度,并通过为两个相似度方法分配权重进行混合化。评估结果表