- CVPR自定义您自己的配对数据的几轮方式
现有的图像编辑解决方案存在多个问题。尽管能够取得显著令人满意的生成结果,但一些有监督的方法需要大量成对的训练数据,从而极大地限制了它们的使用。其他的无监督方法充分利用大规模预训练的先验条件,在先验条件训练的领域中受到严格限制,在超出分布范围 - 从词语到数字:在上下文示例中,你的大型语言模型暗自成为一种有能力的回归器
预训练的大型语言模型在给定上下文示例时,无需任何额外训练或梯度更新即可进行线性和非线性回归,发现多个大型语言模型在回归任务上的表现能与传统的监督方法如随机森林、装袋法或梯度提升相媲美甚至更好,此外,通过实证研究发现,大型语言模型的性能与上下 - 三维解剖分割中切片传播不确定性的估计与分析
监督方法和自监督方法在 3D 解剖分割中表现出卓越的性能,但受到标注数据的限制。为了解决这个问题,本研究提出将经过校准的不确定性量化集成到切片传播方法中,提供模型预测可靠性和置信水平的见解,从而提高自监督方法的实用性和精确性。
- 基于预训练大型语言模型的超关系知识图谱构建
使用基于 OpenAI 的 GPT-3.5 模型的零样本提示方法,从文本中提取超关系知识。与基准线进行比较,取得了有希望的结果,召回率为 0.77。尽管精确性目前较低,模型输出的详细分析揭示了未来研究领域的潜在路径。
- 低光图像增强的扰动学习
通过使用 TroubleMaker 学习策略在低光图像增强任务中训练使用正常光图像作为输入的模型,结合 Global Dynamic Convolution 模块,本文提出的方法在公共数据集上取得与最先进方法竞争性的性能。
- 不同图像领域中的灰度图像着色与 GAN 和 CycleGAN
灰度图像的自动上色一直是一个具有挑战性的任务。本文复现了基于 GAN 的上色模型,并对其中一种变体进行了实验。我们还提出了一种基于 CycleGAN 的模型,并在各种数据集上进行了实验。结果表明,所提出的 CycleGAN 模型在人脸着色和 - 微创手术视频中的弱半监督工具检测
通过应用共现损失并使用图像级别标签,以便快速且高效地检测手术工具,我们提出了一种在大规模图像数据集上实现手术工具检测的方法,并在 Endovis2018 数据集上的实验证明了其有效性。
- 开放式多变量时间序列异常检测
本研究提出了一种新方法,名为多变量开放式时间序列异常检测(MOSAD),旨在解决开放式时间序列异常检测问题,该问题在训练阶段可见一小部分有标签的异常样本,测试阶段需要检测到既有的异常类别又有未知的异常类别,并通过在特征提取、多头网络和异常评 - Dimma:自适应调暗的半监督低光图像增强
利用少量图像对实现与特定相机拍摄的极端光照条件下的场景相符合的卷积混合密度网络,提供控制亮度范围的低光图像增强方法,并使用有条件的 UNet 构架,使研究充分监督的方法具有有竞争力的结果。
- 基于扩散的语音增强与带权的生成 - 监督学习损失
通过引入均方误差损失(MSE)来改善扩散训练目标,度量在逆向过程迭代中预测的增强语音与真实干净语音之间的差异,提出了一种增强语音的方法,实验证明其有效性。
- 对比 - 生理+:基于时空对比的无监督和弱监督视频远程生理测量
视频远程生理测量是利用面部视频测量血容量变化信号,也称为远程光电容抗 (PRP)。本文提出了一种名为 Contrast-Phys + 的方法,可以在无监督和弱监督设置下进行训练。我们使用 3D 卷积神经网络模型来生成多个时空 PRP 信号, - 通过信息瓶颈引导的文本扩散过程增强短语表示用于关键词提取
通过使用监督式的变分信息瓶颈,Diff-KPE 能够利用关键短语信息来生成增强的关键短语表示,优化排序网络和分类网络,使得候选短语能够通过结合关键短语和文档信息进行排序。实验证明,Diff-KPE 在大规模开放领域关键短语提取基准 Open - 自折叠语义计数
无监督计数模型 UnCo 可以在无需任何手动注释的情况下学习以各种已粘贴的对象为样本,而且超越简单的基准线和通用模型,并在某些领域与有监督计数模型的性能相匹配。
- 引文作为查询:使用语言模型作为重新排序器进行来源归属
本文研究了定位文本写作所使用的源头的新方法,对多种语言模型进行微调以重新排列候选源。
- 基于得分的生成模型,利用旋转一致性约束进行光声图像重建
利用概率模型,我们提出了一种旋转一致性约束的基于分数的生成模型(RCC-SGM),通过采样 Langevin 动力学和约束项之间的迭代建立 PAT 图像,可支持不同的测量过程,并达到更好的 PSNR 表现(32.29 比 16 次随机采样的 - ACL歧义遇到不确定性:探索词义消歧的不确定性估计
本文针对单词语义消歧(WSD)问题,对现有的监督学习方法在真实世界场景中处理噪声和分布不均问题时不足的问题进行研究。首先比较了几种不确定性评分方法,然后通过测试场景对数据和模型的不确定性进行分析并探究了对其产生影响的多种词汇属性。
- 基于梯度的最大干扰检索,用于领域增量三维物体检测
介绍了一个名为 Gradient-based Maximally Interfered Retrieval (GMIR) 的梯度采样策略,该策略可以用于 3D 目标检测中的连续学习以在恶劣天气条件下进行精确检测,与从头训练相比训练时间减少 - 使用 ChatGPT 进行零 - shot 时序关系抽取
本文探讨了 ChatGPT 在零 - shot 时序关系抽取中的应用能力,并且设计了三种不同的提示技术来解决该任务。实验表明 ChatGPT 的性能与监督方法有较大差距,并且在时间推理过程中可能存在不一致性和长依赖时序推理失败的问题。
- 无监督广播新闻摘要:最大边际相关性(MMR)和潜在语义分析(LSA)的比较研究
本研究探讨了两种无监督方法自动语音摘要的表现,使用了 LSA 和 MMR 这两种方法对波斯广播新闻的摘要进行了比较,结果表明 LSA 在通用摘要上优于 MMR,但在基于查询的摘要中,MMR 优于 LSA。
- 阿拉伯社交含义对比学习基准研究
本篇论文对阿拉伯社交意义任务的最新监督对比学习方法进行了全面的基准研究。通过广泛的实证分析,我们展示了大多数任务中对比学习方法优于传统微调方法并且具有数据高效性。此外,本文还证明了对比学习在低资源环境下的潜力。