BriefGPT.xyz
Ask
alpha
关键词
cross-modal pretraining
搜索结果 - 2
临床准确且可解释的双向字幕模型
本研究通过双向字幕法对放射学报告进行预训练,与对比性训练方法相比,表明字幕法预训练不仅可以产生具有竞争力的视觉编码器,还可以生成具有临床相关性的报告和针对性的交互性输出。
PDF
8 months ago
KDD
M6:一个中文多模态预训练模型
本研究构建了最大的中文多模态预训练数据集,提出了一个跨模态预训练方法 M6,并在众多应用领域中展示了其优异性能和高质量图像生成能力。
PDF
3 years ago
Prev
Next