BriefGPT.xyz
大模型
Ask
alpha
关键词
clip text-encoder
搜索结果 - 2
文本到图像生成模型中的构成问题的理解和减轻
通过研究基于组合性失败模式,我们发现文本到图像生成模型中 CLIP 文本编码器的文本条件不完备是无法生成高保真组合场景的主要原因,并提出仅通过在 CLIP 表示空间上学习简单的线性投影可以实现最佳组合性改进,同时不降低模型的 FID 分数。
PDF
22 days ago
利用语言模型大规模制造多模态系统的故障
MultiMon 通过自动识别系统性失败的方式,发现了 CLIP 文本编码器的 14 种系统性失败,是朝着自主探索潜在系统失败的长尾方向迈出的一步。
PDF
a year ago
Prev
Next