BriefGPT.xyz
Ask
alpha
关键词
multimodal frameworks
搜索结果 - 3
文本与分子之间的桥梁:一项关于分子多模态框架的调查
通过综述多模态分子研究的框架,本文探讨了人工智能在分子科学中的应用,特别关注文本与分子之间的对齐方法以及使用大型语言模型和提示技术进行分子任务的重要应用,同时讨论了该领域的局限性和未来研究的几个有希望的方向。
PDF
4 months ago
无源域适应方法在 RGB-D 语义分割中的应用:基于 Vision Transformers
研究基于深度传感器的多模态框架和基于视觉变换器的源自由语义分割的深度感知方法,通过混合特征和深度信息以及深度基础熵最小化方法,能够提高分割效果。
PDF
a year ago
面向多模态视觉语言模型生成非通用文本
本文主要介绍了一种将人名加入生成文本的新方法,通过使用 OCR 识别图像中的文字并 fine-tuning 预训练模型,我们的方法在生成文本的时候自然地加入了人名信息。为了达到这个目的,我们修改了之前的多模态框架,接受来自任意数量的辅助分类
→
PDF
2 years ago
Prev
Next