BriefGPT.xyz
大模型
Ask
alpha
关键词
visual language model
搜索结果 - 4
ICLR
训练一种视觉语言模型作为智能手机助手
利用大型语言模型和视觉语言模型,我们的研究致力于解决数字助理执行各种用户任务的挑战,特别是在基于指令的移动设备控制领域。通过与用户界面进行交互,我们的模型利用设备屏幕的视觉输入并模拟人类般的交互,包括点击和滑动等手势。这种输入和输出空间的广
→
PDF
3 months ago
第六届 ABAW 挑战赛上基于视觉语言模型的零样本复合表达识别
利用预训练的视觉语言模型结合传统的 CNN 网络,提出了一种用于识别合成表情的零样本方法。
PDF
4 months ago
PhotoBot:基于自然语言引导的交互式摄影
PhotoBot 框架结合高级人类语言引导和机器摄影师,实现了基于自动话术采集照片的功能。利用视觉语言模型(VLM)和目标检测器,通过文本描述表征参考图片,然后通过大型语言模型(LLM)根据用户的语言查询检索相关的参考图片。利用一个能够跨不
→
PDF
5 months ago
利用少样本学习和微调对 MAGMA 进行对其
本文旨在评估并对齐名为 Multimodal Augmentation of Generative Models through Adapter-based finetuning (MAGMA) 的视觉语言模型与人的价值观,通过三个不同的情
→
PDF
2 years ago
Prev
Next