BriefGPT.xyz
大模型
Ask
alpha
关键词
instruction-based mobile device control
搜索结果 - 1
ICLR
训练一种视觉语言模型作为智能手机助手
利用大型语言模型和视觉语言模型,我们的研究致力于解决数字助理执行各种用户任务的挑战,特别是在基于指令的移动设备控制领域。通过与用户界面进行交互,我们的模型利用设备屏幕的视觉输入并模拟人类般的交互,包括点击和滑动等手势。这种输入和输出空间的广
→
PDF
3 months ago
Prev
Next