Apr, 2023

构建多模态人工智能聊天机器人

TL;DR该研究旨在创建一个多模态人工智能系统,可以与人类交谈并分享相关图片,其中包括了图片检索模块和图片理解生成回复的模块。使用 ViT,BERT,GPT-2/DialoGPT 三个模型,在自动生成的和人工评估中结果显示,在开放式场景的图像识别中表现优异。