Jun, 2024

大规模投资前的动漫热度预测:基于深度学习的多模态方法

TL;DR本研究提出了使用多模态文本图片数据集预测日本动漫热门度的方法,通过使用从互联网中获取的开源数据构建这一数据集,利用基于 GPT-2 和 ResNet-50 的深度神经网络模型,研究多模态文本图片输入与热门度之间的相关性,发现数据集的相关优势和弱点。通过使用均方误差(MSE)度量模型的准确性,当考虑所有输入和完整版本的深度神经网络时,获得最佳结果为 0.011,而传统的 TF-IDF 和 PILtotensor 向量化方法获得的基准 MSE 为 0.412。这是首次使用多模态数据集来解决此任务,揭示了即使使用相对较小的模型(ResNet-50)对图像进行嵌入处理也能带来的显著好处。