Apr, 2024

城市环境中的越南场景文本检测的集成学习

TL;DR提出了一个简单而高效的整合学习框架用于越南场景文字定位。通过结合多个模型以提高预测准确性的整合学习方法,旨在显著提升在具有挑战性的城市环境下的场景文字定位性能。通过在 VinText 数据集上的实验评估,我们提出的方法相对于现有方法在准确性方面取得了显著改进,达到了 5% 的令人印象深刻的准确性。这些结果明确证明了在越南城市环境中的场景文字定位中整合学习的效果,并强调了其在真实世界应用方面的潜力,如城市标识、广告和各种富有文字的城市场景中的文本检测和识别。