Jan, 2024

通过音频分析辨别信哈拉语 YouTube 视频中的虚假内容和仇恨言论

TL;DR为了解决 YouTube 在全球范围内传播虚假信息和仇恨言论的危机,本研究针对 Sinhala 语 YouTube 视频提出了一个解决方案,通过比较标题、描述和音频内容,评估视频是否包含虚假信息,并检测其中是否包含仇恨言论,以减少暴力和谣言的传播。采用的方法包括使用 Pytube 库提取音频,通过 fine-tuned Whisper 模型进行音频转录,使用 distilroberta-base 模型和文本分类 LSTM 模型检测仇恨言论,并通过 fine-tuned BART-Large-XSUM 模型进行文本摘要。