Jan, 2024
通过音频分析辨别信哈拉语 YouTube 视频中的虚假内容和仇恨言论
Identifying False Content and Hate Speech in Sinhala YouTube Videos by Analyzing the Audio
W. A. K. M. Wickramaarachchi, Sameeri Sathsara Subasinghe, K. K. Rashani Tharushika Wijerathna, A. Sahashra Udani Athukorala, Lakmini Abeywardhana...
TL;DR为了解决 YouTube 在全球范围内传播虚假信息和仇恨言论的危机,本研究针对 Sinhala 语 YouTube 视频提出了一个解决方案,通过比较标题、描述和音频内容,评估视频是否包含虚假信息,并检测其中是否包含仇恨言论,以减少暴力和谣言的传播。采用的方法包括使用 Pytube 库提取音频,通过 fine-tuned Whisper 模型进行音频转录,使用 distilroberta-base 模型和文本分类 LSTM 模型检测仇恨言论,并通过 fine-tuned BART-Large-XSUM 模型进行文本摘要。