Oct, 2023

通过问答实现低资源印度尼西亚语标题党取消

TL;DR鉴于点击率欺骗事件的增多,我们构建了一个手动标记的印度尼西亚点击率欺骗语料库,并使用跨语言零 - shot 问题回答模型来解决印度尼西亚等低资源语言的点击率欺骗问题,实验结果表明,XLM-RoBERTa(large)模型在短语和段落的剧透方面优于其他模型,而 mDeBERTa(base)模型在多部分剧透方面优于其他模型。