Mar, 2025

重新审视计算社会科学中的自然语言处理噪声

TL;DR本研究解决了计算社会科学中噪声这一相对未被充分研究的问题,提出了多种噪声表现形式的案例研究,包括OCR处理后的字符级错误、古老语言及主观任务的注释不一致性等。研究发现,某些噪声形式可能包含有价值的信息,这对推动计算社会科学的研究至关重要,强调了处理噪声时的细微差别和研究者所需的策略。