ACLJun, 2024

变异主义:探索书面语言数据中的多元化变异和偏见

TL;DR探索和理解语言数据是处理人类语言的所有领域的基础阶段,Variationist 是一个高度模块化、可扩展且与任务无关的工具,通过多个变量、语言单位和多样的度量方式进行无缝检查和可视化语言变异和偏见,实现了 30 多种变量类型 - 语义组合的五维交互式图表的创建,帮助研究人员轻松回答特定的研究问题或揭示语言数据中不希望的关联。