Oct, 2023

基于 ChouBERT 方法的推文中植物健康威胁的命名实体识别

TL;DR精准农业应用领域中,使用传感器和数据分析技术检测和测量作物健康威胁是一个重要的应用场景。然而,由于缺乏标注数据和细粒度的语义资源,文本数据在现有解决方案中仍未得到充分探索。最近的研究表明,农民的日益连接性和在线农业社区的出现使得类似 Twitter 的社交媒体成为检测陌生植物健康事件的参与平台,只要我们能从非结构化文本数据中提取关键信息。ChouBERT 是法语预训练语言模型,能够准确识别涉及观察植物健康问题的推文,并且能推广到未见过的自然灾害。本文通过进一步研究 ChouBERT 在小规模标记数据上进行的令牌级注释任务,解决了标注数据的不足问题。