Nov, 2023

金融服务的葡萄牙常见问题

TL;DR利用数据增强技术生成合成数据以解决葡萄牙金融领域中领域特定数据稀缺的问题,并使用不同语义相似性的技术对从巴西中央银行 FAQ 获取的数据集进行增强,通过有监督和无监督任务评估增强数据对低语义相似性和高语义相似性情况的影响。此外,生成的数据集将在 Hugging Face 数据集平台上公开传播,从而提高可访问性并促进自然语言处理研究社区的更广泛参与。