ACLJun, 2024

P-TA:使用近端策略优化增强大型语言模型下的表格数据增强技术

TL;DR利用近似策略优化(PPO)引导大语言模型(LLM)来增强表格特征的概率分布,从而使 LLM 成为用于合成表格数据的生成器,在三个真实数据集上通过实验证明,该方法相对于最先进技术提高了约 4%的合成模型准确性。