Jun, 2023

良好数据、大数据还是无数据?比较三种方法,为生物医学论文开展研究方面分类器

TL;DR本文研究了不同数据集对居民群众标记的研究方面分类任务的模型性能的影响,探讨了使用大型自动筛选的 PubMed 200K RCT 数据集的潜在好处,并评估了大型语言模型,如 LLaMA,GPT-3,ChatGPT 和 GPT-4 的有效性。研究结果表明,使用 PubMed 200K RCT 数据集不会提高 CODA-19 任务的性能。同时,尽管 GPT-4 表现良好,但它没有超越在 CODA-19 数据集上优化的 SciBERT 模型,强调了专门针对目标任务的专用数据集的重要性。