May, 2025
孟加拉消费者健康查询摘要的大型语言模型性能评估
Performance Evaluation of Large Language Models in Bangla Consumer
Health Query Summarization
TL;DR本研究针对孟加拉语这一低资源语言中的消费者健康查询(CHQs)所面临的冗余信息问题,探索了九种先进大型语言模型(LLMs)的零-shot 性能。研究发现,Mixtral-8x22b-Instruct 模型在 ROUGE-1 和 ROUGE-L 指标上表现最佳,表明这些大型语言模型在没有特定任务训练的情况下仍能生成高质量摘要,展示了它们在低资源语言医疗查询摘要化中的潜力。