Mar, 2023
引导大型语言模型生成混合文本:以东南亚语言为例
Prompting Large Language Models to Generate Code-Mixed Texts: The Case of South East Asian Languages
Zheng-Xin Yong, Ruochen Zhang, Jessica Zosa Forde, Skyler Wang, Samuel Cahyawijaya...
TL;DR通过零 - shot 的方法,我们探索使用大型语言模型 ChatGPT,用于生成东南亚五种语言(印度尼西亚语、马来语、汉语、塔加洛语、越南语)和混杂语 Singlish 的混杂数据,结果表明 ChatGPT 显示了最大的潜力,并且 InstructGPT 的表现也值得我们关注,但由于单词选择错误而导致语义不准确。由此我们呼吁在类似的低资源 NLP 情境中谨慎应用类似技术。