使用 ChatGPT 进行零 - shot 时序关系抽取
该研究针对 ChatGPT 大型语言模型,通过对 13 个数据集的测试集进行综合评估,采用了三种任务定制型 prompt 模板,发现 ChatGPT 对于识别因果关系具有较强的能力,但在识别事件之间的时间顺序方面表现较差,并在需要结构性理解对话的对话语篇分析任务中表现不佳。
Apr, 2023
本文研究了用 ChatGPT 进行事件抽取的可行性并探究了遇到的挑战,结果表明 ChatGPT 在长尾和复杂情况下只有任务特定模型 EEQA 的 51.04%的性能,ChatGPT 不够稳定,继续改进提示不会导致稳定的性能提高,而且 ChatGPT 对不同的提示风格非常敏感。
Mar, 2023
本文探讨了零样本信息提取(Zero-shot information extraction)的挑战,通过大型语言模型和基于提示的方法构建具有强大信息提取能力的 ChatIE 框架,成功地实现了多轮问答式的信息提取任务,这为使用有限资源构建信息提取模型提供了研究思路和方法。
Feb, 2023
对于 ChatGPT 而言,在隐性话语关系分类任务中,使用标准的多项选择问题提示尚不令人满意,且远远不及最先进的有监督方法。本研究通过尝试多种证实的提示技术来提高 ChatGPT 对话语关系的识别能力,但实验结果表明,即使使用复杂的提示工程,推理准确性几乎没有改变,暗示隐性话语关系分类在零样本或少样本情况下尚未得到解决。
Feb, 2024
本研究旨在探究以零注释方式进行临床命名实体识别任务中,OpenAI 开发的大型语言模型 ChatGPT 以两种不同提示策略的潜力。我们将其与 GPT-3 在类似的零注释情况下进行比较,以及使用来自 MTSamples 的一组合成临床笔记的精调 BioClinicalBERT 模型。研究发现,与 GPT-3 相比,ChatGPT 在零注释情况下表现优异,并且使用不同的提示策略可以过提高其性能。虽然 ChatGPT 的表现仍低于 BioClinicalBERT 模型,但本研究证明了 ChatGPT 在不需要注释的情况下进行临床 NER 任务的巨大潜力。
Mar, 2023
本研究首次针对生物医学文本的零样本情况进行时间关系提取的研究,通过使用两种类型的提示和五种 LLMs 获得关于两个事件之间时间关系的响应,实验证明 LLMs 在零样本情况下的表现不如经过精调的专用模型,存在时间一致性问题。
Jun, 2024
本文旨在评估 ChatGPT 在生物医学领域中各种基准任务(如关系提取、文档分类、问答和摘要)的性能,在拥有较小训练集的生物医学数据集中,zero-shot ChatGPT 甚至优于最先进的经调优生成变换器模型(如 BioGPT 和 BioBART),这表明 ChatGPT 在生物医学领域也非常专业,具备成为缺乏大型注释数据的各种生物医学任务的有价值工具的潜力。
Jun, 2023
本文研究了 ChatGPT 在零 - shot 语音理解和对话状态跟踪任务中的理解能力,并发现 ChatGPT 在对话状态跟踪任务中从多轮交互提示中获益,但在语音理解任务的信息填槽中存在困难。此外,我们总结了 ChatGPT 在对话理解任务中的一些意外行为,希望为未来建立基于大语言模型的零 - shot 对话理解系统提供一些见解。
Apr, 2023