- 计算社会科学任务中的提示设计对结果具有重要影响,但其方式难以预测
手动注释计算社会科学任务的数据成本高昂、耗时且情感压力大。最近的研究表明,零 - shot 设置下,语言模型可以执行此类注释任务,但我们对于提示设计如何影响语言模型的遵从和准确性了解甚少。我们进行了大规模的多提示实验,以测试模型选择(Cha - 批量指导梯度用于提示演化:增强文本到图像综合的系统性提示优化
通过多代理框架和迭代过程,基于高质量的初始查询和动态指令优化的图文生成模型,提供了改进用户输入提示设计的机制。
- AAAILLM 作为计分员:输出顺序对对话评估的影响
研究通过大型语言模型(LLMs)研究提示设计对对话评估的影响。我们的研究实验了不同的提示结构,发现呈现原因和评分的顺序显著影响 LLMs 的评分,使用先给出原因的方法能够得到更全面的评估结果,该发现对于提高 LLM 的评估准确性和一致性至关 - 针对零样本提示优化的层次化多智能体工作流
构建了一种名为 HMAW 的分层多代理流程,不受人类限制和培训,并能适应底层任务的微妙之处,通过创建详细且合适的提示,进一步提高当前 LLMs 的性能。
- ACL辩论评估中大型语言模型的实证分析
使用 GPT-3.5 和 GPT-4 等高级大型语言模型对辩论评估进行研究,发现 LLMs 在评估上的表现超过人类,并超过基于大量数据集微调的最先进方法。同时,研究了 LLMs 中存在的偏见,包括位置偏见、词汇偏见和顺序偏见,这可能会影响它 - CoE-SQL: 基于上下文的多轮文本到 SQL 学习与版本链
我们通过引入 CoE-SQL 方法,利用上下文依赖关系来改善大型语言模型在多轮文本转 SQL 任务中生成 SQL 查询时的推理能力,并通过大量消融研究确定了最佳配置,从而稳定地优于其他基线模型,同时在 SParC 和 CoSQL 两个基准测 - 医疗应用的思维工程范式:范围审查和更好实践的建议
医疗领域中探索提示工程的有效性:回顾近期 114 项应用提示工程于医学领域的研究,覆盖提示学习、提示调优和提示设计领域,结果发现提示设计是最普遍的方法,其中有 12 篇论文中三者的术语被交替使用。ChatGPT 是最常用的大型语言模型,有七 - 扩展作者:探索学术写作中人工智能合作的潜力
这篇研究论文通过对比两个人工智能模型 Gemini 和 ChatGPT 的表现和互动,以协作性工具的角度,对将生成型人工智能(Gen AI)整合到学术写作过程中进行了批判性研究,通过促进研究人员参与设计能够引出特定人工智能回应以构建研究大纲 - LLMs 在医学领域中能有效纠正医生吗?研究有效的交互方法
利用大型语言模型(LLMs)协助和纠正医生在医疗决策任务中的潜力进行探索,研究评估了几个 LLMs,包括 Meditron、Llama2 和 Mistral,以分析这些模型在不同场景下与医生有效互动的能力,并认为提示设计显著影响 LLMs - 大型语言模型在在线防搭讪中的功效探究
强大的生成型大语言模型 (LLMs) 成为了公众问答系统中流行的工具,而且正在被像儿童这样的弱势群体使用。本文探讨了 LLMs 在在线防止网络诱导方面的有效性,包括通过生成建议来识别和避免诱导,并且通过改变提供的上下文和提示的特异性来研究提 - 企业中的提示工程实践探索
通过分析 Prompt 编辑行为和变化类型,以更好地理解 Prompt 工程实践,我们发现与大型语言模型的交互主要通过提示进行,并且有效提示设计取决于用户的迭代过程和目标的实现。
- 新闻标题的定向情绪研究:探索不同层次的提示式规范化
利用各种提示设计,在新闻标题的有针对性情感分析中,调节 LLM 模型的性能。
- 翻译简报和角色提示的比较分析
探讨在 ChatGPT 的翻译任务中将翻译概念工具以及翻译者和作者的角色结合到提示设计中的有效性,结果表明,尽管某些要素有助于人与人之间的翻译任务沟通,但对于提高 ChatGPT 的翻译质量的作用有限,强调了对人机交互中涉及人机交互的新兴工 - LangGPT: 重塑面向编程语言的结构化可复用提示设计框架
LLMs have demonstrated commendable performance across diverse domains, but formulating high-quality prompts to effective - 大型语言模型的实证提示技术划分:实践指南
采用系统性方法对大型语言模型的提示技术进行分类,通过举例说明实际应用,为从业人员提供一个结构化的理解和分类提示技术的框架,以便更有效地利用大型语言模型的各种应用领域。
- 用分治程序引导大型语言模型进行问题解决
建议使用分治程序来引导大型语言模型(LLM),以解决存在中间错误和欺骗内容的任务,可以提供更好的性能。
- 通过个性化参数高效微调实现大型语言模型的民主化
通过个性化参数高效调整的方法 (OPPU),将用户个性化模型与非参数化知识相结合,实现个性化推荐和隐私保护。实验结果表明,OPPU 在处理用户行为转变、用户活跃水平建模、用户历史记录格式以及不同调整方法方面具有出色的性能。
- GLaPE: 大型语言模型未考虑标签的启发式评估与优化
该研究提出了一种无需使用黄金标签评估提示的新方法 (GLaPE),通过采用自一致性作为初始评估分数,并对产生相同答案的提示进行相互一致性的完善,旨在减少对黄金标签的依赖,同时提供与准确性一致的可靠评估,从而实现了在六个常见的推理任务中优化提 - 提示设计与工程:介绍与高级方法
教导设计和工程学是一个重要的学科,本文介绍了主要概念,并回顾了教导设计和工程的基本和更先进的方法。
- 朝向健壮的多模式提示:缺失模态
使用具体的提示设计来提高多模态学习的性能和鲁棒性,并减少提示的数量。