BriefGPT.xyz
大模型
Ask
alpha
关键词
discrete prompt optimization
搜索结果 - 4
CourseGPT-zh:基于知识蒸馏的教育型大型语言模型与提示优化
CourseGPT-zh 是一种面向课程的教育 LLM,支持定制化和低成本部署,并通过高质量的问答语料蒸馏框架和离散提示优化方法来提高响应质量,具有强大的专业能力。
PDF
2 months ago
连接大型语言模型与进化算法产生强大的提示优化器
通过连接大型语言模型和进化算法,本论文提出了一种用于离散提示优化的新框架 ——EvoPrompt,极大地提升了语言理解和生成任务中大型语言模型的表现,并展示了语言模型与传统算法结合的协同效应。
PDF
10 months ago
基于策略梯度的离散提示优化的对话式激励在小样本学习中的应用
基于对话的基于策略梯度的离散提示优化方法通过多轮对话适应性策略生成可读性提示集,并提出了具有线性复杂度的高质量提示筛选度量和基于策略梯度的强化学习框架,优于四个开源数据集上平均 1.52%的最先进方法,在只使用少量的预训练语言模型参数进行学
→
PDF
a year ago
EMNLP
RLPrompt:使用强化学习优化离散文本提示
该论文提出了一种基于强化学习的离散提示优化方法(RLPrompt),旨在有效地生成适合不同类型的预训练语言模型使用的离散提示,并在极少量的下游数据情况下表现出优异的表现。
PDF
2 years ago
Prev
Next