prompt tuning | BriefGPT - AI 论文速递

关键词prompt tuning

搜索结果 - 128

Craft: 跨模态对齐特征提高提示调整的鲁棒性
通过交叉模态对齐的特征调整方法（Craft）解决了提示调整方法由于训练样本有限而导致的过拟合问题，并通过优化特征对齐损失和最小化最大均值差异来提高模型性能和鲁棒性。
PDF5 days ago
使用稀疏熵正则化使难提示可解释：通过 RL 对提示进行调整
通过优化稀疏的 Tsallis 熵正则化，我们改善了提示调整的挑战，提高了提示发现方法的效果，并使其更加自然和可解释。
PDF7 days ago
CoAPT: 上下文属性词用于提示调整
我们提出了一种名为 CoAPT（Prompt Tuning 中的 Context Attribute Words）的新型预设调整方法，用于少量 / 零样本图像分类。它通过集成属性词作为附加的预设，结合可学习的预设调整方法，促进了现有预设调整
PDF9 days ago
完全微调的 CLIP 模型是高效的小样本学习器
通过 CLIP-CITE 框架，我们在最小参数调整的情况下，通过细致改进整个 VLMs 并整合知识蒸馏技术以保留获得的知识，有效地提升了特定任务在有限监督下的性能，同时保留了 VLMs 在其他数据集上的适应性。
PDF23 days ago
LoPT: 低秩提示调节用于参数高效语言模型
在本论文中，我们提出了一种名为 LoPT 的低秩模型，用于优化提示信息，通过减少可训练参数数量，实现与完全参数的提示优化相似的效果，同时相较于现有方法需要的参数数量减少了 5 到 20 倍。
PDFa month ago
TemPrompt: 基于 RAG 的众包系统中的多任务提示学习用于时间关系抽取
基于预训练语言模型的多任务提示学习框架（TemPrompt）结合了提示调整和对比学习来解决事件的演变以及任务请求的问题，实验结果表明在标准和少样本情况下，TemPrompt 在多个指标下优于其他基准模型，并通过案例研究验证了在众包场景中的有
PDFa month ago
持续学习中 PEFT 技术的选择：调优并不是你所需要的全部
本研究揭示了未经审查的 Prompt tuning 选择对持续学习系统的整体性能产生负面影响，使用 LoRA 替代 Prompt tuning 的变体在领域增量和类别增量基准上实现了更高的准确性，同时具有相似的推理速度。
PDF2 months ago
SIGIR大型语言模型作为推荐系统：流行偏见的研究
研究探讨了大语言模型在推荐系统中对流行度偏差的贡献和缓解的机会，并提出了一种新的测量流行度偏差的指标，通过对电影推荐任务的比较发现，即使没有明确的缓解方法，大语言模型推荐系统仍然表现出较少的流行度偏差。
PDF2 months ago
SEP：自我增强的视觉语言模型提示调整
基于 Context Optimization (CoOp) 的 Prompt tuning 方式可通过推断附加可学习的提示符令牌来有效地调整视觉 - 语言模型（VLMs）以适应下游任务。然而，这些令牌由于与预训练的令牌无关且无法捕捉特定于
PDF2 months ago
少即是多：用于高效多标签类别增量学习的补丁标记总结
通过提出的多标签增量学习方法 MULTI-LANE，我们能够在不同前景对象属于多个任务时，通过维护任务特定路径来消除选择提示的机制，并通过总结的标记对这些减少后的标记应用提示调整以计算最终表示，这使得我们能够学习在多标签增量学习中解耦的任务
PDF2 months ago
多空间投影和提示融合的高效提示调整
通过多空间投影和提示融合的方式，我们提出了一种高效的提示调整方法（EPT），旨在解决平衡准确性和效率的问题，同时提升语言模型在不同下游任务上的表现。实验结果表明，相对改进百分比高达 28.8％，训练时间减少了 14％。
PDF2 months ago
IJCAITAI++：基于共同学习的可迁移提示的多标签图像分类中的文本作为图像
该研究论文提出了一种使用伪视觉提示的模块来改进多标签图像分类的性能，通过将伪视觉提示与文本提示结合，增强它们的视觉表示能力，并在多个数据集上展示了超过现有方法的性能提升。
PDF3 months ago
通过多知识表示优化视觉语言模型的提示学习
Context Optimization with Multi-Knowledge Representation (CoKnow) enhances Prompt Learning for VLMs by addressing the la
PDF3 months ago
AAAI插入并玩：一种控制文本生成的提示调整方法
利用小型语言模型进行 Prompt 调整，使用提示嵌入对生成文本进行控制，验证其在情感分析、正式度和有害语言领域的有效性。
PDF4 months ago
CVPR卷积提示与语言模型相遇的持续学习
提出了 ConvPrompt，一种新颖的卷积提示创建机制，通过维护逐层共享的嵌入，实现了层特定学习和更好的概念传递，从而克服了 Catastrophic Forgetting 在 Continual Learning 中的问题。通过使用卷积
PDF4 months ago
ICLRC-TPT：基于文本特征离散度的视觉 - 语言模型校准测试时提示调整
通过观察我们发现，测试时间提示选择显著影响 CLIP 的校准，其中导致更高的文本特征分散的提示导致更好校准的预测。介绍了平均文本特征分散（ATFD），建立了它与校准误差的关系，并提出了一种新的方法，即校准的测试时间提示调整（C-TPT），以
PDF4 months ago
细调 vs 触发，语言模型是否能理解人类价值观？
未来我们将探索 fine-tuning 和 prompt tuning 在处理句子中潜在支持值的任务中的潜力，同时对大型语言模型与强化学习对齐在此任务中的能力进行初步尝试。
PDF5 months ago
深层激励多任务网络用于辱骂语言检测
我们提出了一种用于滥用语言检测的全新的深度提示多任务网络 (DPMN)。DPMN 首先尝试设计了对预训练语言模型 (PLMs) 的深度提示调优和轻提示调优两种形式。研究了不同提示长度、调优策略和初始化方法对滥用语言检测的影响。此外，我们提出
PDF5 months ago
CVPR动态适配器遇到提示调整：基于参数效率的点云分析迁移学习
本文的目标是研究点云分析中的参数高效迁移学习，以在任务性能和参数效率之间取得理想的平衡，通过冻结默认预训练模型的参数，并使用动态适配器和提示调整相结合的方法，捕捉每个标记的重要程度，要点功能以及实例特定特征的交互。通过在五个具有挑战性的数据
PDF5 months ago
预训练变压器可作为通用逼近器
通过 prompt tuning 和 prefix-tuning，本论文探讨了预训练模型能否被任意修改以逼近序列到序列函数，证明了通过加前缀可以使比先前认为的更小的预训练模型成为普遍逼近模型。此外，本论文还给出了逼近函数所需前缀长度的限制。
PDF5 months ago