unannotated data | BriefGPT

关键词unannotated data

搜索结果 - 4

自我演进的策略优化微调
本研究在大型语言模型（LLMs）对齐方面引入自我演进微调（SEFT），旨在消除对注释样本的需求，同时保持 SFT 的稳定性和效率。通过 SEFT，模型能利用大量未标志的数据进行策略优化。实验结果表明 SEFT 的有效性，并对其相对于现有对齐
PDF20 days ago
可解释的句子表示：变分自编码器和注意力机制
提出使用变分自编码器和 Transformers 构建两种具有归纳偏置的模型，可将潜在表示中的信息分离成可理解的概念，其中 QKVAE 在转移实验中表现出竞争性能，并展示了明显的优化句法角色分离能力。
PDFa year ago
IJCAI用非常少的数据训练自然化语义解析器
本篇论文介绍了一种基于语言模型的 seq2seq 体系结构，重点介绍了少样本语义解析，并基于非注释数据引入联合训练、有约束的解码、自训练和重新表述这四种技术进行了自动方法来提高语义解析性能。结果表明，该方法在夜间数据集上提供了新的最优结果，
PDF2 years ago
ACL挖掘话语标记以进行无监督句子表示学习
本研究提出了一种方法，利用未标注的语料库中的关于话语标记的信息，自动发现带有相关话语标记的句子对，构建了一个包含 174 个话语标记的数据集，并用于学习迁移句子嵌入。尽管语句表示学习通过话语标记预测取得了跨转移任务的最先进结果，但仍存在进一
PDF5 years ago