BriefGPT.xyz
大模型
Ask
alpha
关键词
implicit information
搜索结果 - 2
连接事实:LLMs 可以从不同的训练数据推理和表达潜在结构
大型语言模型面临的安全风险可以通过从训练数据中删除危险知识来解决,但隐式信息可能仍然分布在各个训练文档中,我们研究了一种称为归纳无上下文推理的泛化类型,通过从训练文档中分散的证据中推断潜在信息并将其应用于下游任务,并展示了大型语言模型可以执
→
PDF
12 days ago
ACL
未明确说明的语义:自然语言生成模型 GPT2 中的段落结束和序列标记的影响
研究隐式信息如何影响文本生成质量,并发现使用预训练语言模型 GPT2 可以通过在微调阶段学习生成段落结束符以获得更好的文本连续性,其在生成英语故事和中文文章方面实现了比较好的实验结果。
PDF
4 years ago
Prev
Next