BriefGPT.xyz
Ask
alpha
关键词
system prompt
搜索结果 - 2
使用合成偏好数据对语言模型进行可配置的安全调整
提出了一种 Configurable Safety Tuning (CST) 方法,通过使用合成的偏好数据,来增强 Direct Preference Optimization (DPO) 在推理时对语言模型的灵活安全配置,有效地处理了用户
→
PDF
3 months ago
使用中继注意力实现高效的大型语言模型与长系统提示的服务
通过一种名为 RelayAttention 的算法,该论文提出了一种提高大型语言模型(LLM)服务效率的方法,解决了长系统提示导致的吞吐量 / 延迟瓶颈问题,该算法通过从 DRAM 准确一次性读取输入令牌批次的隐藏状态,从而消除了系统提示的
→
PDF
5 months ago
Prev
Next