May, 2023

LLMs 能理解加密提示:迈向隐私计算友好型变压器

TL;DR本文展示了将 transformer 模型中的运算和通信重负荷的操作替换成隐私计算友好的近似可以大大降低私有推理成本,并比先前最先进的 Iron(NeurIPS 2022)获得了 5 倍计算加速和 80% 的通信负担减少,同时保持几乎相同的准确性。