Jan, 2024

Chatterbox: 不稳定网络中LLM Token流媒体的健壮传输

TL;DR在不稳定的网络条件下,我们展示了当前的应用程序包括ChatGPT、Claude和Bard都会因为网络中断而导致大量停顿。为了解决这个问题,我们提出了一种名为Chatterbox的新的传输层方案,通过将新生成的令牌和当前未确认的令牌放入下一个传出数据包中,从而避免了由于缺失数据包而导致的停顿。通过在各种网络条件下进行模拟,我们展示了与实际的聊天机器人应用常用的令牌流方法相比,Chatterbox将停顿比例(令牌渲染等待时间的比例)降低了71.0%,与自定义数据包复制方案相比降低了31.6%。通过调整Chatterbox以适应LLM的令牌逐个生成,我们使得聊天机器人可以像一个雄辩的演讲者一样回复用户,以便更好地享受无处不在的人工智能。