May, 2024

RealitySummary:基于大型语言模型的按需混合现实文档增强

TL;DR我们介绍了一种名为 RealitySummary 的混合现实阅读助手,它可以通过按需的文本提取、摘要和增强来提升任何印刷或数字文档。我们探索了通过利用大规模语言模型进行按需文档增强的通用技术,并开发了一个概念验证系统,可以使用谷歌云 OCR 和 GPT-4 自动提取和摘要文本,然后使用 Microsoft Hololens 2 和 Apple Vision Pro 在文档周围嵌入信息。通过可用性研究和实地研究的结果,我们揭示了按需的混合现实文档增强的潜在效益和未来研究的机会。