词梯:一款语义数据收集的移动应用程序
本研究提出了基于大型语言模型嵌入的移动应用预测模型(MAPLE),以应对移动应用预测中复杂的用户行为和不断演化的环境。通过对两个公共数据集的严格测试,结果表明 MAPLE 能够准确解读复杂模式并理解用户背景。这些强大的结果确认了 MAPLE 在不同场景中的多功能性和适应性。虽然其主要设计面向应用预测,但研究结果也强调了大型语言模型在不同领域中的广泛适用性。通过这项研究,我们强调了大型语言模型在应用使用预测中的潜力,并建议它们在模拟人类行为方面具有改变性的能力。
Sep, 2023
Aptly 是一种扩展了 MIT App Inventor 平台的工具,通过代码生成的大型语言模型实现自然语言驱动的移动应用开发;Aptly 通过文本语言与 App Inventor 的块语言相结合,允许通过文本模型实现可视化代码生成;论文详细介绍了 Aptly 服务器如何集成语言模型,以实时协作的方式自动创建和编辑用户指令下的移动应用;最后,通过对涉及高中学生的试点实验的研究结果,论文强调了 Aptly 作为一个工具的潜力,它民主化了应用程序开发并促进了技术创造力。
Apr, 2024
MemoDroid 是一种基于大型语言模型的创新移动任务自动化器,通过模拟人类与移动应用程序的认知过程(探索、选择、推导和回忆),将任务分解为可重用、可重新排列和适应于各种目标的模块化组件,实现对任务过程的精确和高效学习。使用在线语言模型服务(GPT-3.5 和 GPT-4)实现 MemoDroid,并在 5 个广泛使用的移动应用程序上对 50 个独特的移动任务进行评估。结果表明,与 GPT-4 驱动的基线相比,MemoDroid 能够以 100%的准确性适应不同的上下文,将任务的延迟和成本分别降低了 69.22%和 77.36%。
Dec, 2023
本文介绍一种基于 colexification 方法的词库扩展方法,名为 LEXpander,通过该方法生成的单词列表在各个测试中表现良好,可以近似于心理学和语言学专家生成的单词列表。
May, 2022
介绍了 LAMBADA 数据集用于通过单词预测任务评估计算模型的文本理解能力,该数据集要求模型具备更广泛语义的理解能力,该数据集包含了很多语言现象,现有的语言模型在该数据集上的准确率均未能达到 1%。
Jun, 2016
本文提出了一种基于 mT5 的 transformer 深度学习方法,采用翻译语言建模技术而非常用的掩码语言建模技术,实现了支持印度语言的开源跨语言反向字典系统。
Apr, 2022
探索和量化语义相关性对于表示语言至关重要,它对各种 NLP 任务具有重要意义,包括提供关于大型语言模型能力和性能的见解。本文介绍了 SemRel,这是一个由母语为 14 种语言的本土人士进行注释的新的语义相关性数据集收集项目。每个实例都是一个句子对,并与表示两个句子之间语义文本相关性程度的分数相关联。分数是通过比较性注释框架获得的。我们描述了数据收集和注释过程、构建数据集时的相关挑战以及它们在 NLP 中的影响和实用性。我们还报告了对每种语言以及不同语言之间进行的实验。
Feb, 2024