词梯：一款语义数据收集的移动应用程序

Mar, 2024

词梯：一款语义数据收集的移动应用程序

Word Ladders: A Mobile Application for Semantic Data Collection

Marianna Marcella Bolognesi, Claudia Collacciani, Andrea Ferrari, Francesca Genovese, Tommaso Lamarra...

TL;DRWord Ladders 是为收集语言数据而开发的免费移动应用程序，通过语义关系的分类包含来构建相关单词列表，同时具有 nlp 任务和认知科学开放问题的预期结果和应用。

Abstract

word ladders is a free mobile application for Android and iOS, developed for collecting linguistic data, specifically lists of words related to each other through →

word ladders linguistic data semantic relations abstraction project nlp tasks

发现论文，激发创造

MAPLE：基于大型语言模型嵌入的移动应用预测

本研究提出了基于大型语言模型嵌入的移动应用预测模型（MAPLE），以应对移动应用预测中复杂的用户行为和不断演化的环境。通过对两个公共数据集的严格测试，结果表明 MAPLE 能够准确解读复杂模式并理解用户背景。这些强大的结果确认了 MAPLE 在不同场景中的多功能性和适应性。虽然其主要设计面向应用预测，但研究结果也强调了大型语言模型在不同领域中的广泛适用性。通过这项研究，我们强调了大型语言模型在应用使用预测中的潜力，并建议它们在模拟人类行为方面具有改变性的能力。

Sep, 2023

Aptly: 利用自然语言编写移动应用

Aptly 是一种扩展了 MIT App Inventor 平台的工具，通过代码生成的大型语言模型实现自然语言驱动的移动应用开发；Aptly 通过文本语言与 App Inventor 的块语言相结合，允许通过文本模型实现可视化代码生成；论文详细介绍了 Aptly 服务器如何集成语言模型，以实时协作的方式自动创建和编辑用户指令下的移动应用；最后，通过对涉及高中学生的试点实验的研究结果，论文强调了 Aptly 作为一个工具的潜力，它民主化了应用程序开发并促进了技术创造力。

Apr, 2024

探索、选择、派生和召回：为移动任务自动化增添类似人类记忆的 LLM

MemoDroid 是一种基于大型语言模型的创新移动任务自动化器，通过模拟人类与移动应用程序的认知过程（探索、选择、推导和回忆），将任务分解为可重用、可重新排列和适应于各种目标的模块化组件，实现对任务过程的精确和高效学习。使用在线语言模型服务（GPT-3.5 和 GPT-4）实现 MemoDroid，并在 5 个广泛使用的移动应用程序上对 50 个独特的移动任务进行评估。结果表明，与 GPT-4 驱动的基线相比，MemoDroid 能够以 100％的准确性适应不同的上下文，将任务的延迟和成本分别降低了 69.22％和 77.36％。

Dec, 2023

LEXpander: 将共同义词网络应用于自动词汇扩展

本文介绍一种基于 colexification 方法的词库扩展方法，名为 LEXpander，通过该方法生成的单词列表在各个测试中表现良好，可以近似于心理学和语言学专家生成的单词列表。

May, 2022

LAMBADA 数据集：需要广泛语篇背景下的词语预测

介绍了 LAMBADA 数据集用于通过单词预测任务评估计算模型的文本理解能力，该数据集要求模型具备更广泛语义的理解能力，该数据集包含了很多语言现象，现有的语言模型在该数据集上的准确率均未能达到 1%。

Jun, 2016

基于语料库的语义词典构建方法

本研究提出了一种基于语料库的方法，可用于构建特定领域的语义词汇表，以帮助自然语言处理领域的系统，从而填补了其对手动编码各个应用程序的依赖。

Jun, 1997

语言作为一个演化的词语网络

研究语言的复杂网络结构，发现语言中单词的连接数量呈现幂律分布，提出了一种自组织网络模型，完整描述了观察到的单词网络结构。

May, 2001

构建加泰罗尼亚词网的方法和工具

介绍了开发加泰罗尼亚词网所采用的方法，使用的词汇资源以及旨在应用于任何其他语言的通用工具。

Jun, 1998

WordAlchemy: 基于 Transformer 的逆向字典

本文提出了一种基于 mT5 的 transformer 深度学习方法，采用翻译语言建模技术而非常用的掩码语言建模技术，实现了支持印度语言的开源跨语言反向字典系统。

Apr, 2022

SemRel2024：14 种语言的语义文本相关数据集收集

探索和量化语义相关性对于表示语言至关重要，它对各种 NLP 任务具有重要意义，包括提供关于大型语言模型能力和性能的见解。本文介绍了 SemRel，这是一个由母语为 14 种语言的本土人士进行注释的新的语义相关性数据集收集项目。每个实例都是一个句子对，并与表示两个句子之间语义文本相关性程度的分数相关联。分数是通过比较性注释框架获得的。我们描述了数据收集和注释过程、构建数据集时的相关挑战以及它们在 NLP 中的影响和实用性。我们还报告了对每种语言以及不同语言之间进行的实验。

Feb, 2024