自动填字游戏求解
该研究提出将填字游戏作为新的自然语言理解任务,并公开发布了从纽约时报跨越 25 年的近九千个填字游戏的语料库规范,以及包含超过半百万个独特线索 - 答案对的开放域问答数据集,并探讨了多种处理方法及评价框架。
May, 2022
使用大型语言模型解决填字游戏的挑战,展示了当前最先进的语言模型在解谜填字提示方面的显著能力,性能达到先前结果的 2-3 倍,还开发了基于这一性能的搜索算法,首次使用语言模型解决完整的填字方格问题,在纽约时报的填字游戏上实现了 93% 的准确率,研究表明语言模型与人类专家的性能差距更小。
Jun, 2024
教育性填字游戏的制作利用自然语言处理和机器学习技术生成并验证谜底,其中包括使用 GPT3 和 BERT 模型生成谜底和从文本中提取提示,并通过零 / 少次学习确保质量,研究结果表明该方法能够创建高质量的教育性填字游戏。
Nov, 2023
这篇论文介绍了第一个由先进的 AI 技术驱动的阿拉伯文填字游戏生成器。该系统利用了 GPT4、GPT3-Davinci、GPT3-Curie、GPT3-Babbage、GPT3-Ada 和 BERT 等先进的大型语言模型,生成独特而具有挑战性的提示。基于包含超过 50,000 个提示 - 答案对的数据集,该生成器采用了微调、零 / 少样本学习策略和严格的质量检查协议来确保生成高质量的提示 - 答案对。重要的是,教育性的填字游戏有助于增强记忆、扩展词汇和促进解决问题的能力,从而通过有趣且引人入胜的方式增强学习体验,重塑传统学习方法的格局。整个系统可以被视为一个强大的教育工具,融合了人工智能和创新的学习技术,为阿拉伯文填字游戏和技术与教育的交叉领域开启了变革时代。
Dec, 2023
本研究通过扩展自动填字游戏求解器 WebCrow 2.0 到法语,采用多个模块从异构资源中检索候选答案,以应对缺乏大规模线索 - 答案数据的问题,并在两个挑战中将法国 WebCrow 的性能与人类进行了比较,结果证明其在速度和准确性方面超越了人类,从而证明了其在推广到新语言方面的能力。
Nov, 2023
该研究介绍了一种利用大型语言模型(LLM)进行教育目的的土耳其纵横字谜生成器,并提供了两个特殊数据集,其中一个包含超过 18 万个唯一的答案 - 提示对,用于从给定答案生成相关提示,另一个包含超过 3.5 万个包含文本、答案、类别和提示数据的样本,旨在为特定文本和关键词生成特定类别的提示。除了娱乐之外,这个生成器成为一种互动教育工具,提高记忆力、词汇量和问题解决能力。对于土耳其语而言,它是人工智能增强教育的一个显著步骤,将游戏式的参与与学习相结合,在土耳其语中建立了互动、智能学习工具的新标准。
May, 2024
Dr.Fill 是一个解决美式纵横填字游戏的程序,它将这些游戏转换为加权 CSPs,然后使用各种创新技术来找到解决方案,该程序在美国纵横填字游戏大赛上的表现表明,它在世界范围内排名前五十的纵横字谜解决者之间。
Jan, 2014
本研究提出了一个自动生成以新闻为中心的填字游戏的框架,通过包含尽可能多的新闻相关单词,来增加人们对新闻的兴趣,并通过对原型的定性评估总结了当前问题和未来研究方向。这是首个提出将约束满足和优化问题的形式化应用于教育领域的建议。
Aug, 2023
基于神经网络的自动数学问题求解器在解决算术问题方面成功地达到了 70-80%的准确率,然而研究表明这些求解器可能依赖表面模式得到方程。为了确定数学问题求解器使用哪些信息生成解答,我们移除输入的一部分并测量模型对扰动数据集的表现。结果表明,当给出无意义问题时,即使从输入中删除许多单词,模型也不敏感并仍能找到正确答案。这表明自动求解器并不遵循数学问题的语义逻辑,可能过拟合于特定单词的存在。
Jul, 2023
使用大型语言模型和 PUZZLEQA 数据集探索解决和生成 NPR Sunday Puzzle 游戏节目谜题的能力,并发现大型语言模型可以解决 PUZZLEQA 谜题,但在生成谜题方面表现不佳,需要未来的研究。
Jun, 2023