- 国际象棋博弈神经网络中已学习到的预测能力的证据
神经网络在野外是否能够学习实现诸如预测或搜索等算法?还是纯粹依赖简单启发式规则的集合?我们通过 Leela Chess Zero 中感知网络的学到的预测来证明神经网络的学到的预测能力,并发现这些表示对其在特定局面下的最终输出至关重要。这些发 - 大语言模型时代生成式搜索和推荐的调查
该研究综述了新兴的信息系统中增强搜索和推荐领域中的生成式搜索和推荐模型,并从一个统一的角度总结了该领域的发展,提出了独特挑战、未解问题和未来发展方向,展望下一个信息需求模式。
- 搜索流(SoS):在语言中学习搜索
该论文提出了一种通过使用一种表示搜索过程的扁平字符串(搜索流)来教授语言模型进行搜索的方法,并通过使用启发式求解器生成的搜索流数据集从头开始预训练一个基于 Transformer 的语言模型来展示该方法的有效性。论文进一步使用 Advant - 利用神经网络从电子报纸中提取投标公告
本研究旨在解决手动搜索投标通知的繁琐任务。使用 Python 的 Selenium 库下载报纸,然后使用神经网络自动提取招标通知。研究采用了不同 CNN 架构(ResNet、GoogleNet 和 Xception),并实现了最佳性能模型。 - 基于 LLM 的提示修改和用户反馈的交互式查询生成助手
该研究论文介绍了一种新的搜索界面,支持对单语或多语言文档集合进行自动生成查询,并通过用户反馈来优化查询,从而解决用户在查询表达方面的困难。
- 利用 AI 副驾驶员解决复杂搜索任务
搜索、复杂任务、生成人工智能、辅助代理和信息访问是这篇研究论文的关键词,通过作者在 2023 年 ACM SIGIR 大会上的主题演讲,探讨了这些问题,并为 AI 辅助代理引领下的信息访问开辟了新的前景。
- 搜索适配器:信息检索的文本嵌入定制化
通过自定义 Search-Adaptor 方法,我们可以提高预训练大型语言模型在信息检索和搜索领域的性能,有效且稳健地修改原始文本嵌入向量,与任何语言模型集成,并在多个实际英语和多语种检索数据集上取得一致且显著的性能提升。
- FLIQS: 单次混合精度浮点数与整数量化搜索
量化已成为现代深度神经网络的主流压缩技术,本文提出了一种一次性的混合精度量化搜索方法,通过整数和低精度浮点模型在不需要重新训练的情况下提高了 ResNet-18 和 ResNet-50 在 ImageNet 上的准确性,并探索了混合精度浮点 - KDD以用户为中心的排名破解质量饱和的诅咒
本文提出了一种名为 "基于用户中心排序" 的替代排序算法,该算法能够解决排序模型中的诸多问题,包括模型复杂性和大规模数据分析等方面。
- ACL大规模多语言事件理解:提取、可视化和搜索
本文介绍了一种跨语言事件抽取系统及其用户界面。仅使用英文训练数据,该系统可以处理 100 种语言的用户提供文本,并提供多种视图和搜索功能,支持结构化和自然语言查询。
- 面向用户查询的上下文多语言拼写检查器
该论文介绍了一种多语种的拼写检查器,它可以根据特定产品的需求适应其词汇,并在领域特定的数据集上性能优异,可以用于搜索和为各种应用程序提供自动完成功能。
- 点击反馈检索
本研究旨在通过用户点击喜欢和不喜欢的搜索结果提供反馈,以指导搜索过程,构建了新的基于时尚领域大规模数据集的点击反馈检索基准,证明了将点击反馈纳入训练可以显著提高检索质量。
- SIGIR多模态会话任务引导系统中的人类参与方法
本文讨论了人类在指定任务中使用应用程序所面临的挑战,提出了任务引导系统的发展需要寻找信息检索和会话系统来帮助任务的执行者,并针对现有数据集开发了一个基于 Wizard-of-Oz 的数据收集工具,进行了初步实验。
- 量子算法的大统一
该论文介绍了一种新型的技术 —— 量子奇异值变换 (QSVT), 通过该技术匹配了多种量子算法,包括搜索、相位估计和哈密顿模拟,并展示了计算特征值阈值问题和矩阵求逆等算法,从而表明 QSVT 是一个包含三种主要量子算法的单一框架,并提出了量 - EMNLP超级标签中 Beam-Aware 训练的实证研究
本文实证研究了结构化预测方法中的基于局部标准化模型的最大似然训练和基于波束搜索的近似解码的问题,提出基于波束的训练算法来解决这一问题并探究了其对模型性能的影响与稳定性,结论表明波束训练可有效提高模型性能并建议模型学习中采用搜索以最大化模型效 - 基于深度强化学习和搜索算法的不完全信息博弈组合
本文介绍了 ReBeL,它是一种通用的强化学习和搜索框架,并在任何两人零和博弈中证明收敛于纳什平衡。同时,使用比任何先前的扑克 AI 更少的领域知识,ReBeL 在无限制德州扑克中实现了超人类性能。
- MurTree:使用动态规划和搜索实现的最优分类树
本研究提出了一种基于动态规划和搜索的学习算法来实现最优决策树,这种算法支持对树的深度和节点数量设置限制,并在实验证明使用我们的算法只需要很短的时间就可以处理具有成千上万个实例的数据集,从而极大地提高了最优决策树的实用性。
- BERT 排名器在蒸馏下的理解
本文研究了如何通过蒸馏将 BERT 中的搜索知识传递到更小的排名器中,实验表明,使用适当的蒸馏过程可以实现最高 9 倍速度提升,同时保持最先进的性能。
- ECCV搜索您需要的内容:混合精度量化的障碍罚项神经架构搜索
本文提出了基于软障碍罚函数的神经架构搜索方法 BP-NAS,用于搜索在给定复杂度条件下的最优混合精度模型,相较于手动设计和其他自动化混合精度方法,BP-NAS 在分类和目标检测任务上均取得了更好的结果。
- MMTF-Coder:用于张量操作的程序合成
本文介绍了一种名为 TF-Coder 的工具,可以使用 TensorFlow 进行编程示例。TF-Coder 使用自底向上的加权枚举搜索,通过基于值的修剪等方法,确保表达式符合 TensorFlow 库所施加的各种要求。在实现 63 个真实