从理论到实践：简洁数据结构的即插即用

Nov, 2013

从理论到实践：简洁数据结构的即插即用

From Theory to Practice: Plug and Play with Succinct Data Structures

Simon Gog, Timo Beller, Alistair Moffat, Matthias Petri

TL;DR本文提出一种用于 experiment 和评价 succinct 数据结构的框架，可配置成注重准确资源估计、提供测试和工具以及提出的 solutions 用于 Document 检索等应用。

Abstract

Engineering efficient implementations of compact and succinct structures is a time-consuming and challenging task, since there is no standard library of easy-to- use, highly optimized, and composable

efficient implementations succinct structures components experimentation document retrieval

发现论文，激发创造

大规模场景中预计算 Datalog 评估计划

本文介绍一种用于优化 Datalog 查询的索引技术，通过确定最佳索引方案及 Datalog 规则的适当排列来降低内存消耗并优化查询效率，结果表明在不损失效率的情况下，内存使用显著减少。

Jul, 2019

从特定到通用的学习排序集字典：在实践中产生具有竞争力的数据结构增强器的理论上可靠的范式

在机器学习和经典数据结构的交叉领域中，这项研究关注了学习数据结构，这是一个具有重要方法论意义和高实用性影响的新领域。我们提出了一种新的思路，通过对任何排序集合字典进行学习，例如平衡二叉搜索树或其他非排序布局的二分搜索，从而在时间性能上取得了令人印象深刻的提升。

Sep, 2023

基于学习的索引性能基准测试

本文针对使用学习索引结构替换传统索引结构的近期研究提出了一个统一的基准，将三种学习索引结构的调整良好的实现与多个最先进的 “传统” 基准进行了比较，并使用四个真实世界的数据集证明，学习索引结构确实可以在密集数组的只读内存工作负载中优于非学习索引。同时还研究了缓存、流水线、数据集大小和关键字大小对性能的影响，探讨了学习模型为何能够实现如此良好的性能，并研究其他特性，如多线程系统中的性能和构建时间。

Jun, 2020

小型印记深度学习的结构变换

提出了一种基于低位移秩概念的结构化变换方法，能快速优化深度学习模型在储存和功耗受限移动设备上的部署，通过参数共享的各种配置实现结构化到非结构化的统计建模，并在关键词检测应用中显著提高推理速度和轻量化程度，表现优于目前的技术。

Oct, 2015

Qd-tree: 为大数据分析学习数据布局

本文提出一种名为 “查询数据路由树” 的框架，通过贪心和深度强化学习算法的构建，可以优化分块技术，实现数据分配的优化，提高查询性能。实验结果表明，使用 qd-tree 可以大幅加速数据查询，并且提供完整的块语义描述。

Apr, 2020

一种基于句子压缩的框架用于查询焦点的多文档摘要

本文提出了一个基于句子压缩技术的任务框架，通过基于解析树的一系列学习模型，设计一种创新的 Beam Search 解码器来高效地找到高概率压缩结果，将语言学动机和查询相关性融入压缩过程中，并在多项指标上显著优于最先进的系统，包括在 DUC 2006 和 2007 摘要任务中分别获得 ROUGE-2 指标上 8.0% 和 5.4% 的改进。

Jun, 2016

在 MapReduce 框架中的排序、搜索和模拟

本文探讨了 MapReduce 框架的算法方面，并通过设计和分析处理基本的排序、搜索和仿真问题的 MapReduce 算法展示了我们的方法的有效性。

Jan, 2011

微型集合的实用网络加速：假设，理论和算法

本文探讨了小样本训练集下网络加速的问题，提出少样本压缩算法并解释了其原理。文中同时提出了特征模仿、块剪枝等策略以及恢复度量、PRACTISE 算法等方法，实现了比其他方法更高效的网络加速。

Mar, 2023

生成压缩组合证明结构 —— 一种自动一阶定理证明方法

本文介绍了一种将组合子术语表示为证明树的方法，并引入了基于参数化组合子术语定义的证明模式，实现了基于连接结构演算的特征的自动化一阶证明的实现和第一批实验结果。

Sep, 2022

大数据时代的快速数据：Twitter 实时关联查询建议架构

本文介绍了 Twitter 实时相关查询建议和拼写更正服务的架构，讨论了如何在面对‘大数据’ 事件的高实时需求时通过从 Hadoop-based 分析栈向专为任务设计的自定义内存处理引擎的转变解决相关问题。

Oct, 2012