Jun, 2024

自动提取伪代码的扩展规模

TL;DR通过从 arXiv 论文中提取近 320,000 个伪代码示例,我们创建了一个庞大的伪代码集合。我们的方法包括一个定制化的提取机制和一个基于随机抽样的验证机制,以优化覆盖范围并检查准确性和可靠性。同时,通过聚类和统计分析,我们提供了对常见伪代码结构的洞察,表明伪代码的使用呈现出指数型增长,凸显其不断增加的重要性。