BriefGPT.xyz
Ask
alpha
关键词
pdf files
搜索结果 - 3
KDD
PDF 恶意软件检测的小型功能集
机器学习在恶意软件检测系统中的应用日益重要,本研究提出了一种只使用 12 个特征的小特征集,通过六种不同的机器学习模型评估表明,在 PDF 恶意软件检测领域中具有最简洁的特征集之一,并能获得与大量特征集相当的准确性。
PDF
a year ago
从 Web 爬虫数据构建高质量视觉丰富文档的语料库
提出一种高效管道,通过使用 Common Crawl 在因特网上创建大规模、多语种的 PDF 文件语料库,有助于语言模型的预训练。数据集和工具为研究者提供了开发更好的多语言语言模型的机会。
PDF
a year ago
复杂表格结构识别
本论文提出了一种名为 GraphTSR 的新型图神经网络,用于在 PDF 文件中识别表的结构,其通过预测单元之间的关系来识别表结构,并构建了一个大规模的表结构识别数据集 SciTSR,该模型对于复杂的表具有很高效性,并超过了基准数据集和新构
→
PDF
5 years ago
Prev
Next