BriefGPT.xyz
大模型
Ask
alpha
关键词
linguistically analyzed corpus
搜索结果 - 1
从 CommonCrawl 构建 Web 规模的依赖解析语料库
介绍了 DepCC,这是迄今为止最大的英文语言分析语料库,包括 365 万份文档,由 Common Crawl 项目的 2520 亿个符记和 75 亿个命名实体出现组成,可以通过一些应用程序使用,例如基于句法的词嵌入训练,信息提取和问题回答
→
PDF
7 years ago
Prev
Next