BriefGPT.xyz
Ask
alpha
关键词
paraphrase dataset
搜索结果 - 3
基于隐式众包数据采集的波斯语释义数据集
本文介绍了 PerPaDa,这是一个从用户输入中收集的波斯语近义词语料库,旨在帮助检测抄袭。该语料库包含 2446 个波斯语句子的大量近义词和原句,使用了一些启发式方法来排除不符合标准的句子,相对于类似数据集,该数据集更大且更无偏见。
PDF
2 years ago
ParaSCI: 一个大型的科学同义改写数据集,用于长句子同义改写生成
提出了 ParaSCI,这是第一个在科学领域内的大规模释义数据集,包括来自 ACL(ParaSCI-ACL)的 33,981 对释义和来自 arXiv(ParaSCI-arXiv)的 316,063 对释义。通过收集对同一篇论文的引用或聚合
→
PDF
3 years ago
AAAI
ParaBank:基于词汇约束神经机器翻译的单语种双语文本生成和句子改写
该论文介绍 ParaBank,这是一个大规模的英语释义数据集,使用神经机器翻译和词汇约束生成英语句子的多个高质量释义版本,可用于句子改写任务。
PDF
5 years ago
Prev
Next