BriefGPT.xyz
Ask
alpha
关键词
polish
搜索结果 - 5
POLygraph:波兰假新闻数据集
该论文介绍了 POLygraph 数据集,这是一个在波兰进行假新闻检测的独特资源。该数据集包含两个部分:11,360 对新闻文章及相应标签的 “真假” 数据集,以及 5,082 篇新闻文章及相关推文的 “真假评论” 数据集。与现有数据集不同
→
PDF
5 days ago
PRODIS - 一个用于研究波兰语可预测性效应的语音数据库和基于音素的语言模型
我们提供了一个波兰语的语音数据库和一个基于音素级的语言模型,用于分析韵律和语篇因素及其与声学参数和可预测性效应的相互作用。该数据库是波兰语音质优秀的大规模公开数据库,可用于音韵分析和多说话者语音技术系统的训练。
PDF
3 months ago
MAUPQA:大规模自动生成的波兰问答数据集
本文探讨了自动收集弱标签数据集的方法,并展示了它们对神经检索模型的性能的影响。通过本文,我们发布了 MAUPQA 数据集,其中包含接近 400,000 个波兰语问题 - 段落对,以及 HerBERT-QA 神经检索器。
PDF
a year ago
针对资源匮乏语言和字母的词典来源的可扩展手写文本识别系统
本文介绍了一种解读大量手写历史词典索引卡的方法,使用一种特别设计的手写文本识别解决方案,包括优化的检测模型,SPN、RCNN 和 CTC 三种卷积神经网络结构,以及基于约束的单词匹配算法。该方法在波兰 17th-18th 世纪历史词典的 2
→
PDF
a year ago
波兰自然语言推理和事实性 —— 专家基础数据集和基准
本文介绍了作者构建的一个涵盖波兰语自然语言中的事实现象的数据集,并使用基于 BERT 语言模型的 NLI 技术对其进行了预测,结果表明 BERT 模型在此任务中表现良好,但用于模型预测的语言特征需要人工制作,对于诸如 entitlement
→
PDF
2 years ago
Prev
Next