BriefGPT.xyz
大模型
Ask
alpha
关键词
web text
搜索结果 - 3
关于我:使用网页中的自我描述来记录英语预训练数据过滤的效果
大型语言模型的能力来源于它们的预训练数据,而模型开发始于数据筛选。我们的研究基于网络文本,将其连接到社交和地理背景,并创建了一个包含 1030 万个网站创作者自我描述的新数据集,提取了关于他们的兴趣、社交角色和地理隶属的信息。然后,我们进行
→
PDF
6 months ago
更多数据、更多关系、更多上下文和更多开放:关系抽取综述与展望
本文回顾了现有的关系抽取方法,分析了当前面临的关键挑战,并展示了通向更强大的关系抽取的有前途的方向。
PDF
4 years ago
使用基于注意力机制的神经网络从异构数据源中进行跨主题争论挖掘
本文提出了一种新的句子注释方案,用于在任意网络文本上进行争议搜索的分析,得到的神经网络模型在准确度和 F1 分数上均优于传统的双向 LSTM 模型。
PDF
6 years ago
Prev
Next