BriefGPT.xyz
Ask
alpha
关键词
data scraping
搜索结果 - 2
利用大型语言模型进行网络抓取
使用已经训练好的大型语言模型与 RAG 模型结合,研究了一种通用准确的数据抓取方法,该方法能够从非结构化文本中提取复杂数据。未来的研究方向包括解决溯源追踪和动态知识更新等挑战,在提取数据的方法和框架方面潜力巨大。
PDF
a month ago
用于数据污染的自回归扰动
该研究介绍了自回归(AR)中毒的方法,可以生成具有毒性的数据,而不需要访问更广泛的数据集,比起现有的不可学习方法,我们的 AR 毒药更加抵抗对抗训练以及强数据扩充等常见的防御。
PDF
2 years ago
Prev
Next