BriefGPT.xyz
Ask
alpha
关键词
traditional methods
搜索结果 - 4
AgentReview:使用 LLM 代理探索同行评审动态
我们引介了 AgentReview,这是第一个基于大型语言模型(LLM)的同行评审模拟框架,可以有效地解开多个潜在因素的影响并解决隐私问题。研究揭示了诸多重要发现,包括考虑到社会学理论,如社会影响理论、利他主义疲劳和权威偏见,由于审稿人的偏
→
PDF
18 days ago
奥恩斯坦 - 乌伦贝克过程参数估计的传统与深度学习方法的比较
我们使用多层感知器 (MLP) 来估计 OU 过程的参数,并将其性能与传统参数估计方法(如卡尔曼滤波器和极大似然估计)进行比较,发现在大型观测轨迹数据集上,MLP 可以准确估计 OU 过程的参数,但传统参数估计方法可能更适用于较小的数据集。
PDF
3 months ago
迭代数据平滑:在 RLHF 中缓解奖励过拟合和过优化
本研究探讨了来自人类反馈的强化学习(RLHF)技术,通过利用排名数据的奖励模型学习人类价值观,设计了一种称为 “迭代数据平滑”(IDS)的改进奖励学习算法,实证发现该方法表现优于传统方法。
PDF
5 months ago
一个模型胜过几万个例子
本文通过对精确定义的数学模型生成的数据进行实证研究,在一维高斯信号去卷积和估计随机灰度圆形图像中圆的半径和位置等简单例子上,通过训练各种网络,发现与传统的基于数学模型的方法相比,无论是从头开始训练还是采用迁移学习或微调,神经网络需要数万个示
→
PDF
a year ago
Prev
Next