BriefGPT.xyz
Ask
alpha
关键词
reinforcement learning method
搜索结果 - 4
抗体 CDRH3 设计的稳定的在线和离线强化学习
该研究引入了一种新颖的增强学习方法,专门针对抗体设计领域的独特挑战,展示出其能够学习在体内或离线数据集中设计高亲和力抗体的能力,为个体疾病如癌症等复杂疾病的靶向抗体疗法的发展提供了新的途径。
PDF
7 months ago
WSDM
离线约束深度强化学习中的营销预算分配
提出一种基于值函数的强化学习方法来解决在线营销活动中利用离线数据进行预算分配的问题,该方法通过使用混合策略减少存储策略的数量,并实现了接近最优策略的效率,经过大规模的营销活动实验证明该方法优于其他基准方法。
PDF
10 months ago
Style Miner:利用约束强化学习在时间序列中查找显著且稳定的解释因素
本文介绍了一种基于强化学习的方法,称为 Style Miner,用于生成低维度风格因子,能够在金融和气候变化等领域中提高 R-squared 指数达到 10% 左右的准确度。
PDF
a year ago
如果您愿意,请多聊聊:动态线索词计划以延长对话
通过引入多轮提示词和强化学习方法来建立开放式的多轮对话系统,优化对话流程建模,提高生成响应的质量,相关实验结果验证优于竞争基线模型。
PDF
6 years ago
Prev
Next