BriefGPT.xyz
大模型
Ask
alpha
关键词
task discrepancy
搜索结果 - 2
基于数据驱动的批量 $Q^*$ 学习中的知识传递
在数据驱动的决策制定中,通过利用现有企业的大量数据来导航高维特征空间,解决新企业中数据稀缺问题,在动态决策制定中探讨知识转移,并通过马尔可夫决策过程的角度形式定义任务差异,提出了具有通用函数逼近的转移拟合 Q - 迭代算法框架,可直接估计目
→
PDF
3 months ago
低保真端到端视频编码器预训练用于时间动作定位
提出了一种新的 LoFi 视频编码器预训练方法,通过减少时空或时空分辨率的 mini-batch 组合来实现对编码器的端到端优化,有助于解决任务不一致性问题并提供更有效的特征表示,从而显著提高了现有 TAL 方法的性能。
PDF
3 years ago
Prev
Next