冰球中基于上下文的球员评估的深度强化学习

IJCAIMay, 2018

冰球中基于上下文的球员评估的深度强化学习

Deep Reinforcement Learning in Ice Hockey for Context-Aware Player Evaluation

Guiliang Liu, Oliver Schulte

TL;DR本论文提出了一种基于深度强化学习（DRL）的新方法来捕捉游戏背景，该方法使用 3M NBA 比赛的 play-by-play 事件来学习一个行动价值 Q 函数，并引入一种新的游戏影响度量（GIM）来评估玩家的整体表现。评估结果表明，GIM 在整个赛季中保持一致，并与标准成功指标和未来薪资高度相关。

Abstract

A variety of machine learning models have been proposed to assess the performance of players in professional sports. However, they have only a limited ability to model how player performance depends on the

machine learning professional sports deep reinforcement learning game context game impact metric

发现论文，激发创造

模型为基础的深度强化学习在空气曲棍球中的应用

开发自动打冰球策略的研究，使用基于模型的深度强化学习结合自我对抗学习，解决了智能机器人对于不同对手策略的泛化和过拟合问题。同时探讨了想象力视域对于机器学习效果的影响。

Jun, 2024

基于多智能体深度强化学习的进攻和防守足球球员动作价值评估

本文提出了一种基于多智能体深度强化学习的综合框架，用于对足球比赛中的在场和离场球员进行可能动作的价值评估，该方法能够连续地评估多个球员的动作，对于团队合作、球员球迷活动等具有重要意义。

May, 2023

强化学习方法将压缩上下文整合到知识图谱中

该研究提出了一种基于强化学习的方法，利用深度 Q 网络增强知识图谱中上下文信息的整合过程。实验结果表明，该方法在不同的标准知识图谱数据集上优于传统技术，准确实现了上下文整合，凸显了强化学习在增强和管理知识图谱方面的潜力和有效性。

Apr, 2024

从赌徒模型到深度确定性策略梯度，具有情境信息的强化学习

在研究中，我们采用了两种方法来解决情境信息的问题：情境 Thompson 抽样和受监督的强化学习，这可以加速搜索最佳答案的迭代。为了研究量化市场中的战略交易，我们将之前的金融交易策略（常比例保险组合）与深度确定性策略梯度相结合。实验结果表明，两种方法都可以加速强化学习的进展，以获取最优解。

Oct, 2023

视频游戏中深度强化学习综述

本文综述了深度强化学习 (DRL) 的进展，包括基于价值、基于策略和基于模型的算法，并对其在游戏 AI 领域内的应用和挑战进行了讨论和总结。

Dec, 2019

具有显式上下文表示的深度强化学习

该研究提出了一种离散环境中的 Iota 显式上下文表示 (IECR) 框架，通过提取上下文关键帧 (CKFs) 实现了从环境中学习，并使用新算法在五个离散环境中取得了显著优于现有算法的收敛效果。

Oct, 2023

深度 Q 网络在人工智能足球中的应用

利用深度 Q 网络算法，成功对 AI Soccer 等 5:5 机器人足球游戏中的机器人进行训练，并在 AI Soccer 国际大赛中进入了前 16 强。

Sep, 2022

通过奖励塑造将上下文信息嵌入多智体学习中：以 Google 足球为例的案例研究

本研究旨在通过奖励塑形方法来解决多智能体环境下 MARL 算法以及稀疏奖励信号产生的挑战，在 Google Research Football 环境中实验结果表明，奖励塑形方法对于训练多智能体环境下的 RL 算法是有用的。

Mar, 2023

机器人空气曲棍球：用强化学习进行机器人学习的操纵测试平台

机器人空中曲棍球动态交互的强化学习实验平台，包括从简单的任务到复杂的任务，支持模拟到真实世界的迁移，并使用演示数据评估了行为克隆、离线强化学习和从零开始的强化学习。

May, 2024

使用深度强化学习为双足机器人学习敏捷的足球技能

本文研究了深度强化学习在机器人学中的应用，通过模拟训练，在低成本仿真机器人上实现了动态环境下复杂足球比赛中从走路到踢球等一系列动作表现出稳定流畅的运动技能，并取得了不错的效果。

Apr, 2023