大规模数据集上的电子竞技数据即时解说生成
本文介绍了 K-SportsSum,它是一个由大规模比赛实时评论和体育新闻构成的新数据集,并提出了一种知识增强式总结器,利用实时评论和知识来生成更具信息量的体育新闻,实验证明了我们的模型达到了新的最高水平。
Nov, 2021
本研究通过创建一个包含游戏场景和观众评论的大型数据集 CS-lol,来探索电竞直播中观众评论和场景的关系,提出了难度较高的观众评论检索任务,并在基线检索方法中取得了优异的成果。
Jan, 2023
本文提出了一种基于密集视频字幕的评论生成任务,旨在为足球比赛提供文字评论,以便广播公司能够将视频内容总结成同步且有意义的文字评论,从而更好地满足足球粉丝的需求,增强足球内容的可理解性和可访问性。
Apr, 2023
介绍 GAME-MUG,一个包含多模态游戏情境理解和观众参与评论生成数据集的新数据集,以及使用鲁棒性联合多模态双学习模型作为基线的新观众对话增强评论数据集。通过覆盖游戏情境和观众对话的学习,引入时间序列事件日志,检查模型对游戏情境 / 事件的理解能力和评论生成能力,展示多模态方面覆盖和联合集成学习方法的有效性。
Apr, 2024
利用生成式 AI 模型,我们解决了大规模体育和音乐活动媒体内容(如评论和个性化新闻报道)的生产问题,并成功应用于 2023 年美网、温网和大师赛的自动化解说系统以及 ESPN Fantasy Football 和格莱美奖音乐艺术家故事的个性化内容创作,实现了 15 倍的速度提升,平均 Rouge-L 达到 82.00,困惑度为 6.6。我们的工作成功地支持了全球 9000 万球迷的 8 亿页面浏览,不断推动体育、娱乐和人工智能交叉领域的边界。
Jan, 2024
本文发布了第一个英文版的体育比赛摘要数据集 GOAL,其中包含了 103 组评论 - 新闻对和 2160 个未标记的评论文档,并基于该数据集建立和评估了几种基线模型,包括抽取式和生成式模型。实验结果表明该任务仍然具有挑战性,并且希望该工作能够促进体育比赛摘要的深入研究。
Jul, 2022
在足球领域,应用自动语音识别(ASR)技术提供了许多运动分析的机会,本研究介绍了 SoccerNet-Echoes 数据集,利用 ASR 自动生成足球比赛音频解说的文字转录,通过丰富的文字信息增强视频内容,扩展了 SoccerNet 数据集的用途,包括提升的动作定位、自动字幕生成和比赛摘要等多样化的应用领域,通过结合视觉、听觉和文字信息,SoccerNet-Echoes 旨在为捕捉足球比赛动态特征的算法开发提供全面的资源,并且强调多模态方法在运动分析中的意义,以及丰富的数据集对于推动该领域的研究和发展所带来的影响。
May, 2024
本文通过创建更强大的足球比赛评论生成基准数据集 SN-Caption-test-align,利用多模态时间对齐流程构建出高质量的训练数据集 MatchTime,训练了一个自动评论生成模型 MatchVoice,并通过广泛实验和消融研究证明了对齐流程的有效性和在评论生成任务中带来的显著性能提升。
Jun, 2024
本研究提出了一种基于预训练编码器 - 解码器框架并整合外部知识的方法,旨在为生成长视频的现场评论提供支持。作者共收集了一个 MovieLC 数据集,并开源了相关代码,实验结果表明,该模型在客观度量和人类评估方面具备较高的效率。
Apr, 2023
本文通过从游戏设计 (即补丁说明) 中提取信息,并利用聚类技术提出了一种新的角色表示形式,然后以 Dota 2 比赛中击杀数量预测为案例研究,训练了一个神经网络模型,该模型使用这种新的角色表示技术,表现显著超过了两种不同的基线方法,同时还在引入一种新角色和一种全新角色类型的游戏的两个更新版本中保持了准确性。提出的角色表示方法可以提高机器学习模型的生命周期,并在与文献中通常使用的传统技术相比,有助于提高性能。
May, 2023