BriefGPT.xyz
Ask
alpha
关键词
live streaming platforms
搜索结果 - 2
LiveChat: 从视听多模态环境生成视频评论
通过创建大规模的音视频多模式对话数据集,以促进直播评论技术的发展,我们还提出了一种能够生成与视频中的时空事件以及正在进行的多模式对话上下文相吻合的实时评论的新颖多模式生成模型。
PDF
9 months ago
使用多模态 Transformer 进行基于帧的直播流点击率预测
本文提出了一种基于多模态 Transformer 的 ContentCTR 模型,采用帧级别的 CTR 预测来充分利用视觉帧、音频和评论等多模态信息,借助具有一阶差分约束的新型成对损失函数来利用亮点和非亮点间的对比信息,以及基于动态时间规整
→
PDF
a year ago
Prev
Next