BriefGPT.xyz
大模型
Ask
alpha
关键词
trilinear interpolation
搜索结果 - 2
ViNet: 将视觉模态推至极限,用于音频视觉显著性预测
提出了 ViNet 架构用于音频 - 视觉显著性预测,其采用全卷积编码器 - 解码器架构,利用动作识别网络的视觉特征来编码,通过三线性插值和 3D 卷积生成显著性图,没有使用音频作为输入,但是在 9 个不同的数据集上,仍然优于现有的音频 -
→
PDF
4 years ago
SEGCloud:3D 点云的语义分割
本研究介绍了 SEGCloud,一种利用三线性插值和完全连接条件随机场等方式得到端到端三维点级分割的框架,可实现对室内和室外三维数据集进行准确的场景标注。
PDF
7 years ago
Prev
Next