STM SpatioTemporal and Motion Encoding for Action Recognition (ICCV 2019)
动作识别中最重要的特征是时空特征和运动特征,前者编码不同时间步空间特征的关系,后者表示相邻帧的运动特征。双流网络中的flow stream其实并不是时序stream,因为光流只表示相邻帧的运动信息,且stream的结构与空间stream几乎一模一样,因此,缺少获取长时时序关系
...