2020-10-22 周报#09 刘潘

#I. Task achieved last week


  • 《STM: SpatioTemporal and Motion Encoding for Action Recognition》
  • 《MotionSqueeze: Neural Motion Feature Learning for Video Understanding》

#II. Reports


#STM: SpatioTemporal and Motion Encoding for Action Recognition

这个是TEA的灵感来源,感觉变化不是很大,但是效果不错,而且实验做的足够多。

#相关链接

#MotionSqueeze: Neural Motion Feature Learning for Video Understanding

主要的创新点是MS module,它把这个结构插入到了ResNet的网络中间,具体来说在layer2之后,layer3之前。

结构图

逻辑上如下图所示,道理上说得很清楚,首先进行关联性计算,就是为了判断当前的点可能会位移到什么位置,即什么位置的点最有可能是由当前的点位移过去的。

然后通过估计上的点,计算偏移。

最后计算特征转换。(这个其实我没太理解)

结构图

#III. Plan for this week


  • 可能需要和老师沟通一下,确定一下接下来的研究计划。