Temporal Relational Reasoning in Videos
#Temporal Relational Reasoning in Videos
论文中需要引用这边论文的一个结论,记录之。原来我之前就记录过,但是没有写笔记,导致我昨晚(20201228)突然想找这个结论的时候记不得是哪篇论文了,所幸找到了,不然几百篇参考文献我真是要翻到吐,万一里面还没有,那才是绝望。
其实这篇文章的TRN
好像也是我所研究的TSN
发展历程上的一个点,但没有细看过,说来惭愧。不过这个的效果大多已经被后面的TSM
和TEA
之类的取代了。
#时序信息的重要性
论文为了验证时序信息的重要性,对比了顺序帧和乱序帧在同一网络下的识别准确率,分别在UCF101
和something-something
上进行测试,证明了两点:
- 时序信息对于行为识别准确率十分重要。
something-something
这类数据集,时序性很强,不是通过场景就能判断识别结果的。
进一步,作者对比了随机和顺序中识别准确率差别最大的几类,发现具有单一方向的较大位移运动
受影响最大,比如Moving something down
。
不过也有可能存在一些变高的识别结果,这个原因我没太看懂= =