每一次刷新,如果有队伍能降低0。1%,都会引来一阵小小的欢呼。
这就是2008年计算机视觉的天花板。
在SVM和手工特征提取的框架下,想再进一步,比登天还难。
“看来这就是极限了。”
刚才提问的那位MIT老教授摇了摇头,有些遗憾,“25%左右的错误率,离实用还差得远。也许,机器的视觉极限就在这里了。。。。。。”
站在老教授身边的李飞飞,神色也有些黯淡。
确实,这个级别的错误率,意味着无法使用。
也就意味着ImageNet注定只是个算法的试金石,而不是真正实用的数据库。
“以太动力提交了。”
不知道是谁喊了一嗓子。
所有人的目光都集中到了屏幕的最后一行。
几秒钟的延迟后。
大屏幕突然闪烁了一下。
排行榜发生了一次剧烈的变动。
原本拥挤在26%区间的条目并没有动。
但在它们上方,遥远的上方,突然跳出了一个新的条目。
Rank1:AetherDynamicsResNet-101
Top-5Error:11。73%
静。
死一样的寂静。
刚才还喧闹无比的会场,此刻连一根针掉在地上的声音都能听见。
26%和11。73%。
这不仅仅是差距,这是两个物种的区别。
这就好比百米赛跑,大家都跑10秒,突然来了一辆呼啸的顶级超跑,两三秒就到了终点。
大家的第一反应不是震惊,而是一一出Bug了。
"11。73%??"
MIT老教授猛地站起来,椅子被带倒了都浑然不觉,“他们是不是用了训练集做测试?这是严重的数据泄露!”
质疑声像潮水一样涌起。
没人敢相信,在这个大家都还在骑自行车的年代,突然有人开着法拉利冲过了终点线。
台侧,李飞飞颤抖着手拿起了麦克风。
“各位。。。。。。请安静。”
她的声音有些发飘,带着一种见证历史的眩晕感,“作为主办方,我们可以确认:测试集是完全保密的BlindTest。以太动力的模型从未见过这些图片。
“成绩。。。。。。真实有效。”
这句话像是一道惊雷,彻底劈碎了旧世界的最后一丝侥幸。
坐在前排的杰弗里?辛顿GeoffreyHinton,这位在这个领域坐了几十年冷板凳的深度学习教父,此刻缓缓摘下了眼镜。
他看着屏幕上那个断崖式领先的数字,眼眶有些发红。
“深度学习。。。。。。”
辛顿喃喃自语,声音哽咽,“黎明,真的来了。”
他第一个站起身,用力地鼓掌。