02小说网

02小说网>学霸的模拟器系统 > 第234章 恒等映射求订阅求月票(第3页)

第234章 恒等映射求订阅求月票(第3页)

在一个不起眼的角落里,林允宁看到了一个略显落寞的身影。

那是一位有些瘦削的亚裔女性,正独自站在一张海报前。

海报的标题是《ImageNet:ALarge-ScaleHierarchicalImageDatabase》。

李飞飞。

未来的AI教母,此刻正面临着职业生涯最大的至暗时刻。

她的ImageNet项目因为耗资巨大,且尚未产出任何能用的成果,被学术界视为“浪费资源的苦力活”。

在主流观点看来,算法才是关键,数据够用就行。

搞这么大的数据集,现有的算法根本跑不动,毫无意义。

路过的人大多只是瞥一眼海报上那个夸张的数据量??“一千万张图片”,然后就摇摇头走开了。

林允宁整理了一下雪若送的那套高级西装,走了过去。

“李教授,好久不见。”

李飞飞抬起头,看到是林允宁,眼神中闪过一丝惊讶。

两人曾在ICML的闭门会议中有过一面之缘,但并未深交。

她没想到,这位刚刚在主会场享受完掌声的当红炸子鸡,会跑到这个冷清的角落来。

“林先生。”

李飞飞礼貌地笑了笑,笑容里带着一丝疲惫,“刚才的演讲很精彩。虽然我也没完全听懂那个同调群。

“数学只是工具。”

林允宁站在海报前,认真地看着上面的架构图,“我在意的是地基。我了解过你的ImageNet项目,请问现在的进展如何?”

“不太好。”

李飞飞是个很坦诚的人,她苦笑了一声,“我们雇佣了来自167个国家的近5万名亚马逊MechanicalTurk工人来打标签。数据量是上来了,但是。。。。。。误差率居高不下。

“现有的SVM和浅层神经网络,在这么大的数据量面前,就像是小马拉大车,根本跑不动。

“没想到你对这个感兴趣,现在大家都在讨论你的几何流和核方法,没人关心数据。他们觉得只要算法足够精妙,小样本也能学出花来。

“大家都说我在做无用功,说与其花钱搞数据,不如多优化一下算子。”

“那是他们错了。”

林允宁转过头,看着李飞飞的眼睛,语气出人意料地笃定,“数据是新时代的石油。在这个算力即将爆炸的前夜,谁掌握了最大的数据集,谁就掌握了定义下一代智能的权力。

“李教授,你现在的问题不是石油太多,而是提炼石油的引擎??也就是神经网络的架构,还不够强,我说的对么?”

李飞飞愣了一下。

她没想到这个搞理论物理出身的天才,竟然比很多计算机同行更懂数据的价值。

“你说得对。”

这位普林斯顿的助理教授叹了口气,“这也是我最头疼的。数据量上去了,可是模型跟不上。无论是SVM还是浅层神经网络,一旦喂进去海量数据,误差率不仅不降,反而居高不下。我在想是不是哪里出了问题。”

“找个地方聊聊?”

林允宁指了指旁边的咖啡座,“我最近有些新想法,也许你会感兴趣。”

咖啡座里,人声嘈杂。

两人找了个角落坐下。

“现在的网络有个悖论。”

李飞飞拿出一张图表,上面画着两条曲线,“理论上,网络层数越深,表达能力越强。但实际上,当我们把层数从20层增加到50层时,训练误差反而变大了。这不科学,这叫‘退化问题”DegradationProblem。”

“因为信息在传递过程中失真了,我最近有一个新的想法,我称之为“残差神经网络’,正好想听听你的意见。”

林允宁手指轻轻敲击着桌面,淡淡说道。

他没带电脑,于是随手从桌上的纸巾盒里抽出一张餐巾纸,掏出随身带的圆珠笔,在纸上画了一个示意图:

“李教授,想象一下传话游戏。如果你想把一句话传给第100个人,中间每过一个人,信息就会因为‘非线性”的理解而扭曲一点。到了最后,话全变了。”

已完结热门小说推荐

最新标签