林允宁笑了笑。
他回过身,擦掉了那个莫比乌斯环。
在这一刻,他的脑海中闪过的不是枯燥的代码,也不是复杂的线性代数。
而是那天午后,在内维尔市的“圣马丁”养老院里,那位患有阿?海默症的老教授。
记忆已经破碎,逻辑已经崩塌。
但当爵士乐的鼓点响起,那根枯瘦的手指依然能精准地敲击在每一个切分音上。
那是超越了语义的、大脑最底层的拓扑结构。
记忆可以破碎,但连接的模式永存。
林允宁在白板上写下了一个简洁到令人发指的公式:
x_t+1=x_t+Attentionx_t
“这就是行走的方式。”
林允宁指着公式中的加号,“这叫残差连接ResidualConnection。我们保留原始的信息xt??那是数据的本体。”
然后,他指着后面那一项:
“再加上注意力机制。这不是在做分类,而是在做‘自适应曲率变换’。网络在海量的信息流形中,通过注意力去感知哪里是平坦的,哪里是卷曲的,然后动态地调整自己的形状去贴合数据。”
房间里死一般的寂静。
刚才还在敲击键盘记录的杰夫?迪恩JeffDean,手指悬停在了半空中。
蒙特利尔大学的本吉奥YoshuaBengio微张着嘴,眼镜滑到了鼻尖。
他们都是绝顶聪明的人。
林允宁不需要解释太多,他们一眼就看穿了这个公式背后的恐怖野心。
林允宁转过身,面对着这群即将掌握着全球人工智能命脉的大佬们,说出了那个后来被学术界称为“科瓦利斯预言”的论断:
“未来的模型,不再是针对特定任务训练的‘专家’。我们不需要专门训练一个翻译模型,也不需要专门训练一个分类模型。
“它将是通用的。
“它会通过’自监督学习Self-supervisedLearning,像人类婴儿一样,通过阅读海量的文本、看海量的图片,通过“完形填空”来学习世界的表征。
“而实现这一点的核心,就是注意力机制。它不是一种技巧,它是智能的本质??它是在海量信息流形中,寻找并锁定那些关键拓扑结构的能力。”
杰夫?迪恩合上了那台厚重的笔记本电脑。
“咔哒”一声,在寂静的房间里显得格外刺耳。
这位Google的工程之神站起身,整理了一下格子衬衫的下摆,走到了林允宁面前。
“林先生,GoogleBrain谷歌大脑正在组建一个新的团队。”
迪恩没有说废话,直接抛出了底牌,“我们需要你,还有你的整个团队。
“你可以保留以太动力的独立性,作为Google内部的独立实验室。我们可以提供你无法想象的算力??Google全球的数据中心,只要你一声令下,所有的TPU和GPU都为你运转。
“至于签字费。。。。。。”
迪恩伸出了五根手指,“两千万美金。这只是给个人的。”
房间里的空气仿佛凝固了。
两千万美金。
对于一个大二学生,对于一家刚才还在为房租发愁的创业公司来说,这是一步登天的阶梯。
财富自由,学术资源,工程神话。
所有的目光都聚焦在林允宁身上。