林允宁伸出手,“林允宁。我也在做神经网络,不过不是卷积,是注意力机制。”
“注意力?”
杨立昆皱了皱眉,“那个ON^2复杂度的东西?想法不错,但那是死路。序列一长就崩了。”
林允宁笑了。
这已经是他在这个会场里第二次听到这句话了。
“教授,如果我把那堵墙拆了呢?”
林允宁从口袋里掏出那张他在飞机上写过的餐巾纸,递了过去,“如果复杂度变成了ON,您觉得它还是死路吗?”
杨立昆接过那张皱巴巴的纸。
起初,他的表情是漫不经心的。
但当他的目光扫过那个利用核技巧拆解Softmax的公式时,他拿着饼干的手停在了半空中。
一秒,两秒,三秒。
法国人的瞳孔剧烈收缩。
“Merde。。。见鬼
他低声爆了一句法语粗口,“这是。。。。。。这是作弊!你把非线性项提前了?等等,这在数学上是成立的。。。。。。只要那个映射函数中存在……………”
“明天上午十点,C厅。
林允宁抽回那张餐巾纸,像是收回了一张藏宝图,“我会展示那个∮函数到底是什么。”
杨立昆看着眼前这个年轻人,像是第一次认识他一样。
“我会去的。”
他扔掉手里的饼干,拍了拍手上的碎屑,眼神变得严肃起来,“如果你明天真的能跑通这个Demo,哪怕是Google那帮鼻孔朝天的傲慢家伙们,恐怕也要把下巴掉在地上了。”
晚上九点,酒店房间。
方雪若正在盘点今天的战果:“三家VC留了名片,表示很有兴趣。还有两家药企想了解我们的筛选平台。虽然还没签单,但势头不错。
程新竹瘫在沙发上,嗓子都哑了:“我今天讲了不下五十遍血脑屏障,感觉嘴都要起泡了。”
林允宁站在窗前,看着楼下灯火通明的大学城。
他的电脑屏幕上,那个刚刚编写完成的线性注意力代码LinearAttentionCode正在进行最后的编译。
进度条走到100%。
【编译成功。】
【内存占用预测:128MB原算法需128GB。】
【加速比:1500x。】
“早点休息吧。”
林允宁合上电脑,站起身来,转头对两位合伙人说道,“明天上午的场子,可能会比较。。。。。。热闹。”
他想起白天魏斯那副傲慢的嘴脸,又想起杨立昆震惊的表情。
旧时代的余晖依然耀眼,支持向量机和核方法的信徒们还在欢庆他们的数学大厦坚不可摧。
但他们不知道,地基已经被抽走了。
明天,他要在那个舞台上,亲手按下一枚核按钮。
。。。。。。