“我们为什么不直接观察这把锁的‘形状,然后只挑那些看起来能插进去的钥匙去试呢?
“药物筛选,本质上不是一个能量问题,这是一个‘几何匹配问题!”
他越说思路越清晰:
“我们不需要去精确计算每一个分子和蛋白质靶点的结合能。我们可以换个思路,用机器学习,去学习”它们之间的几何匹配模式。”
“机器学习?”
程新竹和马克都皱起了眉。
这个想法,听起来好像天方夜谭,不像是科研,更像是某种“炼金术”。
“对。”
林允宁的语速开始加快,“我们可以搜集几千个已知的,已经成功的药物和靶点复合物的晶体结构数据,把它们喂给一个神经网络。
“让机器自己去学,什么样的分子形状”,对应什么样的蛋白质“口袋”。
“训练完成后,我们就能得到一个模型。你把任何一个新的小分子结构输进去,它就能在几秒钟内告诉你,这个分子能和我们的靶点匹配上的概率有多大,也就是它的成药性。”
他看着目瞪口呆的程新竹,说出了自己的计划:
“我要给Aether开发一个新模块,就叫Aether_StruMatch。”
就在这时,一个沉稳的声音从他们身后传来。
“想法很超前,林。但你想过没有,你要的训练数据从哪来?谁来帮你标注?这等于是在一片荒地上,凭空开辟一个新领域。”
格林伯格教授不知何时走了过来,手里端着一杯咖啡。
他显然听到了刚才的对话。
“而且,就算你做出来了,这个模型的可靠性怎么验证?制药公司可不会相信一个‘黑箱’给出的结果。”
格林伯格的评价很客观,他既看到了这个想法的潜力,也指出了其中致命的困难。
最关键的问题是,在2006年,机器学习的方法还没有普及到制药行业,更像是一个噱头而非真正解决问题的方法论。
格林伯格教授看着林允宁,眼神很诚恳:
“这已经不是一个算法问题了。你想做的,是凭空开辟一个全新的交叉学科。这至少是一个博士课题,甚至是一个学者毕生的事业。你。。。。。。有那么多时间吗?”
这番话像一盆冷水,浇熄了程新竹刚刚燃起的希望。
她知道,格林伯格教授说的是对的。
林允宁也沉默了。
会议结束,专利律师约翰逊先行离开。
格林伯格教授却没有走,他叫住了正准备离开的林允宁。
“林,关于专利的事,我以一个长辈的身份,给你提个醒。”
他喝了口咖啡,语气很随意,“这项技术的价值很大。如果专利所有权在你个人名下,未来一旦产生收益,光是个人所得税就是一笔天文数字。而且,你一个学生,也很难去和那些大型制药公司进行商业谈判。”
“那您的意思是?”
“我建议你成立一个公司,”
格林伯格说,“一个专门持有和运营这些技术专利的小型技术公司。这样既能合理避税,也方便未来进行融资和商业化运作。