“我们做个交易吧,教授。
“给我原始数据的访问权限。我帮你们处理数据,帮你们把那些顽固的仪器噪声剥离出来。作为交换,我只需要验证我的猜想。
“如果我是错的,数据归你们,算法也归你们,我绝不公开发表任何结果。但如果我是对的。。…………”
林允宁笑了笑:“那我们也许真的能揭示宇宙的奥秘。”
屏幕那头,弗里曼和身边的几个同事低声交谈了几句。
对于被海量数据折磨得痛不欲生的天文学家来说,一个高效的清洗工具,诱惑力太大了。
而林允宁给出的条件,对他们来说几乎不用付出任何代价。
两分钟后,弗里曼重新看向镜头。
“我们需要先测试你的算法。我会给你对于一部分数据的访问权限,如果你的算法能处理好那个著名的‘长城GreatWall星系结构的数据,我们就成交。”
“没问题。”
林允宁站起身,“把端口和密钥发给我。”
第二天。
芝加哥大学,科研计算中心RCC。
这里的冷气开得像是停尸房,数千台服务器风扇的轰鸣声汇聚成一种低沉的白噪音。
林允宁裹着一件厚厚的连帽衫,坐在角落的终端机前,旁边堆着三个空的健怡可乐罐。
屏幕上,数TB的原始光谱数据像瀑布一样流淌。
情况比他想象的还要糟糕。
天文学的数据太“脏”了。
大气扰动、光纤串扰、甚至是探测器上的宇宙射线坏点,混合在一起,形成了一团乱麻。
Aether算法的初次运行并不顺利。
拓扑分析虽然强大,但在面对这种量级的噪声时,贝蒂数BettiNumbers的计算量呈指数级爆炸,而且经常把一些因为红移畸变产生的信号误判为真实的拓扑环。
“单纯的几何切割不行,还得用老办法,加入物理约束。”
林允宁揉了揉发胀的太阳穴,手指悬在回车键上。
【学霸模拟器启动。】
【课题:基于拓扑数据分析TDA的红移空间畸变修正算法优化。】
【注入模拟时长:100小时。】
意识瞬间被拉入那个纯白的空间。
现实世界的喧嚣远去,眼前只剩下一团用来描述宇宙的庞大数据云。
【第10小时:你尝试引入Voronoi泰森多边形来进行空间剖分。失败。计算开销过大,且对边界效应极其敏感。】
【第35小时:你转变思路,不再试图去“修补”数据,而是去“剪裁”数据。你利用持久同调的条形码Barcode,设定了一个阈值,凡是持久性低于某个特征长度的拓扑环,全部视为噪声切除。】
【第68小时:切得太狠了。你发现这种“一刀切”的方法,把几个微弱的矮星系信号也给删掉了。弗里曼绝对不会接受这种结果。】
【第85小时:灵感闪现。你回想起了之前处理量子比特噪声时的经验。噪声是“死结”,信号是“活结”。你需要引入一个动力学参数????视向速度的四极矩QuadrupoleMoment】