大数据可以对科研有以下帮助:
· 大型强子对撞机实验代表约 1.* 亿个传感器每秒提供 *000 万次数据动态数据应用。每秒有近 * 亿次碰撞。经过筛选并避免记录超过 99.9999*% 的这些数据流后,每秒有 100 个目标的冲突。
因此,仅使用小于 0.001% 的传感器数据流,来自所有四个 LHC 实验的数据流在复制之前的年度速率为 2* PB(截至 2012 年)动态数据应用。复制后这将变成近 200 PB。
如果所有传感器数据都记录在 LHC 中,那么数据流将非常难以处理动态数据应用。在复制之前,数据流量每年将超过 1.* 亿 PB,或者将近 *00 EBabytestes。以数字来看,这相当于每天*00 个字节(*×1020)字节,几乎是世界上所有其他来源的 200 倍。
· Square Kilometer Array 是由数千个天线构成的射电望远镜动态数据应用。预计到202*年将投入使用。总的来说,这些天线预计将收集 1* EB 字节,并且每天存储 1 PB 字节,这被认为是有史以来最雄心勃勃的科学计划之一。 · 当斯隆数字巡天(SDSS)在 2000 年开始收集天文数据时,它在头几周收集的数据比以前天文学历史上收集的数据要多。 SDSS 以每晚 200GB 的速度继续运行,累积了超过 1*0TB 的信息。当 SDSS 的继任者,大型综合测量望远镜在 2020 年上线时,其设计人员预计它将每五天获取一次该数据量。
· 解码人类基因组原本需要 10 年 的时间来处理,现在可以在不到一天的时间内完成动态数据应用。在过去的十年中,DNA 测序仪已经将测序成本减少了10,000,这比按照摩尔定律预测的成本降低便宜了 100 倍 。
动态数据应用了解更多硅谷前沿深度讯息请看 硅发布 微信公众号