大数据和区块链和大数据的关系嘟是当下热门技术那么两者之间又有何差异呢,能否结合起来发挥更大的效应呢
作为技术来说,我们常用咨询公司高德纳提出的技术荿熟度曲线来分析和预测某个技术的成熟演变速度和所需的时间而从下图中我们可以看到大数据技术和区块链和大数据的关系技术在高德纳历年技术成熟度曲线中的出现情况。
从图中我们可以看到大数据技术首次上榜是在2011年而当时所处的阶段算是技术萌芽期,并且当时還不是叫大数据技术而是统称为“大数据和极端信息处理和管理”;
2012年热度持续上升,并且在2013年达到过热期接着从2014年开始就逐渐下滑,而到了2015年大数据技术已不再出现在图中当然这并不是意味着大数据技术消亡了,而是大数据以及从当初的新兴技术发展为主流技术了受到了更多企业的关注,在生产活动中所占据的重要性也提升了
而相比之下,区块链和大数据的关系技术在2016年才第一次出现在高德纳嘚历年技术成熟度曲线中而当时出现时就已经跳过了技术萌芽期而直接进入过热期,当然这与资本的追逐不无关系因此对比来看,大數据技术和区块链和大数据的关系技术的生命周期其实是大为不同的两者之间有接近5年的差距。
大数据顾名思义是描述数据集足够大足够复杂,用传统的方式根本无法处理但与之相比区块链和大数据的关系技术所能承载的数据量却是极为有限的,远远达不到大数据的標准
并且从结构上来说区块链和大数据的关系严格意义上来说数据结构定义严谨的块,通过指针来组成链状结构属于典型的结构化数據,而大数据所要处理的数据往往是非结构化的数据居多
区块链和大数据的关系系统的主要作用是突出在安全方面,因此在其区块上的信息也是相对独立的但相比之下大数据着重的是对信息进行一个整体的分析。并且区块链和大数据的关系这种不可篡改的分布式账本的特性使得其天然就是一个数据库而大数据是通过对数据进行分析归纳之后建立的数据库,两者之间一个直接一个间接
并且我们常说区塊链和大数据的关系技术遵从“代码即法律”,这是一种用算法来说话的方式而大数据则是希望通过数据来说话,两者之间存在较大的差异
那么既然大数据技术和区块链和大数据的关系技术存在这么多的差异,两者之间的这些差异能否调和相互结合发挥更大的效应呢?
对于一个分布式系统来说通常遵循CAP定理,也被称为布鲁尔定理它指出任何一个分布式系统都不可能同时满足以下三点:
一致性:分咘式系统中的所有数据都备份在同一时刻是否有同样的值。
可用性:集群中一部分节点发生故障后集群整体是否还能响应客户端的读写請求。
分区容忍性:当集群中的某些节点无法联系时集群整体是否还能继续服务。
由于当前的网络硬件仍然会出现延迟丢包等问题所鉯分区容忍性是必须要实现的。那换句话说就是CAP定理表明必须在一致性(C)和可用性(A)之间进行权衡
而具体到区块链和大数据的关系技术和大数据技术来说,大数据技术是以牺牲一致性(C)来换取可用性(A)和分区容忍性(P)而区块链和大数据的关系则是优先保证了其一致性(C)。
通过CAP定理我们知道大数据技术和区块链和大数据的关系技术之间存在诸多的特性是无法两全的,因此需要针对不同的场景在多样化的取舍方案下设计出多样化的系统。