随机数是怎么产生的生

统计数据是如何产生的_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
统计数据是如何产生的
&&统计数据是如何产生的
阅读已结束,下载文档到电脑
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩1页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢大数据是怎么产生的 它的商业机会在哪?
稿源:梁斌的博客
近些年,大数据已经和云计算一样,成为时代的话题。大数据是怎么产生的,商业机会在哪?研究机会在哪?这个概念孕育着一个怎样的未来?
昨天在车库咖啡参加了一个小型的研讨活动,就这些问题进行了一些讨论,我结合自己的一些理解做一个总结。
首先,大数据是怎么产生的?
1)物理世界的信息大量数字化产生的
例如刘江老师指出的好大夫网,将医生的信息,门诊的信息等数字化。其实还有很多,比如新浪微博将茶馆聊天的行为(弱关系产生信息数字化),朋友聊天的行为数字化(强关系产生信息数字化)。视频监控探头将图像数字化。
2)社交网络产生的
在雅虎时代,大量的都是读操作,只有雅虎的编辑做一些写操作的工作。进入web2.0时代,用户数大量增加,用户主动提交了自己的行为。进入了社交时代,移动时代。大量移动终端设备的出现,用户不仅主动提交自己的行为,还和自己的社交圈进行了实时的互动,因此数据大量的产生出来,并且具有了极其强烈的传播性。
3)数据都要保存所产生的
一位嘉宾指出,旧金山大桥保留了百年的历史数据,在时间跨度上产生了价值,很多网站在早期对数据的重视程度不够,保存数据的代价很大,存储设备的价格昂贵,但是时代变了,存储设备便宜了,用户自己产生的数据得到了重视,数据的价值被重视了。因此越来越多的数据被持续保存
其次,大数据和大规模数据的区别?
big data之前学术界叫very large
data,大数据和大规模数据的差距是什么?我认为在英文中large的含义只是体积上的,而big的含义还包含重量上的,价值量上的。因此我认为
1)大数据首先不是数量上的堆砌,而是具有很强的关联性结构性
比如有一种数据,记录了世界上每一颗大树每年长高的程度,这样的数据不具有价值,因为只是简单堆砌。
如果数据变成,每一个大树记录它的,地点,气候条件,树种,树龄,周边动植物生态,每年长高的高度,那么这个数据就具有了结构性。具有结构性的数据首先具有极强的研究价值,其次极强的商业价值。
在比如,淘宝的数据,如果只记录一个交易的买家,卖家,成交物品,价格等信息,那么这个商业价值就很有限。淘宝包含了,买家间的社交关系,购物前后的其他行为,那么这个数据将非常有价值。
因此,只有立体的,结构性强的数据,才能叫大数据,才有价值,否则只能叫大规模数据。
2)大数据的规模一定要大,而且比大规模数据的规模还要大
要做一些预测模型需要很多数据,训练语料,如果数据不够大,很多挖掘工作很难做,比如点击率预测。最直白的例子,如果你能知道一个用户的长期行踪数据,上网的行为,读操作和写操作。那么几乎可以对这个人进行非常精准的预测,各种推荐的工作都能做到很精准。
最后,大数据的机会在哪里?对小公司的机会在哪?
围绕数据的整个产业链上,我认为具有以下机会
1)数据的获得
大量数据的获得,这个机会基本属于新浪微博等这类大企业,大量交易数据的获得,也基本属于京东,淘宝这类企业。小企业基本没机会独立得到这些用户数据。
2)数据的汇集
例如如果你要能把各大厂商,各大微博,政府各个部门的数据汇集全,这个机会将是极大的。
但,这个工作,做大了需要政府行为,做中档了,要企业间合作,做小了,也许就是一个联盟或者一个民间组织,比如中国爬盟。
3)数据的存储
汇集了数据后,立即遇到的问题就是存储,这个代价极大,原始数据不能删除,需要保留。因此提供存储设备的公司,执行存储这个角色的公司,都具有巨大的市场机会,但是这也不属于小公司,或者早期创业者。
4)数据的运算
在存储了数据以后,怎么把数据分发是个大问题,各种API,各种开放平台,都是将这些数据发射出去,提供后续的挖掘和分析工作,这个也需要有大资本投入,也不适合小公司。
5)数据的挖掘和分析
数据需要做增值服务,否则数据就没有价值,big也big不到哪里去,是没有价值的big。因此这种数据分析和挖掘工作具有巨大的价值,这个机会属于小公司,小团体。
6)数据的使用和消费
在数据做到了很好的挖掘和分析后,需要把这些结果应用在一个具体的场合上,来获得回报,做数据挖掘和分析的公司,必须得找到这些金主才行,而这些金主肯定也不是小公司。
大数据未来的形态,或者产业链结构一定是分层的,巨大的,价值的体现发生在各个层次,每个层次都是生态链的重要一环,都孕育着巨大的机遇和挑战,我们能做的唯有努力,做适合自己的工作。
文章来源:
有好的文章希望站长之家帮助分享推广,猛戳这里
本网页浏览已超过3分钟,点击关闭或灰色背景,即可回到网页2017年1月 总版技术专家分月排行榜第三
2017年2月 PHP大版内专家分月排行榜第一2017年1月 PHP大版内专家分月排行榜第一
2013年5月 总版技术专家分月排行榜第一
2016年7月 总版技术专家分月排行榜第二2016年3月 总版技术专家分月排行榜第二2015年12月 总版技术专家分月排行榜第二2014年8月 总版技术专家分月排行榜第二2014年7月 总版技术专家分月排行榜第二2013年6月 总版技术专家分月排行榜第二
2017年1月 总版技术专家分月排行榜第三
2017年2月 PHP大版内专家分月排行榜第一2017年1月 PHP大版内专家分月排行榜第一
2012年2月 PHP大版内专家分月排行榜第一2012年1月 PHP大版内专家分月排行榜第一2011年11月 PHP大版内专家分月排行榜第一2011年9月 PHP大版内专家分月排行榜第一
2012年3月 PHP大版内专家分月排行榜第二2011年12月 PHP大版内专家分月排行榜第二2011年10月 PHP大版内专家分月排行榜第二
2014年11月 PHP大版内专家分月排行榜第三2014年6月 PHP大版内专家分月排行榜第三2014年4月 PHP大版内专家分月排行榜第三2014年2月 PHP大版内专家分月排行榜第三2013年11月 PHP大版内专家分月排行榜第三
本帖子已过去太久远了,不再提供回复功能。缁濆?鍐呭箷锛岀エ鏁版槸鎬庝箞浜х敓鐨勩

我要回帖

更多关于 数是怎么产生的 的文章

 

随机推荐