大数据与个人博客

今天,在查看博客访问统计时,意外发现今天4和IP中竟然有3个IP是通过搜索引擎搜索产生的自然访问,其关键词是“山师博客”和c语言的某个具体问题。很明显,之前博客在一个月没有更新文章,但pr还是到达3,百度权重达到1是有原因的——对口的原创文章。

今天这件事给了我两个启发:长尾效应已经出现和大数据无处不在。

长尾效应又可以称为反28法则。我之前有不少文章的命名是以具体问题(长句子)的形式命名。所以,有些刚刚接触c语言的小朋友会直接搜索问题原话,而我的博文就会在第一页出现。还有就是,我第一个博客在朋友同学,以及博友,甚至在求职简历里都进行了粗糙的推广,有感兴趣的小朋友,可能会进行搜索。

随着互联网几十年的信息积累,大数据又成了IT界的热门话题,不管懂不懂都喜欢拿出来秀一秀。不管用什么方法处理,而大数据的核心意义就是价值,一种可以带来潜在利益的价值。目前成功的大数据案例以预测居多,而这种预测又是可信度极高的预测——因为它们是基于海量数据而不是简单的抽样而得出的。而我之所以能联想到“大数据”,是因为统计信息告诉了我以后博文的一种方向——哪些关键词更有效!

大数据不是什么高深的东西,它是互联网发展的必然结果。自从95年商用互联网接入上海和北京,在不到20年的时间里,互联网容纳下了中华民族几乎所有的智慧,还以高速的态势每天派生出大量的新知识。互联网的信息量之大已经无法海量。如果说之前的贫富差距在于信息的不对称性,而未来的贫富差距将在于对开放信息的解读能力上!数据挖掘、数据仓库等只是某种特定的数据分析技术。

我不知道大数据时代以后是什么,但我相信这个世界是个因果性的世界,每个时代都是前一个时代的轮回(而不是简单的重复),它有自己的“契比雪夫定律”,周而复始,却又不断演化!

© 2014 – 2016, 李德涛博客. 版权所有.

《大数据与个人博客》有3个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注