新型SEO思维就是从一个全新的层次上提升seo优化的水平,达到网络信息最佳化的展示效果!
马海祥博客 > 互联网 > 互联网技术 > 百度迁徙图的大数据是如何做出来的?

百度迁徙图的大数据是如何做出来的?

时间:2015-02-19   文章来源:马海祥博客   访问次数:

对于像我这样一年才回一次老家的同龄人来说,在2015年的新年到来之际,免不了要参加一些同学聚会之类的,大家一见面就对自己过去一年的经历侃侃而谈,聊着聊着就聊到了百度迁徙图,一些同学知道我是研究互联网的,就问我百度迁徙图到底是怎么做出来的?百度迁徙图的数据真的准吗?

百度迁徙图的大数据是如何做出来的?-马海祥博客

这一问也使我发现原来我也有我好多不明白的地方,这也激发了我这个技术宅的兴趣,我到处找资料研究终于知道了百度迁徙图的基本原理,后来想想肯定也有很多博友不知道这背后的原理及百度迁徙图的大数据是如何做出来的?所以我就在马海祥博客上跟大家分享出来做个科普吧!

1、为什么会有地理定位技术?

一谈到为什么会有定位技术,可能很多人的第一反应是认为这个发明就是为了让自己看地图找餐馆或某个场所更加的方便,但事实却相距甚远。

现在我们从源头来讲,为什么我们会有地理定位技术?

其实最早的定位系统是来自美国国防部50年代的军备竞赛,当时苏联在1957年发射了Sputnik-1人造卫星,而美国不甘示弱,1958年,为了实现军事上的高精确打击,美国海军开始研制子午仪卫星定位系统。

1973年美国建立国防导航卫星系统DNSS,此后DNSS改名为Navstar即授时和测距导航卫星或者说是全球定位系统(Navigation Signal Timing and Ranging/Global Positioning System),后来简称GPS,1994年,终于完成覆盖全球98%的卫星系统。

从军备竞赛到全面民用这和互联网的发展有相似之处,互联网的前生就是为了防止遭到苏联的核打击后被摧毁重要中心节点导致全面瘫痪,进而建立起的去中心化网络,这个意外的军事发明也在随后被民间大量普及。

所以,一切都是意外啊,这个发明真的不是用来给你找餐馆的。

2、百度如何做定位的?

百度、苹果和谷歌是不是只用GPS定位呢?错了,因为民用GPS的定位误差大,没有军用GPS定位准确,而科技公司不可能发射高精度卫星,只能退而求其次,除了用GPS定位以外,还会用其他办法为用户做到更精确的定位,下面马海祥就开始介绍百度定位时用到的方法。

百度迁徙图的大数据是如何做出来的-马海祥博客

百度地图定位用到的主流方法:

(1)、GPS定位,主要用于室外导航。

(2)、IP定位,这在PC时代一直都在用,比如以前用QQ外挂的时候可以看到对方在那座城市和网吧,就是用的IP定位技术,但是IP定位有个弱点就是范围不是太精确,只能定位到街道级别。

(3)、基站定位,用户用2G、3G和4G网络都是要经过运营商基站的,那么通过获得用户所使用的基站位置,判断用户位置,定位半径精确范围是265米左右。

(4)、WIFI定位,WIFI定位是最为精准的,因为WIFI的强度半径相比于其他来说都最小,当然这里的WIFI指的是大商场或者咖啡厅的wifi,通过这些公用WIFI就能相当精准的收集到信息,定位半径精确范围是35米左右。

(5)、混合定位,就是将上述定位方法全部混合,定位半径精确范围是60米左右。

基于以上定位方法,使用大数据相关技术才能实现比较精确的定位。

例如,一个用户既连着WIFI又连着基站的4G,那么百度就可以根据该WIFI在和基站在数据库中的空间坐标以及他们的辐射半径来计算出更精确的位置范围,百度还会根据用户连接基站时移动中的信号强弱变化确定用户位置,计算起来相当复杂。

上面谈的都是如何更精确定位的技术,现在谈下如何为用户提供决策方案的技术。

百度通过收集大量用户在某些地段移动的设备、速度进而来判断某个路段的交通拥堵情况,这就是百度地图的“实时路况”功能,而百度导航又会根据“实时路况”为用户提供出行最优解决方案,当然,目前除了为个人出行提供决策方案以外,已经在为交通部的道路规划提供决策支持。

3、百度迁徙的数据从哪里来?

好了,现在再谈最后一个问题了,有了这样的技术后,百度迁徙的数据是从哪里来的?

数据来源一:地图用户

凡是使用百度地图的用户,百度就可以收集到对应数据,根据CNNIC发布的《2013-2014年中国移动互联网调查研究报告》,2014年8月百度地图占领地图市场的63.7%的用户,这也就是说百度能够收集到绝对多数的移动互联网用户的出行数据。

数据来源二:第三方应用

很多手机应用都是需要地理定位的,比如天气应用,再比如同城类应用,而普通开发者一般是没有强大定位技术的,只能借助于第三方开放定位技术平台,在国内做的最好的两家也就是百度地图开放平台和高德地图开放平台,而选择百度地图开放平台的应用,只要用户使用该应用,百度就能获得更多的数据。

目前墨迹天气和百信网用的就是百度地图的开放技术,还有更多安装了百度地图的应用百度就能收集数据。

这两个数据源就是百度最主要的数据统计来源,目前百度已与交通部有深入合作,预计后期会有可能来自交通部更加精确的数据。

最后,百度用这些定位数据的变化在春节期间做出了很屌的“百度迁徙图”。

马海祥博客点评:

百度迁徙图非常有意思,我们看到的是一个最后呈现的完整数据图,但是在这背后确有十分复杂的高精尖技术做支撑,远比我们想象中的复杂,同时我们也看到地理定位技术最先发源于军事,最后又由于移动时代的商业发展诉求得到了更为深入的发展,所以顺着这次百度迁徙我们也再次看到了驱动技术发展的本质—恐惧与欲望。

本文为马海祥博客原创文章,如想转载,请注明原文网址摘自于http://www.mahaixiang.cn/internet/1081.html,注明出处;否则,禁止转载;谢谢配合!

相关热词搜索: 大数据 百度迁徙图 百度迁徙

上一篇:如何收集和存储服务器运营的数据
下一篇:HTTP与HTTPS的区别

今日话题更多>

SEO研究院 更多 >>