YEXP

YEXP

“百度迁徙”大数据会侵犯隐私?

来源:互联网

从探究今年春运为何成都到北京的客流最多,到近日东莞扫黄行动中被网民用于绘制“东莞8小时迁徙图”,百度迁徙迅速成为公众试图窥知未知世界的“技术神器”,满足着网民希望从更多元的视角观察社会的期待。

海量数据绘制百度迁徙图

1月26日,百度上线基于定位服务的人口迁徙大数据项目“百度迁徙”,在春运期间,用户可通过该项目实时查看全国范围8小时时段内的人口迁徙轨迹及特征。

网友发现,目前上线的“百度迁徙”主要能实现两大技术功能:第一个是全国迁徙的区域带,整个春运期间,全国迁徙轨迹非常清晰地集中在由京津冀、长三角、珠三角以及四川省四个地区之间形成的一个庞大的菱形区域内。

第二是热门线路分析,网民可输入迁入迁出的省区、城市和时间,获得点对点热门路线的前十排名,其中城市能精确到地级市。如输入东莞,时间2月12日上午10点,百度迁徙就能显示该时点的迁出热市第一位是衡阳和宁波,每千人中有93人,最热的迁入城市是赣州,每千人中有281人。

如此庞大的人流轨迹在短时间内被挖掘出来,而且方便查询,百度是怎么做到的?答案就是大数据。据百度相关人士介绍,百度迁徙是在“春运人口迁徙密集、中国手机渗透率高”的背景下,通过抓取分析手机网民定位信息的大数据,绘制出人群的迁徙轨迹。

据透露,支撑百度迁徙的LBS(位置信息服务)开放平台聚集了超过40万开发者,为数十万款APP提供定位服务,覆盖数亿部手机,每天产生35亿次的定位请求,每秒就有4万次的定位请求发过来。

因为功能强大和方便使用,百度迁徙上线立刻引起网民好奇和围观。北京邮电大学教授邓中亮说,大数据解读可以分析到人口流动趋势、交通拥堵情况等等细节,为城市管理提供支撑平台。它的另一个价值是商圈分析,比如北京中关村的商圈,还可以做驾车导航轨迹的挖掘。

引发用户对相关数据是否涉及隐私的担忧

百度迁徙火爆,也引发了一些用户对相关数据是否涉及隐私的担忧。LBS领域专家认为,这种担忧源于当前大众对大数据技术的不了解,大数据与用户隐私数据完全是两个概念。

百度方面表示,百度迁徙产品涉及的定位数据源于采用百度地图LBS定位服务的数十万个APP应用。这些APP应用由数万开发者提供。相关数据不会与人的真实身份相对应。也就是说,这些都是批量化、去身份化的数据,关注的是群体性趋势,而不是个体行为,因此不会涉及公众隐私。

同时,百度还承诺用技术和流程保护用户数据的安全性。

邓中亮说,当前对地图应用隐私泄露的担忧,恰如早前对互联网、电话、手机时代泄露隐私的担忧,实际上,解决这些问题的根本还在于法律、规章的完善及企业的自律,因此相关制度建设也应跟上。

百度迁徙