【行业动态】
健康医疗大数据产业联盟成立
UC浏览器转型大数据新型媒体平台
九次方大数据与韩国The IMC集团共建舆情大数据平台
【会议播报】
2016中国(北京)国际大数据产业博览会
【业界观点】
过度收集数据:成事无补、败事有余
【技术前沿】
大数据采集新的方法
【大数据+】
贵阳市将建基于手机信令交通大数据应用平台
滴滴出行与沈阳共建智慧交通大数据共享平台
行业动态
健康医疗大数据产业联盟成立
《人民日报》8月30日报道,中国卫生信息学会健康医疗大数据产业发展与信息安全专业委员会(中国健康医疗大数据产业联盟)成立大会今日召开。这是首个聚焦大数据产业与信息安全的全国性专业委员会。
国家卫生和计划生育委员会副主任、中国卫生信息学会会长金小桃说,大数据是健康医疗领域的发展趋势,是国家的战略发展方向,能够促进医疗健康服务产业升级,培育新业态和经济增长点,带动民生、产业、科技、经济、社会等多方面大发展,意义特别重大。
中国电子信息产业集团有限公司董事长芮晓武当选大数据安全专委会(产业联盟)主任委员。他认为,要坚持规范有序、安全可控,妥善处理应用发展与保障安全的关系,增强安全技术支撑能力、有效保护个人隐私与信息安全。他表示,专委会将汇聚各方智慧,促进健康医疗大数据产业发展,为实现健康中国战略贡献力量。
UC浏览器转型大数据新型媒体平台
《北京晨报》9月1日报道,8月31日,UC浏览器宣布正式升级为“UC”,并发布独立资讯应用“UC头条”,宣告从工具入口转型为大数据新兴媒体平台。阿里移动事业群UC总裁何小鹏指出,此次升级是坚定向“大数据新型媒体平台”前进,以UC12年浏览入口积累,构建内容生态基础设施,更好地反哺内容创作者。
九次方大数据与韩国The IMC集团共建舆情大数据平台
中国江苏网9月1日报道,九次方大数据与韩国The IMC集团签署战略合作协议,共建舆情大数据平台。跨国数据的联通与融合,能够进一步增加两国贸易往来,实现双方经济贸易互利共赢。
近日,韩国The IMC集团CEO全埰南一行到访九次方大数据北京总部,与九次方大数据创始人王叁寿签署战略合作协议,双方共建舆情大数据平台。未来双方将就制定中韩两国大数据行业解决方案等多方领域进行深度合作与交流,共同拓展中韩大数据未来万亿级市场。
此次九次方大数据与The IMC集团的合作,正是意在合力构建完善的舆情数据监测体系,运用大数据强大的“关联分析”能力,构建跨国网络舆情数据“立方体”,将两国网上网下各方面 数据相整合,进行分析,挖掘网络舆情和社会动态背后的深层次关系,实现企业市场与社会趋势的紧密联动、同步推进。同时,舆情大数据平台的建立,还可以促使 两国在特定行业或企业合作中,舆情监控工作从单一向多元转化,从监控信息到研判、疏导与处理转化;利用大数据分析舆情关注程度、传播情况、发展趋势等,更 可以有效预测舆情走向,辅助企业机构在国际市场运作当中作出正确决策和判断。
会议播报
2016中国(北京)国际大数据产业博览会
金融界8月30日报道,为更好的交流展示国内外大数据技术应用和经验成果,推动我国大数据产业快速健康发展,由中国高科技产业化研究会主办,中国高科技产业化研究会信息化工作委员会协办,由北京百科汇国际展览服务有限公司承办“2016中国(北京)国际大数据产业博览会暨高峰论坛”将于2016年9月12日-9月14日,在北京·中国国际展览中心举办。本届展览会将以“促进大数据时代变革、共赢新时代机遇和挑战”为主题,诚邀各单位、企业负责人及专业观众一起探讨大数据产业的未来和发展,共同展示大数据产业领域的最新成果、新技术,探讨行业动向、进行面对面的商业交流等。且此次会展将吸引世界各国的媒体前来报导。
业界观点
过度收集数据:成事无补、败事有余
微信公号“涂子沛频道”8月30日刊文,数据收集,本是信息时代的基本特征,也是构成信息社会的基础。
从收集数据的过程看,人从一出生开始,就与表格、证明结下不解之缘:入学、求职、结婚、购房、看病、领取驾照、办理银行卡……有时这些表格还一式多份,时时要登记、处处要证明。
商业机构的数据收集更有过之而无不及,部分还是在消费者毫不知情的情况下进行的,这在网络上就广泛存在。匪夷所思的是,有些地方购买一张记名公交卡、会员卡、超市兑换积分也需要提交身份证复印件。这中间风险很大,为防止滥用,有律师建议在身份证复印件上加上签注。
政府部门当然有收集数据的权利,但我认为,“过度收集”在当下是普遍存在的。不同的部门重复收集同一种数据,甚至同一个部门因为不同的业务环节也在重复收集数据。今天办事你要填表,过段时间再去办事,又得填表。至于为什么需要这个数据,没有人告诉你原因。
凡事都有利弊两面。打开窗子,进来的不只是新鲜的空气,也会有苍蝇和蚊子。
这些数据,相当一部分都沉淀在政府部门的电脑中、尘封在文件档案库中,无人问津。但一旦因为管理不善而数据泄露,立即就构成了对公民生活安全的威胁。
一个人一生要在政府机构、商业机构中留下的数据,远比我们想象的要庞大。
1995年,美国联邦政府做过一个统计,他们一年的信息收集任务需要65亿个小时才能完成,这相当于320万人一年的工作量。也就是说,除了填表格,这320万人什么都不用做,也需要一整年的时间才能完成联邦政府下达的信息收集任务。这个数据到了2009年,已经上升到99亿小时。
为了规范政府的信息收集,美国政府曾经颁布《纸面工作精简法》,该法规定,任何一个部门如果要向社会收集数据,必须得到信息管制办公室(OIRA)的批准。
即你要收集数据,必须得到统一审批。如果上述办公室认为你的要求合理,将会授予你一个“信息收集许可号”。
可别小看这个“号”,它是政府收集数据的凭证,它限定了本次数据收集的范围。缺少这个号,收集就不具合法性,任何公民都有权拒绝填报。
公共机构的数据收集,需要公民和社会的配合,这对后者是一个负担。“有权拒绝填报”就是一种权利和保护。
事前许可,事中监督,事后知情。在源头上对数据收集进行限定,个人数据的风险将降至最低。
我建议,对于如何科学合理的收集数据,我们应当尽快出台相应的法规,明确统筹的部门,详尽规定数据收集的目的、类型、流程和使用的权限,抑制过度收集数据。
我相信,用法律来约束数据收集的过程,不仅可以提高数据收集的科学性,还可以减轻公民负担、减少“信息扰民”。
技术前沿
大数据采集新的方法
微信公号“阿拉丁大数据”9月1日刊文,大数据开启了一个大规模生产、分享和应用数据的时代,它给技术和商业带来了巨大的变化。麦肯锡研究表明,在医疗、零售和制造业领域,大数据每年可以提高劳动生产率0.5-1个百分点。大数据在核心领域的渗透速度有目共睹,然而调查显示,未被使用的信息比例高达99.4%,很大程度都是由于高价值的信息无法获取采集。因此在大数据时代背景下,如何从大数据中采集出有用的信息已经是大数据发展的关键因素之一。
① 系统日志采集方法
很多互联网企业都有自己的海量数据采集工具,多用于系统日志采集,如Hadoop的Chukwa,Cloudera的Flume,Facebook的Scribe等,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。
② 网络数据采集方法
网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息。该方法可以将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化的方式存储。它支持图片、音频、视频等文件或附件的采集,附件与正文可以自动关联。 除了网络中包含的内容之外,对于网络流量的采集可以使用DPI或DFI等带宽管理技术进行处理。
③ 其他数据采集方法
对于企业生产经营数据或学科研究数据等保密性要求较高的数据,可以通过与企业或研究机构合作,使用特定系统接口等相关方式采集数据。
大数据+
贵阳市将建基于手机信令交通大数据应用平台
《贵阳日报》8月29日报道,贵阳市基于手机信令的交通大数据应用平台目前正待工信部门批复立项,预计年底开始建设。
据介绍,基于手机信令的交通大数据应用平台,将充分依靠运营商提供的手机信令海量数据,通过运营商强大的云计算能力以及定制化建模,分析贵阳市人口结构情况、人群迁徙状况、主要道路路况、公共场所人流情况、贵阳市人群集散与进出城情况六大模块数据,实现市民出行行为和交通状况的可视化。
平台一期建成后,将可实现六方面内容的展现。贵阳市人群出行情况及结构分析展现,包括区域热力GIS(地理信息系统)图、区域人口变化、各城区人口占比、区域人群结构、区域人口来源;贵阳跨区迁徙状况分析展现,包括贵阳城区通勤图、人流数量、出行速度分析、跨区迁徙情况、通勤线路选择情况、出行方式分析;贵阳市主要道路情况分析展现,包括道路拥堵地图、拥堵路段排行、道路全天拥堵状况、区域实时通勤人数;公共场所交通吸引强度分析展现,包括公共场所交通吸引强度、人流量变化分析、人群来源地分析、驻留分析、人群年龄结构占比分析;贵阳市人群活动变化分析展现,包括迁徙状况、进出城人数情况、各高速公路进出城运量情况及排行。
滴滴出行与沈阳共建智慧交通大数据共享平台
光明网9月1日报道,沈阳市与滴滴出行双方宣布将共同推动“互联网+交通”在沈创新发展,以促进沈阳市智慧城市建设,方便市民美好出行。
根据协议,双方将在多个层面展开合作。在数据共享方面,双方将会同东北大学等高校共建滴滴大数据研究中心,定期发布研究报告,推动大数据的挖掘应用。在便民应用方面,依托滴滴智能交通云计算平台,双方将协作设计高效的智能交通管控方案,提高道路利用率,改善城市交通状况。
此外,为了共同推动沈阳市智慧交通建设,沈阳还将探索“互联网+交通”新模式,在交通部《网络预约出租车服务管理暂行办法》的框架下创新监管。
沈阳与滴滴合作达成后,以双方共建的滴滴大数据研究中心为平台,结合沈阳市海量交通数据,发挥滴滴自身强大的数据分析优势和运营经验,为沈阳提供智慧城市及大数据信息化服务,并参与到沈阳市智慧城市运营中去。