数据存储产业服务平台

“女司机被反转”、“你妈是你妈”事件我的IT应用技术流解读

所谓“IT技术流解读”并不打算谈论“数据保护、隐私以及IT系统价值”等内容,不打算搭车骗点击,分享该热点事件的红利,“IT技术流”就是希望从技术的角度,提供一些有真正价值的观点和信息。
 
女司机反转”的大数据建模
 
对于“女司机被反转”事件,希望能够建立这样的一个大数据的模型,用大数据的技术手段分析一下:在发表观点认为“女司机欠揍”的人群中,有机动车驾照的占多大比例?
 
为什么建立这样的一个大数据模型?原因在于,我们国家汽车文化的历史比较短暂,只有不到30年的历史,缺乏汽车文化的积淀。与很多国家自幼普及“交通法规”的做法不同,中国人了解交通法是从机动车驾照开始的,换句话说,有驾照的人基本就是懂得交通法的人,也就是“知法者”,在“知法”的前提下,有多少人认为“女司机欠揍”。
 
“女司机”违法在先不假,但什么才是对待“违法”最合理的做法呢?以“违法”对抗“违法”,以暴制暴,这种做法的是非曲直,有必要讨论吗?这是基本常识。
 
“女司机”强行并线所带来的生命威胁如何化解,如果你学过交通法就会知道,最有效的做法是“踩刹车”,而不是转动方向盘进行规避,尽管这是下意识的反应。但转动方向盘所导致的事故,驾驶员(司机)要担负主要的责任,所谓根据“路权”的责任认定。踩刹车不及导致追尾,应该是“女司机”违法者的全责。不合理避让导致的事故,避让者全责。
 
也就是说,只有了解了责任认定,你才会知道最合理的做法是什么?答案是踩刹车。了解了这些,应该知道该如何正确应对了吧?你还认为“女司机欠揍”吗?
 
大数据的技术方法
 
有了这样的一个模型,要分析哪些数据呢?怎样获得结果呢?
 
要获得这样的数据很简单,不需要调查问圈抽样,作为社会热点,有大量互联网数据存在,小到一个“顶”、“赞”,大到新闻媒体报道、文章、声音和视频,都是分析的对象。其中牵涉的技术包括自然语义的理解,目前搜素引擎技术,如百度、谛元信、理工大学张华平教授的ICTCLAS,以及Informatica、Teradata等BI软件公司,对于自然语言的理解和界定都有很成熟的技术和方案。至于语音内容理解抽取,也Verint公司技术提供支持,视频方面,目前我还没有见到合适的技术和方案。
 
有了这些技术手段,就能够知道互联网上的广义大数据中有多少点“赞”的数据。在这些数据中,所对应的不过是IP、微博、手机号码,或者是昵称、过路者,怎么知道其中哪些是有机动车的驾照的呢?这就是大数据的威力,这对于像Cloudera、Splunk、Actian、Verint、Greenplum等这样的专业大数据公司来说,技术上没有什么太多的障碍,对于IBM、HP、DELL、EMC、HDS、NetAPP、华为、浪潮、曙光、Orcale等提供大数据一体机以及解决方案厂商,技术上也没有更多的障碍。
 
因此,技术并不是我们挖掘数据价值的障碍。

让我们期待有人能将上面的模型付诸实践,看看究竟是一个什么样的结果。果有这样一家企业,DOIT、Dostor可以承诺,今年12月的“数据峰会”(原“存储峰会”),提供免费专场分析经验。

 
 
“你妈是你妈”的政府行业需求
 
为什么老百姓办事会这么难?这就是“你妈是你妈”事件带给我们的课题。
 
事件的产生,首先不是个别人的态度和工作作风的问题,从一定程度来说,具体的办事人员也没有更多的过错。如果规章制度有这个要求,那么,工作人员不过是例行公事而已,不仅不应该被责备,应该得到尊重和赞许。
 
问题出在制度本身,因此改革也应该从制度入手。5月7日,华为企业业务透过官方微信提出了“淡定地证明‘你妈是你妈’”的设想,透过“3个1”的构建来解决问题,既构建一个“中心交换”系统,一个统一的政务云,以及一个更好的信息传输基础设施。这个建议非常好,但没有涉及到制度的问题。
 
这个事件并没有技术上的障碍。如今是大数据的时代,不仅数据共享不是难题,实际上,数据背后的信息和价值,也是一个可以被获知、被感知的。在这样的一个时代,说什么不掌握、不知道,为不掌握信息抱屈,这说得过去的吗?每年仅电子政务信息化就有近600亿元的投入,这些投入都做什么用了?作为掌握数据的政府部门尚不能证明什么,那么老百姓可以证明什么呢?
 
有些解决问题的办法其实很简单,其实,可以改进一下流程。政府部门盖不盖章,依据不应该是老百姓提供可以盖章的各种凭证,应该相反,需要政府提供不予盖章的依据。具体到“你妈是你妈”,老百姓没有义务来证明:这个联系人的确是我妈,而是要政府部门提供证据,来证明这个联系人不是我妈,由政府部门出具依据。如果政府部门不能够出具强力的证据,必须无条件放行。
 
一个小小的改变,实际上,就解决了一个行业需求的问题。否则行业信息化动力从哪里来?。政府部门要提高管理水平,请先提高自己的信息化能力。
 
也许,大家会有很多的担心。数据高度的集中和透明化,会不会导致数据滥用,侵犯公众的隐私。实际上,的确存在这样的可能性。但罪不在系统,防止数据滥用,侵害公民隐私,这是法律的问题,不应该削足适履,让信息化技术承担责任,对吗?
 
解决问题从制度开始,我们不需要各种理由的搪塞,也不要拿信息化水平说事,难道信息化水平不高,还有理嘛!这是什么样的逻辑!
 
未经允许不得转载:存储在线-存储专业媒体 » “女司机被反转”、“你妈是你妈”事件我的IT应用技术流解读