警务大数据应用的问题与对策研究
摘要杨万方
在国家大数据战略的引导下,大数据在警务工作中得到广泛的推广和应用。大数据拓宽了警务工作思维、提高了工作效率,为机关的决策提供了可靠的依据。但是,警务大数据的应用在思想观念、数据融通、存储传输、技术算法、数据安全等方面还存在一些问题,影响大数据作用的充分发挥。为提高警务大数据的应用水平,使大数据充分发挥效能,可以从应用主体、数据管理、技术研发三个角度入手,打破应用困境。
关键词:警务大数据;主体能力;数据管理;技术研发
2017年12月8日,总在主持政治局就实施国家大数据战略的集体学习会议时强调,要运用大数据提升国家治理现代化水平。近年来,机关作为国家治理的中坚力量,大力推行大数据警务体系建设,拓宽了警务思维、提高了工作效率,使警务决策更加科学化。但是,囿于思想观念和一些现实因素的,大数据在警务领域中的应用仍存在一些问题。为充分实现大数据的效能,我们有必要对其中的问题进行剖析并提出全面、切实可行的解决路径。
一、警务大数据的应用概述
(一)界定
关于大数据,舍恩博格强调数据背后的价值,孟小峰强调数据的庞大数量,中国工信部的文件中则强调大数据是一个综合的技术体系,目前没有对其形成统一的定义。但是可以肯定的是对大数据的界定不仅仅局限于“数据”本身。大数据具有“4V”特征,即数量大(volume)、数据形式多元(variety)、信息真实(veracity)和更新迅速(velocity)。随着信息技术的发展和WEB2.0时代的到来,人的一切行为都可以用数据来记载。数据通过文字、图片、视频等多样的形式表现出来,再经过计算机算法、模型的处理,就能体现一定的规律或反映一定的现象,形成数据价值。概括来看,各行各业对大数据的描述和应用都包括了数据数量、数据分析和数据潜在价值三个方面。
(二)大数据在警务领域中应用的必要
性
互联息技术、网络数据技术的高速发展给我们的生活带来了极大的便利,但是也给犯罪分子提供了可乘之机,犯罪态势也呈现出智能化、科技化。一些犯罪分子借助互联网进行远程操控、购买犯罪工具以及销赃,互联网成为了他们的犯罪工具。特别是一些新型犯罪的出现,如二维码犯罪、网络电信诈骗、通过微信或WIFI窃取个人信息等,给工作带来了极大的挑战。传统的侦查方式已经不能满足打击新型犯罪的需求,为了应对犯罪形式和犯罪手段的智能化,机关不得不借助大数据开展警务活
动。
当前我国处于转型期,各类刑事、治安案件和突发事件多发,工作压力大。再加上警力的严重不足,使机关面临更大的挑战。弥补警力的不足,一方面要加强队伍建设,另一方面就要创新治理模式,从科学技术要战斗力。大数据的出现,
给社会治安综合治理模式的发展作者简介:杨万方(1994-),男,汉族,山东泰安人,中国人民大学硕士研究生。主要研究方向:侦查学。
提供了契机。基于计算机的信息处理优势,利用大数据辅助开展警务活动大大提高了工作的效率。比如,利用大数据进行网络摸排只需要在相应的数据平台上设定筛选条件,只需一个侦查人员操作电脑,就能在很短的时间内完成很大范围的摸排。这种工作方式不仅大大提高了侦查工作的精准度,而且还节省了警力、减少了支出,使侦查效益显著提升。
(三)警务大数据的应用现状
在科技强警战略和金盾工程的指导下,各地机关相继提出“智慧警务”“警务云”等大数据警务理念,并部署了相应的软硬件设施。各地机关积极进行各类数据库的搭建,广泛采集人口、住宿、寄递、交通等业务信息,普遍在指纹、DNA、Y-STR、视频监控、车辆管理、以及流动人口管理等方面形成了较为成型的数据系统,并初步实现了数据网络连通。
当前,大数据在警务实践中的应用主要集中在数据的查询、比对方面,如,利用大数据检索嫌疑人信息、实施网络摸排、网络串并、网络追逃等。在此过程中,主要运用数据搜索、碰撞等基于原始数据的处理手段。总体来看,目前警务大数据的应用偏重于“数据”本身,即大都是通过数据库检索和轨迹监控的方式,查找特定嫌疑人的相关信息,再据此进行下一步的行动。而在大数据的数据价值挖掘、犯罪预测方面,只有在少数信息化水平较高的地区能够实现,大多数地区的机关囿于技术水平和硬件条件难以实现。
二尧警务大数据应用中的主要问题及原因剖析
(一)民警大数据应用能力弱
民警对大数据的主观态度和应用能力直接决定了大数据应用水平的高低。目前,警务大数据应用的主体方面主要存在思维观念和专业素质两方面的问题。
大数据应用,要求信息资源高度共享、系统高度整合、技术上积极创新,需要民警具有较强的技术意识、全局意识和合作意识。但是,由于现实条件的,不同民警对大数据的认识程度参差不齐。特别是在偏远地区,一些老民警仍过度依赖传统的由经验主导的警务手段,过度“迷恋”传统的警务措施,对大数据技术不了解、不重视、不会用,导致应用频次低且应用程度表浅,使大数据的效能大打折扣。民警在观念上存在的另一个极端是对大数据过度依赖。大数据的出现对警务工作模式产生了很大的影响,一些过去需要耗费“脚力”才能实施的警务措施,现在只需要操作电脑就能完成,工作效率大大提高。大数据的强势宣传使部分民警出现了过度依赖于高科技手段,淡化甚至否定传统警务措施的情况,导致具体措施无法落地。此外,大数据的分析和预测也并非完全客观准确,数据来源的多样性及真实性等因素决定了数据的分析结果难免存在偏差。2013年,谷歌的“流感趋势预测”就因为数据样本准确度的不够高而出现了“假阳性状况”。由于社会研究的复杂性,加上大数据重关系轻因果的特征,我们要小心大数据也会“说谎”。
大数据依托计算机技术和互联网的发展,具有较强的专业性。基层机关是打击犯罪
的最前沿,基层民警是大数据应用的直接主体,但是并非所有的基层民警都具有较强的大数据分析能力。受此,大部分民警面对繁杂的数据往往不能做到有的放矢,无法实现在庞杂的数据库中准确获得有利于案件侦破的信息,甚至贻误战机。从另一个方面来看,警务领域中的大数据分析涉及到计算机技术、应用数据学、学等多领域学科知识,对应用主体的综合素质要求很高。但目前机关中从事大数据分析的人员多擅长计算机技术、懂数据,但是未必真正熟悉业务,将大数据深度应用于警务工作也就无从谈起。
(二)警务大数据运维障碍
在金盾工程的推动下,各地机关基本完成了指纹库、DNA库、人口信息库等基础数据库的建设。但是,从数据数量、数据深度,领域广度来看,还很难完全满足警务大数据应用的需要。从宏观来看,社会中存在海量的数据,理论上能够支撑起大数据在工作中的应用需求,但是将视角拉近我们就会发现,海量的数据分属于不同的主体,各“数据块”缺少连通,形成“数据孤岛”,不能有效利用。导致“数据孤岛”的原因有以下几个方面:
(1)数据来源渠道单一,缺少外部合作。数据是大数据运转的基础,广泛的数据来源使大数据分析结果更加精准。目前来看,机关掌握的数据多由内部各职能部门或其他机构采集,如派出所采集的人口信息,车管所采集的车辆信息,指挥中心采集的视频信息等,来源渠道比较单一。并且这些数据只占数据总量的一小部分,大部分数据掌握在互联网公司等社会主体手中。在警务实践中,即使机关有对社会数据的应用需求,也是针对个案在案发后临时调取,而且收集到的数据往往是零散的、不连续的。机关忽视与社会组织、企业的合作,导致了对网络数据、企业数据等外部数据的利用缺失。
(2)数据库分散建设、重复投入。随着各地对“云警务”系统的大力支持,一些有经济条件的地区相继建立起自己管辖地区的“专属”数据库,并将越来越多的本地数据接入库中。以我国发达沿海省份Z 省为例,省厅有“省库”,市有“市库”,甚至较发达地区的分局有“区库”。这些数据库之间有不同程度的信息重合,其针对的地域范围越小信息越详实,但数据范围窄;针对的地域范围越大信息种类越广,但缺乏数据深度。民警在实际使用的时候往往侧重于自己所在地域的“基层库”,如不能满足需求再逐级向上层数据库查找。同一区域内多层级数据库分散建设,不仅给民警执法办案带来重复工作,还造成了资源的重复投入以致浪费。
(3)数据管理方式落后。当前机关不同部门收集数据时具有一定的指向性,各具体部门根据各自的需求收集、存储对自己有价值的数据,而对于与自身业务无关的数据漠不关心,甚至在管理过程中将“无关数据”人为的删除或抛弃。在这种分立的数据管理模式下,机关内部各部门缺乏整体意识,不利于数据收集的全面性,更不利于数据资源的融通利用。
数据的存储和传输是大数据应用的基础。随着警务大数据建设的推进,数据量由
过去的TB、PB量级发展到了EB甚至ZB量级,数据的存储能力面临着巨大的挑战。而且,大数据的数据来源广泛,有来自于街面探头的视频数据,也有来自于户籍系统的图片文件......其中有结构化数据,也有非结构化数据,传统的单一的结构化数据存储架构对非结构化数据力不从心。此外,数据更新快、应用频率高的特点决定了大数据中的数据存储不是简单的物理保存,而是动态的调动和管理。在数据的删改和更新过程中,会有不断的写入和擦除,如何保障数据存储和交互过程的一致性,如何保持物理存储介质的使用寿命,也是当前数据存储模式急需解决的问题。
数据的体量达到了一定的水平,并不意味着大数据的应用效能就随之提高,其中一个原因是数据的价值密度低,也即数据的可用性弱。其原因有以下几个方面。
(1)数据标准不统一。缺乏统一的数据标准是实现数据融合利用的阻碍。由于机关掌握数据的具体来源不同,不同机关所收集的数据在采集、编码、录入时遵循不同的标准,导致各数据类型标准不一致。大数据分析依赖于数据模型和算法,而统一的数据标准是信息化的模型和算法有效运行的前提。数据标准不统一直接导致了各数据库之间的“数字鸿沟”,即使实现连通也无法将数据融合使用。
(2)海量数据提炼难。面对海量的数据,进行高效的筛选是精准应用的前提。由于专业能力的缺失,民警面对海量数据往往无从下手,不能迅速的进行价值判断和筛选。数据噪音的清理模式不成熟,导致无法对格式残缺的数据、无关数据进行预先剔除和分类,产生了较多的数据冗余,数据的数量优势反而变成了应用负担。
(3)情境偏差。数据有多种外在表现形式,包括文字、图片、视频等。文字、语言、肢体动作的表达都会受情境的影响,比如,人有时候会说“反话”、年轻人爱用网络流行语。“反话”、网络流行语只有与具体情境相结合才能探知其真实含义。而大数据中的数据分析是数字化、机械化的处理模式,没有情境思维,不能直接感知数据采集时的具体情境。虽然大量的数据样本能够纠正微小的偏差,但是表达方式和数据形式的活跃性多多少少会影响对数据分析结果的判断,进而影响数据的使用价值。
大数据最突出的特点是预测性和相关性,在警务领域中的体现就是高
危预测和关联性线索分析。在关联性数据挖掘的基础上建立预测警务和先导型警务模式,在发达国家警务领域中已经实现。反观国内警务工作,大数据多作为破案手段应用于一般的数据层面,如数据撞库、轨迹追踪等,并没有充分体现数据背后的关联价值。总体来看,大数据应用的思路仍然较窄,没有充分发挥大数据在社会治理中的价值。
(三)警务信息安全风险
当前,各国都高度重视数据安全问题。习总强调,要加强关键信息基础设施安
全保护,强化国家关键数据资源保护能力,切实保障国家数据安全。数据安全是国家数据安全的应有之义。当前,警务工作中存在的数据安全问题主要集中在两个方面。一是合作安全。机关与社会主体开展合作有利于提高大数据在警务领域中的应用效能,但是,合作中也增加了社会主体接触内部数据的机会,存在信息泄露的风险。二是技术安全。机关使用的数据处理软件有部分是从国外软件公司购买或委托开发,我们无法透视软件的运行过程,国外敌对势力有可能通过软件后门或其他攻击方式窃取关键数据,这是不容忽视的问题。
棱镜门”事件给世界各国敲响了警钟,贩卖内网公民个人信息的事件也时有发生,公民的隐私保护成为讨论的焦点。大数据时代是透明化的时代,人的一切行为都可被数据记录下来:上网有网络痕迹、出门有视频监控、出行有购票记录...无论身在何方,只要对相关数据进行分析,就可以勾勒出特定人的行为轨迹和详细信息,个人隐私一览无余。数据挖掘得越精准、应用领域越广阔,个人隐私保护就会变得越紧迫。利用大数据开展警务活动的过程中难免涉及到信息的广泛采集,对这些数据进行挖掘、分析和利用,从法理上是否构成对公民隐私权的侵犯还没有统一的定论。但不可否认的是,公民隐私一旦泄露或被不法利用,将对个益造成严重损害,不利于社会的稳定。
三尧解决警务大数据应用问题的建议
(一)加强民警大数据应用能力建设
(1)消除思想偏见。思想观念指导警务实践,其从根本上决定警务大数据应用的成效。消除民警对大数据的偏见,可以从顶层设计、示范引领、警务实践三个环节入手。已经做出了构建大数据警务的战略部署,为顶层设计开创良好开端。各级机关应该积极落实大数据战略指导,在进行大数据警务建设的过程中要及时发现先进典型并进行推广,发挥优秀典型的示范引领作用,带动思想观念的转变和应用建设的发展。实践是认识的来源,实务部门要积极将大数据应用于警务工作中,从实践中获得对大数据的认识,感知大数据对于工作的积极作用和局限性,改变大数据“无用论”和“万能论”的错误认识。
(2)转变思维方式。思想认识的转变还包括警务工作思维的更新。大数据扩展了警务工作的时空范围,为警务实践提供更多的模式和路径,警务工作思维由过去的单向思维转变为立体思维,由物质思维转变为信息思维,由因果思维转变为相关思维。为了实现大数据的高效应用,民警应该积极培养并运用系统思维、横向思维、发散性思维等一系列符合大数据应用特点的思维方式,用大数据科学思维指导警务实践。
(1)构建人才培养模式。大数据参与国家治理是大势所趋,不久的将来会需要越来越多的大数据专业人才。院校是人才培养的主阵地,培养精通大数据技术的专门人才要从院校的专业及课程设置入手。为了落实科技强警的指导方针,满足大数据时代警务工作的人才需求,院校应该在网络安全与执法专业、安全防范工程专业的基础上开设数据科学和数据工程相关的专业,或全面增设相关课程。此外,为弥补短期人才缺口,机关可以从社会高校毕业生中有重点的招录数据处理和分析人才,经过继续教育后充实到队伍中。
(2)加强培训学习。大数据的应用是一个不断学习、不断实践的过程。随着科技的发展,犯罪手段有智能化、数字化、科技化的发展趋势。为了应对不断变化的犯罪形势、掌握最前沿的大数据应用技术,机关要加大对干警的培训力度,定期组织一线民警进行大数据专项培训,开展理论学习和实务指导,以
提高理论水平、更新大数据应用能力。
(二)加强警务数据管理
1.数据共享。数据是大数据应用的基础,是进行数据挖掘和数据分析的前提条件。为了给大数据的应用提供丰富的数据资源,机关应该实现内外数据连通,制定统一的数据采集标准和录入规范,构建常态化的数据共享机制,打破机关内部以及与外部各部门的信息壁垒。在加强内部协同的同时,要注重与社会主体的常态化合作模式的构建,引入社会数据以辅助分析和决策,最大化的利用社会数据资源,打破数据孤岛的困境。
2.数据管制。为了应对数据安全和公民隐私的问题,在实现数据共享的同时有必要进行合理的数据管制。一方面,机关要建立数据身份管理机制和技术安全审查机制。统筹网下网上身份对应和备案管理制度,全面推动网络数据身份登记验证制度。同时要对涉及到和社会利益的重要技术进行预先评估,审查其安全性和可控性,防止数据泄露现象的发生。另一方面,机关要根据数据的机密程度建立数据分级制度,配套以不同的保密措施和接触级别。并对数据的使用程序做出严格规范,对不同层级民警的数据使用权限进一步细化,并建立监督机制以维护程序公正,从制度层面规避数据滥用和信息泄露的风险。
(三)提高警务大数据技术研发水平
前,机关大多将数据存储于自己组建的服务器中,但随着数据量的急速增长和
数据类型的增加,传统的存储架构已经不能满足警务大数据的存储需要。云储存是通过集群应用和数据管理软件将各种类型的存储设备连结成一个工作集合,共同对外提供储存和读取功能的计算机云计算系统。云储存用户不需要购买硬件存储设备,只要有网络就能实现实时数据存取。除数据量庞大之外,警务工作中的数据还具有不规则、实时性的特点,机关利用云储存技术进行数据储存和管理,能够有效解决传统存储模式的异构性问题,大大提高数据的存取速度和使用效率。此外,云储存系统的运行成本低,可扩容,可对数据进行加密,在便捷性、安全性和性价比方面都有着传统的存储模式不可比拟的优势。
据的可用性包括数据一致性、真实性、完整性、时效性等因素,为了提高数据的
可用性,机关应该引入数据预处理技术。数据采集的情景因素一定程度上影响数据的准确度。情境就包括时效和环境的影响,要将时效和环境因素纳入数据预处理的分析范围,通过数字化的分析和量化计算,确定数据的时效长短和环境因素导致的精准度误差。数据的预处理还包括对采集到的数据进行清洗、筛选和序化的过程。清洗和筛选是对采集到的大量数据进行完整性和使用价值评估,清理掉结构残缺、无法进行应用的数据,将能够进行应用的数据按照使用价值的高低分类储存,以便日后高效调取。序化是对数据进行标准化处理,通过编码使不规则的数据具有统一的格式特征,为数据算法的高效运行提供基础。
法决定了大数据应用的深度,缺乏先进算法是当前警务大数据应用的瓶颈之一。
数据是大数据分析的基本资料,只有在算法的驱动下,数据才有活力,没有先进的算法,数据就处于“休眠”状态,背后巨大的价值无法挖掘。当前机关使用的分析软件多为国外研发,不仅有技术更新慢、购买成本高的弊端,而且还有数据泄露的风险。要想提高警务大数据应用水平,就必须加大力度进行算法自主研发。机关应该与软件公司、高校开展深度合作,研发能够适应犯罪侦防特点的具有自主知识产权的数据算法和分析软件,并及时进行技术更新,为打破大数据应用困境提供技术保障。
信息安全风险是警务大数据建设中一定要解决的问题,解决这个问题不能只
靠制度设计,更要对技术层面进行研究。数据泄露风险主要存在于数据的分析处理过程中,如何即能保证数据的应用效能又能保障数据的安全和隐私是技术人员应该解决的问题。在信息安全研究领域中,数据匿名技术和数据加密技术是信息安全防护的关键技术,前者主要有数据脱敏和模糊化处理等去个性化手段,后者是应用加密算法进行加密处理,再通过密文检索技术实现隐私数据安全共享。机关应该对这些技术进行研究和借鉴,将其应用于警务大数据的建设和应用中,以加强数据安全和隐私保护。
(上接第66页)
(三)打造国有资本投资运营平台
改组和组建国有资本投资运营公司是国有资产管理改革一项主要工作。平台公司作为一类重要的地方国企,转型发展迫在眉睫。支持具备条件的平台公司发展成为地方国有资本投资运营公司,关键在于业务模式的转型。一方面,将土地开发、基础设施建设等传统业务定位为发展基础;另一方面,要坚持市场化运作,通过国有资源开发与资本运作的结合将国有资产升值并转化为国有资本,发挥地方国资杠杆作用[2]。
以重庆渝富资本运营集团有限公司(以下简称“重庆渝富”)为例,该公司从以银行不良资产收购处置为起始,依次演绎债务重组、土地重组和资产重组,延伸拓展战略投资再到搭建金融控股平台,直至目前,向专注于股权的国有资本运营公司转型。为探索国有资本投资运营的有效管控模式,重庆市于2014年提出决定搭建起国有资本投资运营“3+3+1”平台。具体是把渝富集团、水务资产公司、地产集团3家企业改组成为股权类国有资本运营公司,将机电集团、化医集团、商社集团3家企业改组为产业类国有资本投资公司,并新设立1家渝康资产经营管理公司,专司不良资产的处置和经营管理。自此,重庆渝富资本运营集团有限公司实现从资产管理到资本运营的彻底转型。目前,该公司主要投向金融、战略性新兴产业以及其他有价值的领域,并借助资本市场,组建多层次基金平台和用好资产管理公司的资产流动平台等,特别是多层次基金平台已成为该公司融资的重要手段,基本形成或正在筹备运营四大类基金群。分别是以战略性新兴产业股权投资基金为代表的产业基金、以中新互联互通基金为代表的开放型基金、以国企并购重组基金为代表的供给侧结构性改革基金、以高科技创新投资基金为代表的风投基金。
参考文献:[1]马毅鹏.地方融资平台转型路径:透视水利行业[J].改革,2015(3):82-83.
[2]周健奇,张永伟,李志能.地方投融资平台转型的方向与[N].中国经济时报,2016年1月19日,A05版.参考文献:[1]人民日报.审时度势精心谋划超前布局力争主动实施国家大数据战略加快建设数字中国[N].人民日报,2017-12-10
(001).
[2]维克托·舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.4[3]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展.2013,(1):146-169.
[4]工业和信息化部电信研究院.大数据[EB/OL].http://www.miit.gov.cn/n1146312/n1146909/n1146991/n18536/
c34505/content.html,2014-05-12.[5]IBM 商业价值研究院.分析:大数据在现实世界中的应用[R].北京:IBM 商业价值研究院,2012.3-5[6]杨郁娟.论科技发展对侦查的影响[J].广州市管理干部学院学报.2010,(2):17-20.
[7]胡亚谦.大数据预测能力对公共决策的影响[J].东北大学学报:社会科学版.2016,(3):281-287.
[8]张秦.当前犯罪防控中大数据运用问题研究[D].重庆:西南大学,2016.[9]官思发,孟玺,李宗洁,等.大数据分析研究现状、问题与对策[J].情报杂志.2015,(5):98-104.
[10]人民日报.审时度势精心谋划超前布局力争主动实施国家大数据战略加快建设数字中国[N].人民日报,2017-12-10
(001).[11]新玉言,李克.大数据:治理新时代[M].北京:台海出版社,2016:111.[12]李建利,李尘宇.大数据在刑事侦查中的应用研究[M].吉林:吉林大学出版社,2017:163.
[13]任柯.大数据云存储的技术优化的仿真分析[J].计算机仿真.2016,(5):385-388.[14]吕欣,韩晓露.大数据安全和隐私保护技术架构研究[J].信息安全研究.2016,(3):244-250.[15]马忠红.信息化时代侦查思维方式之变革[J].中国人民大学学报:社会科学版.2011,(1):101-107.下载本文