大数据在政府统计工作中的开发应用(一)

大数据”在统计中的应用初探

内容摘要:基于计算机、互联网、移动互联网和物联网背景下的大数据,其重要性和作用已远远超出传统概念的数据。通过剖析大数据,寻找相关性,发现规律性,增强预见性,带来“大知识”、“大科技”、“大收益”、“大智能”和“大发展”,大数据被誉为未来社会的新“石油”和新“金矿”,大数据可以运用在经济社会的方方面面。各行各业几乎都可以通过大数据挖掘,及时剖析出市场的前景或则客户的偏好,提高各自领域的核心竞争力和服务质量等等。大数据也给政府统计工作带来了机遇和挑战。本文仅从大数据的特点入手阐述大数据在政府统计工作中的开发应用。

21世纪是信息时代,随着互联网、物联网、云计算等信息技术的迅猛发展,企业、个人、机构等每位个体所参与的社会经济活动的特点,都会以计算机数据的方式被记录和储存,从而产生了大规模的信息网路体系,现代信息社会早已步入了大数据时代。

一、“大数据”的定义、特征和作用

(一) “大数据”的定义

关于“大数据”(big data),目前还没有一个统一的定义,说法与版本有很多。麦肯锡觉得,大数据是指未能在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和剖析的数据集合。维基百科的定义是,大数据指的是所涉及的资料量规模巨大到难以通过目前主流软件工具,在合理时间内达到描画、管理、处理并整理成为帮助企业经营决策目的的资讯。《大数据》一书作者涂子沛对大数据的定义是指,那些大小早已超出了传统意义上的尺度,一般的软件工具无法捕捉、存储、管理和剖析的数据。简单地说,就是指未能在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。从以上定义可以看出,大数据是在互联网时代下形成的一种数据量飙升的现象。

衡量大数据的大小一般以“太字节(TB)”或者“拍字节(PB)”为单位量级。1个太字节数据量为1024G个字节或10.7亿个字节。目前,数据的储存单位从小到大的顺序为:KB→MB→GB→TB→PB→EB→ZB→YB(千字节→兆字节→吉字节→太字节→拍字节→艾字节→泽字节→尧字节),每提升一个量级单位的存储量扩大1024倍。

(二) “大数据”的特点

一般觉得大数据有四个基本特点,即大数据基本特点可以用“4个V” 来总结,即大量性(Volume),多样性(Variety),价值性(Value)和高速性(Velocity)。

第一,大量性。大量性是指大数据自身所特有的数据量巨大的特点。全球数据量正以前所未有的速率下降,遍布世界各个角落的传感、移动设备、在线交易和社交网络每晚都要生成上百万兆字节的数据。我们从大数据的计量单位从KB发展到YB,之间经过了六个量级单位的升级,每提升一个量级单位的存储量扩大1024倍,就可以看出,大数据体量十分巨大。

第二,多样性。多样性是指大数据自身所特有的类型繁杂的特点。海量数据并不单纯是数据量的爆炸性下降,它还牵扯到数据类型的不断降低,如互联网多媒体中的图片、声音和视频等各式各样的数据类型。大数据的类型主要包括结构化数据、半结构化数据、非结构化数据,等等。

第三,价值性。价值性是指大数据价值巨大,但价值密度低的特点。有学者补充提出了大数据还具有稀疏性,即有价值的信息相对于数据量而言十分之少。大数据的质量除了参差不齐,而且还一般是杂乱无章的。数据价值密度的高低与数据总数的大小常常成反比。挖掘“大数据”的价值类似浪里淘沙却又弥足珍贵。

第四,高速性。高速性是指数据处理常常要求实时剖析,数据的搜集、获取、产生、处理速度快。一般而言,数据库等应用常常运行1、2天获得的结果仍然可行,而“大数据”应用,必须要在1秒钟内产生答案,否则这种结果可能就是过时的、无效的。在瞬息万变的市场中,企业能否及时掌握市场动态,迅速对市场、消费者需求等各方面情况深入洞察,并能快速制订出合理确切的应对策略,成为企业提升竞争力的关键。

综上所述,4V表明大数据具有量大、源多、结构复杂等特点。

(三)“大数据”的来源

大数据通常来自以下几个渠道:

第一个来源,是传感。笼统地说,任何可以检测、数据化、传输的工具都是传感。如手机、手环、大街上的探头等都是传感,传感器侦测和集成包括气温、湿度、压力、速度、位置等数据。据有关资料反映:2005年,全世界使用的传感只有1.3亿个,到2010年就发展到了30亿个,目前大约有45亿个。预计到2030年将有100万亿个传感联接在物联网上。

第二个来源,是互联网。目前全世界有网民30多亿,中国有6.49亿,占世界的五分之一;全国有12亿手机用户、5亿微博用户、5亿陌陌用户,以及200亿条日信息发送量、400万家网站,我国早已成为网路大国。网民每时每刻都在发送信息、图片、聊天、发贴子、购物等,留下了海量的数据。

第三个来源,是社交网络。像Facebook(脸谱)每天要处理23TB的数据,Twitter(推特网)每天处理7TB ,腾讯每日新降低的数据为200~300TB,中国电信大约每晚也有10TB的话单,30个TB的上网日志和100TB的鉴权数据。

第四个来源,是政府统计部门以及各专业部门、金融部门、科学研究等的数据。目前政府部门的人口普查、户籍登记、社保社保等行政记录,都是海量数据。

图片[1]-大数据在政府统计工作中的开发应用(一)-老王博客

尽管大数据的类型繁杂,但目前政府统计可应用的大数据来源主要有行政记录数据、商业记录数据和互联网(包括搜索引擎)数据三大类,其具体数据类型和主要特征见表1。

表1:政府统计的大数据来源

数 据 来 源

数据信息类型

主 要 特 点

行政记录数据

个人信息记录

单位信息记录

自然和资源记录

其他管理记录

结构化数据

按一定的标准记录

数据质量较好

通常以标准数据库方式存在

可能涉及到部门利益

商业记录数据

电子商务交易数据

企业生产经营管理数据

信息咨询报告数据

数据即时形成

图片[2]-大数据在政府统计工作中的开发应用(一)-老王博客

涉及广泛的领域

多采用企业标准

一般不公开

互联网(包括搜索引擎)数据

社交网数据

媒体数据

搜索引擎数据

信息量大

不稳定性

非标准化

容易获取数据记录

(四)“大数据”的作用

在现今国家发展与竞争中,大数据已成为未来的核心竞争力,谁把握了大数据,利用大数据实现真正的改革,谁能够博得未来。第一,对大数据的处理剖析已成为新一代信息技术融合应用的结点。第二,大数据是信息产业持续高速下降的新引擎。第三,大数据借助将成为增强核心竞争力的关键诱因。第四,大数据将成为降成本、增效益、促变革、稳下降的新途径与新动力。第五,大数据将推动统计方式、科学研究与实验的方式手段发生重大改变,成为政府统计搜集数据的第二轨。

基于计算机、互联网、移动互联网和物联网背景下的大数据,其重要性和作用已远远超出传统概念的数据。通过剖析大数据,寻找相关性,发现规律性,增强预见性,带来“大知识”、“大科技”、“大收益”、“大智能”和“大发展”,大数据被誉为未来社会的新“石油”和新“金矿”,大数据可以运用在经济社会的方方面面。各行各业几乎都可以通过大数据挖掘,及时剖析出市场的前景或则客户的偏好,提高各自领域的核心竞争力和服务质量等等。

二、“大数据”给政府统计带来的机遇和挑战

(一)大数据与政府统计数据的区别

大数据与政府统计数据存在显著区别。一是大数据多是手动生成的,而政府统计数据常常是依据社会经济发展须要生成的指标。大多数大数据的生成不涉及与人的互动,如跟踪定位系统的痕迹数据。二是与大数据相比,政府统计数据具有显著的社会服务性。大数据的形成和发展最早始于商业企业,也更多的服务于大数据持有者本身,而政府统计部门的各种统计数据和统计信息要最终服务于社会。三是大数据杂乱无章,缺乏统一的标准,而政府统计数据则有严格的统计标准规范。如社交网站上的文本流,无法要求使用统一句型、语序或是词汇表,但政府统计数据则有严格的政府统计制度标准作为保障。四是大数据中非结构化数据占有相当的比重,但政府统计数据仍以结构化数据为主。目前的政府统计数据还不涉及对图片、网页和音频视频等非结构化数据的标准化处理,而这恰恰是大数据的核心部份。

(二)大数据对政府统计的影响

大数据时代的到来,对政府统计形成了重要影响。第一,大数据丰富了数据来源。随着现代信息技术尤其是互联网技术的发展,图片、视频音频、网页等非结构化数据的比重不断上升,这除了是大数据的主要组成部分,也为政府统计提供了新的数据源。第二,大数据可以辅助验证政府统计数据质量。大数据具有量大、源多和速度快的特性,可以为传统的统计指标数据提供验证或补充,能够在一定程度上强化政府统计对数据质量的控制,有效提升统计数据的真实性、准确性、完整性和及时性。第三,大数据可有效提升政府统计效率。丰富的数据来源加上大数据收集和剖析挖掘技术,使得大数据可以极大地减短数据生产时间,减少报表补报程序,减轻调查负担。从全球范围看,大数据的借助早已在价钱统计、就业统计、人口统计、交通运输统计、经济活动预测等多个专业领域显示出广泛的前景和应用潜力。第四,大数据为统计剖析提供了新思路。在IBM 的人机大战中,机器人多次击败人类,之所以出现此类情况,其中很重要的一点就是机器人通过设定的程序在迅速搜集数据的基础上实现了对数据资源的剖析处理,从而迅速给出答案。而传统的统计剖析则是以人的主观能动性为基础,且多为事后统计。大数据剖析技术可以迅速实现对数据的实时剖析,大大增强数据的适用性和有效性。

(三)“大数据”给政府统计带来的机遇

1、有助于数据信息搜集

政府统计最难、最复杂的一步可以说就是获取确切大量的基础数据,而大数据则能让之简单化、便利化,还可省却大量的人力、物力。比如现今对于城乡市民收支的统计主要是借助一本本市民记录的账簿,而有习惯使用账簿的人原本就少之又少,这就显著影响了数据质量,并且成本较大。有同样功效的各类电子帐簿(如随手记)应用则已经出现在人们的日常生活中,界面美观大方操作简单,未来在有条件的调查户中完全可以实行。在大数据时代,数据多来源于数据终端设备记录下的原始数据(如商场收银管理系统),而不需要调查对象常年、认真的配合。

2、有助于统计部门给政府决策提供参考

政府统计的一项重要职能就是剖析数据,从而为政府决策提供参考根据。一项决策的作出不光须要总结过去的经验,还要对未来进行科学的剖析测算,大数据才能通过快速、精准的剖析,提高政府统计机构的工作效率。现今的各类统计剖析所使用的数据通常多是事后统计数,显得较为滞后,用来判定未来的发展趋势则变得有些力不从心。而借助大数据提供的算法和即时统计的数据信息等原始材料,结合特定的剖析方式则还能提高对未来趋势判定的准确性和快捷性。

3、有助于统计方法的创新

有研究表明“当前15%的信息是结构化信息,电子邮件、视频、呼叫中心对话和社交媒体等非结构化信息占85%”。这对于运用常规的统计方法来提取有意义的信息引起了挑战,电脑和各类智能联通设备等形成信息的设备继续成倍降低,社交网络也在加速发展,这些共享信息的大量形成早已深刻改变政府、公众和企业间的互动形式,老的统计方法势必会导致这种领域数据信息的较大缺位,这就促使统计部门要创新统计方法。

(四)“大数据”给政府统计带来的挑战

1、对政府统计职能的挑战

统计部门的主要职能是组织、协调和承当全社会的经济统计工作,确保统计数据真实、准确、及时,制定统计新政、规划、统计制度和管理统计标准,起草统计法规和规章草案等等。

目前统计部门的统计调查手段有全面调查(包括普查)、抽样调查、重点调查、典型调查等方式,基本业务举办仍依循制度设计、调查采集、数据整理汇总上报、数据发布与开发借助的次序流程。近年来,随着联网直报系统等信息化项目的广泛应用,政府统计逐渐实现了网路采集传输、集中存储处理、多工具剖析等手段。通过多种统计手段,最终得到反映经济运行状况的基本数据,主要包括人口与劳动力、生产总额、农业、工业、建筑业、贸易业、人民生活、价格等,然后结合从相关部门取得的财政、金融、运输、邮电、教育、文化、科技、卫生、环保等反映经济社会发展的统计数据,综合汇总剖析,再通过公报、年鉴、新闻发布、进度资料等方式向全社会进行公布。

随着经济社会的不断发展,大数据步入我们生活的方方面面,数据的生产和应用方法将发生巨大的改革:每个社会单位都是数据的生产者和提供者,数据不再仅仅依赖政府统计系统能够生产下来;数据储存于信息平台的所有者手中,政府统计机构不再是数据的绝对拥有者;大量用户才能便捷地使用海量数据供己所需,传统政府统计机构不再是数据的惟一发布者和解释人。各有关主管部门都可以提供相关数据。社会生活的支撑、管理、监控越来越依赖于既有的信息平台,通讯、电力、金融、电商、搜索引擎等信息平台的拥有者也是数据的拥有者。如果政府统计继续在现有静态的框架下封闭运行,就难以正确反映经济社会发展的变化情况,政府统计势必被边缘化。因此,大数据背景下,政府统计的职能将可能被弱化,地位也会遭到挑战。

2、技术和技能落后面临的挑战

随着大数据时代的到来,政府统计部门必然要面对由数据的数目、种类和速率飙升所引起的改革浪潮,互联网以及多种来源的信息大量涌来,政府统计部门须要设法管理大量的数据。这些海量的数据是统计部门的金矿,但获取提炼却是一个挑战。尽管大数据对建立政府统计的优势非常显著,但大数据同时也对政府统计部门搜集、处理、分析和发布数据的能力提出了更高要求。目前政府统计的信息化建设水平还远远达不到进行大数据处理的要求。

首先,传统主机加储存的数据库结构无法应付大数据洪流。大数据时代的到来意味着数据将以几何倍数不断下降,每天形成的数据量将是先前一个月甚至一年的数据量,传统数据库的传输带宽不足,不能满足这些数据的大量扩张,数据无法被快速的传到服务器上。

其次,传统的关系型数据库很难在单一数据平台中进行不同类型数据以及不同字符集数据的混和储存和高效访问。以往政府统计所面对的数据都是结构化数据,数据之间具有很强的因果关系,机器可以进行逻辑判定。但是大数据中绝大部分是非结构化数据,这些数据之间不存在因果关系或则因果关系较弱,传统的关系型数据库很难大规模处理非结构化数据。

第三,传统IT构架未能满足大数据高频次、广覆盖和高时效性的要求。大数据来源广泛多样,数据标准不统一,指标口径零乱,数据整合和衔接困难,而应用和处理大数据要求强悍的机器算法能迅速地完成数据的价值“提纯”,这是大数据分辨于传统数据挖掘最明显的特点。这就须要引入新的基础构架,克服传统估算和储存的局限。

大数据意味着更多的信息,但同时也意味着更多的虚假关系信息,曾经一位知名的学者用“在一堆稻草上面找一根针”来比喻大数据时代的数据挖掘。该比喻可能有点夸张,但是因为数据价值密度低,导致数据剖析工作难度大大降低。如果在数据量较大的同时,能够保证数据的质量,这无疑对数据挖掘工作起到事半功倍的作用,但事实是,大数据时代下数据量和数据质量之间的矛盾,是一个暂时未得到解决的困局。

三、 “大数据”应用前景宽广

大数据是随着信息数据快速下降和网路估算技术迅猛发展而盛行的,大数据通过对海量数据的搜集、处理和展示,从而阐明规律,预测未来。大数据才能帮助企业从原先毫无价值的海量数据中挖掘用户的需求,从而使数据真正形成价值。随着大数据的发展,其应用已然渗透到农业、工业、商业、服务业和医疗领域等各个方面。

全球信息数据量的急剧膨胀成为大数据产业存在并发展的基础。国际数据公司(IDC)预计,未来全球数据总数增长率将维持50%左右,到2020年全球数据总数将达到40ZB,其中,我国将达到8.6ZB,占全球的21%。中国信息产业研究院预测未来几年,随着应用疗效的逐渐显露,我国大数据市场规模将维持40%左右的高速下降。

在大数据的应用领域中,金融行业对数据的依赖性极高。据统计,目前我国商业银行和保险公司数据量已达到100TB以上级别。大数据金融的出现将提高金融行业营运效率,提高金融产品营销准确性。机构预计,到2020年,我国金融大数据应用规模将达到450亿元。

在健康医疗领域,大数据与医疗产业的深度融合将给健康医疗模式带来深刻变化。由于相关数据涵括范围十分广,健康医疗大数据将有助于对个人及群体的健康状况进行跟踪,开展远程医疗和精准化医疗,提高医治确诊效率和准确性。2016年6月,国务院办公厅发布了《关于推动和规范健康医疗大数据应用发展的指导意见》,将健康医疗大数据应用发展列入国家大数据战略布局。机构预测,未来5年,我国大数据医疗应用市场规模增长将成倍下降,到2020年,市场规模将达到400亿元。

(一)大数据统计应用的意义

在信息高速流通的当代,大数据猛烈地改变着人们的工作和生活方式,数据的重要作用不断显露,释放出巨大的经济社会价值,引发人们的思维转型,在统计领域的理论研究和工作实践上也具有重要意义,大数据时代借助大数据对经济社会现象进行剖析,将是统计学研究的重要课题。

1、大数据才能愈发客观真实地记载经济社会的发展情况

在现代社会,人与人之间、人与单位之间、单位与单位之间,甚至地区与地区之间、国与国之间发生的交流和交易行为都有可能在计算机等各类电子设备上留下记录,由于它们都是电子化的信息,没有掺入任何人为的干扰诱因,因此,对这样的信息进行开掘、加工、整理而得出的大数据才能愈发客观真实地反映社会经济发展情况。同时,实现大数据统计应用也是遏止统计作假、弄虚作假行为的重要途径。

2、大数据才能最大限度地拓展现行统计调查制度所未能涉及到的领域

大数据能轻而易举地解决常规统计调查未能涉及到的、各种复杂多变的行业和领域的统计,因为大数据不但量大,其囊括面也非常广泛,任何时侯、任何地方、任何人、任何单位,只要发生了互动行为就要留下“痕迹”,而对这种信息进行加工整理获得的大数据必然才能有效解决现行统计和国民经济核算资料不全的问题。

3、大数据剖析应用已然发挥出了明显的社会经济效益

目前,大数据剖析应用已然有了实质性的进展,例如,商贸领域通过对商品销售大数据剖析,能够发觉同一种产品在不同地区的销量、销售的时间以及订购产品的客户群,然后做出市场预测,制定出新的订货计划,取得可观的经济效益。在金融、保险、交通等行业以及财政、教育等领域,通过大数据剖析,能够发觉新的商机或管理模式,并找寻到改进服务的最佳途径。

(二)大数据统计应用迫切需要解决的问题

就目前的情况,要真正实现大数据在统计工作中的应用尚面临着好多问题与障碍,如口径不一致、范围不相同、标准不统一、程序不规范、信息不共享等,这些或将成为大数据统计应用的“拦路虎”。因此,我们建议:

第一,建立机构,统一管理大数据开发应用工作。大数据如同是一座巨大的“宝藏”,如果不加以开发就难以发挥其作用。但是,如果无序开发,也会促使这笔宝贵的财富得不到有效借助,造成浪费,甚至形成负面效应。因此,要真正实现大数据统计应用,应完善一个专门的管理机构,加强组织领导,统一管理大数据的开发、应用,保障数据信息安全,在个别领域、某些行业逐渐实现以大数据代替常规统计调查数据。同时,制定缜密计划、明确职责分工、选择工作路径、加强日常监管,从而实现对大数据这一宝贵资源的有效借助。

第二,统一标准,实现大数据在统计上的可比性。统计是一门科学,是一项非常严谨的工作。因此,统计指标的涵义、口径、范围、来源渠道、计算方式、计量单位等应当统一,只有这样才具有可比性。要实现大数据统计应用,提高统计工作的科学性,应该制订统一的标准,如在生产、流通、服务等领域,界定什么信息属于可在统计上应用的大数据,如何将大数据的口径、范围调整为常规统计所需的口径和范围,如何对大数据的海量信息进行甄别、筛选,然后挖掘出统计核算所须要的、且常规统计所无法取得的资料。只有在这种方面统一标准,才能真正实现大数据在统计中的应用。

第三,资源共享,畅通大数据信息来源的渠道。由于目前大部分单位都觉得本部门的数据、行政记录等信息是商业秘密,因而出于“保密”等诱因,一般不对外提供,即便是政府统计部门须要,一些单位也是顾虑重重。因此要实现大数据在统计上的应用,必须打破单位之间的信息“壁垒”,真正实现信息资源共享。只有这样,才能够最大限度地满足常规统计、尤其是国民经济核算的数据需求。当然,为避免泄露,有必要制订一个关于大数据开发借助的制度,严格规定对外发布的范围,保障个体信息资料的安全。

第四,创造条件,为大数据开发应用铺平公路。大数据应用离不开现代信息技术和网路技术,更离不开大数据开掘、加工、整理和剖析的人才。因此,应该大力培养一批大数据应用、尤其是大数据剖析方面的人才,为将大数据广泛应用于政府统计、宏观管理、企业经营等方面奠定基础。要鼓励院校和科研机构有针对性地开发大数据应用软件,为大数据剖析提供帮助。要通过国外培养、国外脱产等途径,培养一批大数据分析师,除举办大数据剖析外,还要将大数据剖析的理念、思路广泛应用于宏观管理和微观经营之中,发挥出大数据统计应有的社会经济效益。

(三)大数据思维在统计剖析中的应用

伴随着科技水平的不断提升,当代社会的发展日渐呈现在信息化网路之下,基于“互联网”的发展模式不断深入,我国各个领域的发展都与大数据思维相挂钩。政府作为维护社会稳定和国家长治久安的服务组织,其统计剖析工作亦须要结合大数据思维,这除了是政府服务工作与时代发展对接的须要,更标志着政府职能工作方式更新与变革走向新的发展高度。

大数据思维方法与统计剖析进行融合并非碰巧,而是时代发展对工作模式进行改变的要求。大数据平台的发展起到了重要的支撑作用,纵观现代网路信息的广泛性,每天都有大量的用户通过互联网来获取社会信息,在这些大数据集聚的网路中,“大数据+”的工作模式便成为时代发展的必然结果。

1、大数据方式下统计剖析的特征

图片[3]-大数据在政府统计工作中的开发应用(一)-老王博客

(1)打破时间与空间的限制。在传统的统计剖析工作中,政府在进行信息搜集时,其常常是通过单一的渠道,对某个特定地方的数据进行搜集和整理。统计工作量大,而且效率也低。大数据方式下统计剖析的特性与之相反,不仅还能打破空间的限制,让数据的收集更具广泛性与全面性。更因互联网的数据传送不受时间限制,让数据的统计剖析工作更为高效和确切。

(2)数据统计具备多样性。政府在对传统的数据进行统计剖析时,往往采取文本方式呈现。随着经济社会的不断发展,现阶段我国政府的文本方式已不能完全满足社会发展的须要。基于互联网下的大数据模式与统计剖析工作进行融合,不仅还能全面确切的对数据进行收集和智能化整理,更能让统计剖析工作中的数据以表格和图形的方式诠释下来,使数据的统计呈现出多样性,打破传统数据统计的单一结构。

(3)统计剖析结果价值大。传统的统计剖析工作,受地域限制的影响大,让数据遭到严重的空间限制,其所反映的问题不少限于局部,以此基础上产生的数据,其准确性难以保证,而且部份数据在统计的过程中也容易出现漏洞。大数据思维下进行统计剖析工作时,往往从全面性的数据中进行筛查,进而让数据与工作的结合度大大提高,在此基础上进行统计剖析,其统计数据质量、统计工作质量也会相应提升。

2、基于大数据思维下统计剖析的应用

政府的统计剖析工作须要构建在缜密的数据基础上,为此,大数据方式的应用便是政府统计工作急需引入的机制。在大数据思维下统计剖析工作的应用主要趋于于以下几方面:

(1)国民经济发展数据统计剖析。我国每个月、每个季度、每年还会对全省多数经济指标进行全面统计,通过统计各项经济数据的变动,来制订不同的经济发展战略,其中有国内生产总值(GDP)、居民消费价格指数(CPI)、工业企业主要经济指标等数据。大数据思维的应用,将大大减短统计周期,也必定增强统计剖析的时效性,进而让政府可以按照有效、准确的数据作出决策,做到“先知先觉”,通过大数据对未来的经济发展方式与趋势作出预判。

(2)国民就业、失业率统计剖析。政府在传统的统计剖析中,对国民就业与失业率的统计是通过毕业生下降情况和社会对劳动力的需求量进行统计剖析。大数据思维在统计剖析中的应用,能够使就业率与失业率的统计工作实现智能化,政府通过大数据平台对相关数据进行关键词的搜索就可以得出相应的数据,所有数据全部通过大数据平台自动化生成,不仅效率高,准确性也远远超出传统统计方法。

(3)医疗卫生领域数据统计剖析。我国政府在传统的医疗卫生领域进行数据统计剖析时,往往从各个诊所与超市进行数据的提取,并按照不同地域的诊所和病理来对我国医疗卫生发展的现况进行初步了解。对人口疾患迈向以及癌症种类与地域性的关系进行剖析,不仅整体的统计周期长,相关数据的完整性也不够,导致最终的统计结果准确性无法保证。基于大数据思维的统计剖析,是通过大数据平台对我国各个地域的网民疾患进行“一体化”的统计,并自行生成图形剖析,还能打破时间限制,实时监测各个地域的医疗动态与癌症发生情况。通过对同癌症的发生状况与就诊人数来对各个癌症做到预判,让大数据平台为政府医疗卫生管理部门提供帮助,进而实现对不同癌症的有效防范。

(4)国民人口分布数据统计剖析。传统国民人口分布统计工作是一项庞大的工程,政府逐一将每位省市进行分组,投入大量的人力和财力进行“走访式”的人口普查。其统计剖析工作才能对我国人口的分布特点、人口数目、男女人口比重、人口的出生率和死亡率等进行普查。然而,基于大数据平台的统计剖析工作,不仅还能将传统人口现况所筛查的领域进行愈发准确化的统计,更才能对不同地区的人口消费习性、学历水平等综合性指标进行剖析,其统计剖析数据更具全面性,让统计结果更立体的得出我国现阶段人口的群体性特点。

随着经济社会的不断发展,统计剖析工作模式必须要跟上时代发展的脚步,尽可能的打破时间与空间限制,让统计剖析工作构建在大数据思维之上。

3、大数据统计剖析工作应注意的几个重要问题

一要根据大数据的特点和大数据时代统计剖析的思维方法,注重大数据的抽样调查工作、测量工作及相关关系。二要理清统计设计搜集数据与挖掘数据两个基本环节的衔接。三要将统计技术与云计算技术融合。四要确立多学科融合的工作方式,融合自然科学、社会科学、数据科学为一体,必要的时侯推行跨界合作共同剖析相关数据。五要使统计学科教育愈加紧贴数据剖析的实践工作,通过聘请业界专家讲课,以生动、切实的案例教学,引导中学生了解统计在实践中的应用和需求,加强统计学的实践教学,使人才培养模式愈发积极主动适应社会发展对高层次统计人才的须要。

参考文章

[1]马建堂.大数据在政府统计中的探求与应用[M].北京:中国统计出版社,2013.

[2]丛雅静、蔡宁.大数据背景下政府统计信息化建设的几点思索

[3]金绮 等.“大数据” 时代政府统计应对之策阐述

[4]张启良.从“数即万物”到“万物皆数”—-大数据与我们的生活

[5]张林泉.大数据及其在统计剖析中的应用研究

[6]张耀华.大数据在统计中的应用初探

[7]毛远军.大数据思维在统计剖析中的应用

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论