时间:2022-05-21 11:15:09
导言:作为写作爱好者,不可错过为您精心挑选的1篇统计学数据论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
摘 要:围绕大数据时代的到来对管理统计学教学带来的机遇和挑战,分析现有的管理统计学课堂教学模式特点,总结其存在的不足,并探讨大数据背景下的新型管理统计学课堂教学模式,优化课程教学实施手段,不仅能积极应对大数据对管理统计学带来的挑战,给管理统计学带来新的发展机遇,也能增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才。
关键词:管理统计学;教学模式;大数据;案例教学
1 引言
管理统计学是一门应用统计学方法和理论研究经济管理问题的应用性学科,它通过收集、分析、表述、解释数据来探索经济管理问题的规律,并辅助企业进行管理决策和提高管理效率。传统的统计学关注小规模数据下的数据描述、推断和科学分析用。与之相应,管理统计学的课堂教学主要关注统计学原理的讲述、小数据的推断分析和经济管理问题的简单应用。
然而,自2008年Nature杂志发表“Big data:science in the peta byte era”以恚大数据的发展方兴未艾,备受学术界,企业界等关注。大数据的理念和技术不仅在互联网、金融、机器人、人工智能等领域取得突破性进展,也将对企业的生产、经营和决策等活动带来深刻的影响,通过对企业大数据的深度挖掘,有助于实现企业的商业价值,规避企业的决策风险,提高企业的竞争力。
大数据时代的到来,对管理统计学来说既是机遇又是挑战,机遇在于:大数据的分析主要建立在统计学的基础上对数据进行处理、分析,从而使得大数据可视化;而挑战在于:当下管理统计学的教学方法和教学手段难以匹配大数据时代对数据分析从业者的要求,这就要求对管理统计学的课堂教学模式进行进一步的发展与创新,以期适应大数据背景下的新要求。
如何结合大数据时代的新要求设计合适的课堂教学模式,如何结合丰富的大数据应用案例开展课堂教学活动,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是大数据背景下传统的管理统计学课堂教学模式所面临的问题和挑战,这也促使管理统计学教学工作者不得不去探究、优化甚至改革现有的管理统计学课堂教育模式。
2 传统管理统计学教学模式的概述
笔者所在的教学团队来自于武汉科技大学管理学院,承担全院《管理统计学》课程教学任务,在教学方法、实践教学等有较为丰富的教学经验。然而,在多年的教学过程实践和与学生的教学互动当中发现:现有的管理统计学教学模式尽管相对较为成熟,在培养学生的数据分析意识方面起到的重要作用,但是仍存在以下不足,而这些不足恰恰难以适应大数据背景下对管理统计学教学带来的挑战。
2.1 注重理论讲授,忽视应用教学
受技术发展和数据规模等因素的制约,传统的管理统计学教学大都采用理论驱动的教学模式,教师依托教材,注重统计学基本原理和方法的传授,学生掌握基本原理,对统计学的实际应用等关注较少。
尽管管理统计学课堂教学会涉及到一定的应用案例,但是这些案例大都简单,陈旧,数据来源单一,难以接触实际原始数据,统计建模思路也相对固定,这些教学案例既不能反映管理统计学的最新发展和应用思想,也无法将其带入企业经营的情景,对企业决策过程缺乏了解,这些因素都使得学生对该课程的学习兴趣不高,不利于培养学生应用统计学解决实际问题的能力,进而影响课堂教学效果。
2.2 注重数学推导,忽视工具应用
管理统计学要求学生掌握一定的数学基础,教材也都有较多的数学公式和理论推导,忽视了培养学生应用SPSSvSASvR等统计软件工具解决统计问题的操作能力。
根据经管类专业的培养定位,对于经管类专业的学生而言,相比于统计的数学公式,真正实用的如何借用SPSSvSASvR等统计软件工具来解决企业经营决策面临的实际问题,尤其是在大数据背景下,需要处理海量、复杂、多源、异质的高维数据。这些是单凭数学推导和简单的手动计算无法完成的。
近年来,大数据、互联网等技术的快速发展催生了一类新型且前景广阔的职业方向-数据分析师。综合数据分析师的职业要求,可以发现,这些职位大都要求从业者了解基本的统计学原理和方法,熟练掌握SPSSvSASvR等统计软件工具,并应用这些工具解决企业经营管理面临的实际问题。
2.3 注重知识考核,忽视项目训练
受限于教学管理制度和考核手段等因素,目前管理统计学课堂教学考核方式大都以闭卷为主,主要考察学生对统计学基本知识点的掌握情况,以及学生应用统计学知识解决简单案例的综合能力。
然而,在大数据时代背景下,除了要求掌握统计学基本原理,更应培养学生应用统计学知识解决实际问题的综合能力,而这种综合能力往往涉及数据获取、数据预处理、数据探索、统计建模、模型检验、模型评价、模型解释、模型部署和模型修正等数据分析的全过程,这种综合能力的掌握是无法通过现有的知识考核来达到的,这些必然要求学生通过参与实际项目或模拟情景来实现。
3 大数据背景下管理统计学教学模式探讨
如何结合大数据时代的新要求设计合适的课堂教学模式,如何结合丰富的大数据应用案例开展课堂教学活动,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是大数据背景下传统的管理统计学课堂教学模式所面临的问题和挑战。而现有的管理统计学课堂教学模式难以匹配大数据时代对其提出的要求,这就要求对管理统计学的课堂教学模式进行进一步的发展与创新,以期适应大数据背景下的新要求。
3.1 构建案例引导的教学模式
现有的管理统计学课堂教学以讲授基本的统计学原理为主,少量简单的统计工具应用。大数据时代下企业的数据有了更高的商业价值,这对从业者带来了更大的挑战。因而管理统计学教学模式应主动应对这种挑战,调整教学模式,引入实际案例,综合训练学生的基本原理、数据整理、分析和操作能力。
【摘要】首先,本文给出了笔者认为的统计学研究的典型问题究竟是什么;然后,阐述了什么是大数据;最后,就笔者的理解浅谈了大数据时代统计学究竟还有没有用武之地.
【关键词】统计学;大数据;统计分析
一、统计学研究的典型问题
众所周知,统计学是处理数据的一门科学.人们给统计学下的定义很多,比如,《不列颠百科全书》中“统计学是收集、分析、表述和解释数据的科学”;《韦伯斯特国际词典(第3版)》中“统计是一门收集、分析、解释和提供数据的科学”;Mario F.Triola的《初级统计学》中“统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论”.笔者认为,统计学研究的典型问题是“运用已知数据获得所研究的客观事物的数量特征和发展规律,利用规律对所研究的客观事物的行为进行预测”.
首先,统计学研究的典型问题的关键之一就是必须有所研究问题的数据,这是研究的前提.那么如何获得已知数据呢?我们说可以通过调查,也可以通过实验.先来说通过调查获得已知数据,情况有两种,一种是抽样调查,另一种是普查.给大家举一个例子,比如,某研究部门想知道其所在城市所有职工家庭的年平均收入.那么,“该城市所有职工家庭的年平均收入”就构成了所研究问题的总体.“该城市中的每一个职工家庭的年平均收入”就是总体中的个体.如果要通过抽样调查来获得数据,也就是抽取部分个体组成样本,比如,该部门抽取了2 000个职工家庭的年平均收入作为样本,那么就获得了2 000个样本数据(某年的年收入数据),这就是通过抽样调查获得的已知数据.再用这同一个例子来说一说普查.比如,2016年,该研究机构对其所在城市中的每一个职工家庭都进行了调查,获得了每个个体(职工家庭)的2015年的年收入数据,这就是通过普查获得的已知数据.
当然也可以通过实验来获得已知数据,做实验的过程就复杂了.要想通过实验获得靠谱的数据,首先,得满足样本量足够大,然后,就是要做到随机.现实中这两点也不是很容易做到的.例如,假设我们现在想研发一种做运动鞋的新材料,看看是不是比旧的材料更耐磨.又假设我们现在的研发成本非常高,只能提供4双样品鞋.于是,我们找来了8个孩子来试穿,4双新材料4双旧材料.看到这儿,第一反应是样本量小了,但是没有办法啊,实际情况只允许我们做到这种程度.那么在样本量无法扩大的前提下,怎么做才能使实验靠谱呢?我们给每一个孩子随机选一只脚穿新材料,另一只脚穿旧材料.这样,每一组新旧材料的对比都是基于同一个孩子的,这就不存在比如,孩子是否喜欢运动等的混淆因素了.
统计学研究的典型问题的第二个关键点就是需要有合理的统计分析.针对已经获得的已知数据也就是样本数据,我们采用合理的统计分析,定会对所研究的客观事物的数量特征和规律进行准确的描述、分析和判断.
统计学研究的典型问题的第三个关键点就是对未来的预测具有不确定性.分两个方面来给大家阐述.首先,未来必须是未知的,如果所研究的某事物的未来行为或特征是已经知道的,那这就不属于统计学要研究的问题.其次,预测必须是不确定的.如果预测的结果只有一种,也就是预测的结果是确定的,那这也不属于统计学要研究的问题.比如,我们想知道人体的骨骼有多少块骨头?于是,抽选部分人作为样本,通过对样本研究获得已知数据,进而来预测其余未被抽中的人,这种预测具有确定性,人体骨骼是由206块骨头组成.这就不属于统计学要研究的问题.再比如,一种新药出厂后用于临床试验获得已知数据,然后对更广泛的同类型病人的疗效做预测性推断,具有不确定性.
二、什么是大数据
当今,“大数据”如日中天,似乎已经成为人们的流行语,那什么是大数据呢?麦肯锡对大数据的定义是从数据集的“大体量”入手的:大数据是指那些规模大到传统的数据库软件工具已经无法采集、存储、管理和分析的数据集.维基百科采纳了麦肯锡的定义,认为大数据是一组庞大而复杂的数据集的集合,大且复杂到难以用现有的数据库管理工具或传统的数据处理应用来处理,大数据就是一切可记录信号的集合.狭义地讲,大数据是一个大样本和高维变量的数据集合.广义地讲,大数据涵盖多学科领域、多源、混合的数据,自然科学、人文社会、经济学、通讯、网络、商业和娱乐等各种领域的数据集相互重叠连成了一片数据的海洋.大数据涉及各种数据类型,包括文本与语言、录像与图像、时空、网络与图形.我认为,当今流行的“大数据”是通过互联网获得的足够大量的、包含一切数据类型的数据的集合.
三、大数据时代,统计学是不可或缺的
我们姑且先不去谈大数据和统计学中的数据谁更全面,谁更方便获得,谁更相对有代表性;不去谈什么样本和总体,我们就只是来说一说,大数据时代,只是有全部的数据就足够了吗?笔者认为当然不是.无论是大数据还是统计学中的样本数据最初都是杂乱的、无序的,所以说,大数据时代,数据的处理、理论分析等的问题就显得尤为重要了.这些重要问题的解决都离不开统计学,它需要统计理论和统计分析方法.
就是舍恩伯格和库克耶也不同意安德森的极端观点.他们指出“大数据绝不会叫嚣‘理论已死’”,因为“大数据是在理论的基础上形成的”,无论是如何搜集数据、分析数据、还是解读研究结果,都得依赖理论.“大数据时代绝对不是一个理论消亡的时代,相反地,理论贯穿于大数据分析的方方面面.”
摘要:大数据是21世纪的热点话题之一,统计学是传统的数据分析学科。利用百度指数提供的“用户关注度”功能,本文选取2012年-2016年5年260周的百度周平均搜索指数为研究对象,以百度搜索指数来反映社会关注热度,研究大数据与统计学关注热度之间有无相关性,以及大数据搜索指数发展的趋势变化。根据图形分析与相关系数的计算,可知大数据与统计学搜索热度呈现正相关关系,该关系线性程度不大,多为非线性关系。根据大数据的季平均搜索指数、每四周平均搜索指数的变化趋势研究表明,大数据搜索指数不存在明显季节性,存在明显的正趋势性;其搜索岫茸2012年初至2015年2季度以来呈明显上升趋势,其后增长速率放缓,呈现更为显著的波动性,由此可知2015年2季度为其明显的一个转折点,符合其发展趋势的模型有修正指数模型,以及龚珀兹曲线模型和皮尔曲线模型这两个生长曲线模型,结果显示三个模型的拟合度均较理想,其中龚珀兹曲线的拟合度最高。根据拟合结果,从大数据搜索指数反映的社会关注热度来看,大数据搜索指数的发展已趋于饱和趋势,其饱和值为4300左右。
关键词:大数据;统计学;百度指数;趋势外推
引言
现代社会,数据量呈爆炸式增长趋势,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。2012年以来,大数据一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。而统计学作为传统的数据分析方法,在拥有海量数据的现代社会既有着巨大的机遇,但由于大数据突破了传统统计学关于样本和总体界定等等限制,也对传统统计学的分析方法提出了前所未有的冲击和挑战。在现实生活中,并没有一门基于大数据的专业产生,各大企业往往通过招收统计学、计算机、数学等相关专业的人才来满足其大数据分析工作的要求,尽管如此,关于大数据的热门是否捧热了统计学之类的相关学科的说法一直众说纷纭;此外经过了几年的对大数据关注的大热,市场逐渐对其回归理性,甚至出现了“大数据泡沫”这样的质疑声音。本文借助百度搜索指数,对2012年-2015年每一周大数据、统计学两词条的反映其关注热度的搜索指数进行定性、定量分析,实现以下目的:
观察从百度搜索指数中反映出的人们对于大数据、统计学度的变化趋势,了解在人们关注度方面二者有无相关性、有怎样的相关性,即大数据的大热有没有带来统计学关注度的变化。
通过建立统计模型,观察大数据关注热度5年来的变化,了解现实中其在关注度发展过程中所处的阶段,即现实中对大数据的关注依然处于上升阶段还是已经趋于饱和。采用定量、定性结合的分析方法,将统计学和大数据的搜索指数时间序列作线图,并计算线性相关系数,观察两者的变化规律,并计算两者有无线性相关关系。为满足消除随机性波动和保留足够数据量的需要,分别计算大数据搜索指数的每四周、每季度加权平均值。观察图形有无季节性、周期性波动;观察图形是否存在转折点,以此为基础选择统计模型。根据图形识别的结果,建立可能的统计模型,并通过比较R方值的方法来选择适当的模型。
一、中国统计学发展与大数据发展的相关性分析
用横坐标表示周次,纵坐标表示搜索指数,将大数据和统计学的搜索指数时间序列在一个图中分别做折线图,从图像中可以看出,57周以前,统计学的搜索热度大于大数据的搜索热度,57周以后,大数据搜索热度逐渐超过统计学搜索热度。90周之后,大数据和统计学的变动趋势呈现一定的相似性,例如都在214周时达到谷值,而后回升。在178周大数据搜索达到峰值,182周统计学搜索量达到峰值,在此期间统计学的增长略落后于大数据的增长,但是分布的形状大体一致。
2.季平均值线性相关系数=0.292112357
结果分析:两组数据的线性相关程度都不高,其中季平均线性相关系数略高于周平均线性相关系数。说明大数据与统计学的搜索指数之间并不存在明显的线性相关关系,但是从图中看出二者变化趋势具有相似性,因此猜测二者可能具有某种非线性相关关系。
因为相关关系并不等于因果关系,因此对于如上结果我们做出两种假设:
在90周以后,统计学的分布类似并且略落后于大数据的增长,这可能是由于人们对于大数据的关注,引发了人们对于统计学这个相关学科的关注。
两者类似的分布形态,可能是由于全国所有用户搜索频次的周期性、随机性变动所引致的,大数据、统计学搜索指数变动之间并没有直接的因果关系。
二、中国大数据需求量预测模型
由于原始数据有260周,波动性过大,为了得到更为准确的结论,我们仅对其按每季度、每四周两种方式计算加权平均值得到的时间序列作讨论,其目的是(1)平滑随机波动;(2)判定按每季度和每四周平均哪个有季节性;(3)每季度平均更能反映长期趋势,但数据较少,只能以季为单位预测未来值;每四周平均的数据较多,且可以进行更短期的预测。
1.季节性、趋势性的判定
(a)图形判别法
建立按季平均和按每四周平均的横坐标为季度或周次,纵坐标为搜索指数的折线图,按季节平均、按每四周平均,大数据搜索指数都不存在明显的季节性;另外由于后一年的值往往大于前一年的值,因此可以判定其存在趋势性。
(b)建立一元线性回归方程并检验显著性
季平均值:;
每四周平均值:;
由于两个时间序列一元线性回归的R2均显著,所以大数据搜索指数显然存在线性趋势。
结论:上述过程从图形和计算两个角度得出了以下结论:大数据搜索指数并不存在明显的季节性,不适合使用时间序列分解法;大数据搜索指数存在明显的趋势,一元回归有较好的拟合优度,但是一元回归使用的前提是时间序列不存在明显的转折点,为了进一步确定更好的拟合模型,我们继续如下讨论。
摘 要:传统的统计学是因数据而生的,也是以研究数据为根本目的,传统统计学有其独特的数据收集、整理与分析的方法体系,也确实为我们研究数据带来了便利,但是不得不思考的是在数据爆炸的信息时代,尤其是“大数据”概念产生以后,传统的统计学如果不改变,又将如何应对大数据分析带来的挑战,该文将从零售行业的角度分析大数据为传统统计学带来的诸多挑战。
关键词:总体数据 相关性 个性化营销 定制服务
随着科技的发展,大数据已经成为信息时代的一场技术革命。大数据是指传统数据库管理工具难以处理的大量的、多样化的数据。当前普遍认为大数据有3个特点:第一,数据量非常大;第二,数据增长速度非常快;第三,数据类型越来越多样化[1]。零售业作为传统的线下实体经营行业,积累了大量的消费者以及管理层的数据,如果依靠传统的统计学模型对这些数据进行分析,很难得出可以用于企业经营管理的有效信息,加上年轻一代消费者越来越追求个性化,所以传统统计学所采用的根据部分样本推断总体的分析方法已经无法满足市场的个性化需求,因此,传统统计学要想跟上时展的步伐,就必须做出与之相适应的改变。
1 零售行业里大数据与传统统计学的区别
维克多・迈克尔在《大数据时代》一书中提出了大数据思维的3个最显著的变化:一是样本等于总体。这与过去基于样本进行统计分析的思维截然不同;二是不再追求精确性。在大数据中往往存在“噪音”和罕见事件,这样的数据影响了结果的精确性;三是相关分析比因果分析更重要,在大数据时代我们将注意力更多地放在“是什么”而不是“为什么”[2]。大数据的以上特性在零售行业同样适用,零售行业的大数据与传统统计学的区别有以下3点。
第一,大数据收集总体数据,而传统统计学多采用抽样的方式收集部分数据。传统统计学在做统计分析时首先针对某一个问题提出假设,然后确定需要调查对象的总体,由于数据采集存在一定的难度,所以统计分析采取从总体中随机抽样选取一部分数据作为分析的对象,如此的话对随机抽样的方法与数据采集的准确性要求是非常高的。而大数据收集的是数据“总体”,在进行分析的时候不会人为进行假设,排除了人的干扰因素,仅仅从数据本身出发进行数据分析。在零售行业如果能运用大数据思维分析数据,从产生数据的顾客行为本身出发,针对不同顾客做出个性化营销,而不是人为假设的话,管理层就可以根据数据进行预测,避免了主观的经验与直觉的判断。沃尔玛作为零售行业的巨头,运用大数据分析得出的著名的啤酒与尿布理论可以证明这一点。
第二,大数据注重个体行为的研究,统计学用样本数据推断总体行为。传统的统计学采用抽样调查的方式对样本数据进行分析,用样本推断总体,那些在图表上反映出来的异常数据被排除在外。大数据包容一切数据,其中包括各种结构化、半结构化、非结构化甚至是异构数据。对于零售行业而言,顾客的总体行为表现是没有意义的,因为每个顾客的需求不同,在不同的时间和地点需要的商品都不同,只有根据每位顾客的不同行为进行个性化服务才能让线下的零售行业有优势可言。美国高档连锁百货Nordstorm最近开始采用线下实体店客流分析服务供应商Euclid Analytics公司的客流监测解决方案Euclid Zero,基于用户连接Wifi行为来获取店内顾客手机的Mac物理地址并进行线下追踪,由此可以通过单个顾客在百货店里的行动路线和滞留时间,从而用于改善商品罗列与室内动线以及顾客个性化偏好与推荐服务[3]。
第三,大数据注重数据之间的相关性,而传统统计学更加关注数据分析的结果。从社会发展的角度来看,大数据对数据的关联性分析更有助于零售行业管理层做出决策。对于传统零售行业而言,线下的用户体验是非常重要的,如果能根据用户行为数据分析出哪些商品放在一起能促进购买力,那么零售行业将会有更大的利润空间,相比之下,统计学进行的结果分析显得没有那么重要。
2 大数据在零售行业的优势
迈克尔・舍恩伯格说:大数据发展的核心动力就是人类测量、记录和分析数据的渴望。
第一,大数据收集的数据是多样化的、非标准化的,而统计学收集的数据都是标准化、结构化的,统计学无法对非结构化的数据进行分析与测量。但是在零售行业仅仅对标准化的数据进行分析做出的判断已无法满足行业的需求,通过对用户在商品前滞留的时间以及与货架上商品的互动行为产生的数据进行分析,从而调整货架的位置才是主流。
第二,大数据可以实时、快速监测与收集数据,而统计学收集数据时间长、难度高。大数据收集与处理数据的能力对于零售行业的供应链管理十分有效。零售市场可以利用大数据对库存和员工行为进行监测,从而为管理层做决策提供依据。沃尔玛为了提高大数据成果在不同部门之间的高效利用,并增加存货管理和供应链管理的投入回报率,其开发了Retial Link工具。供应商使用该工具可以预先知道不同店铺商品销售和库存情况,从而能够在沃尔玛发出指令前自行补货,极大地减少商品断货,提高供应链的库存水平[4]。
3 传统统计学面对大数据挑战要做出改变
大数据的出现给我们的生活带来了巨大的改变,甚至不同国家的政府都将大数据作为国家的战略资源。相比之下,传统统计学面临着大数据的巨大挑战,如果能根据自身优势做出改变,传统统计学仍然具有存在的价值。
第一,改变数据的收集方式。统计学收集数据时前期要做大量的准备工作,需要耗费大量的人力物力成本,所以想要更加高效收集数据,就必须做出改变。由于大数据是基于互联网收集数据的,所以对于不使用互联网的地区和群体来说,大数据就显得很无力,而传统统计学可以在此基础上发挥自身势,在以往的数据收集方式上进行创新。
第二,传统统计学在数据的分析思维上也要进行改变。传统统计学不光要打破只能分析标准化数据的魔咒,更要着重分析问题的本质,而不是一味注重结果分析,虽然“是什么”很重要,但是一直以来探寻事物内在本质才是不断推动人类社会进步的动力所在,所以统计学也要学会知道“为什么”。
4 结语
信息技术的发展是无法想象的,我们无法通过今天来预测未来10年信息行业的发展。只有追上时代的脚步,做出顺应时代潮流的改变,才能免遭淘汰,对于传统统计学也是一样,停留在原地不动是不明智的,改变才是世界的本质。而所有技术的变革都将反馈给人类的生活,让人们和社会从中受益。
摘 要:随着医学健康档案“电子化、信息化、数字化、智能化”的管理和医学研究资料的不断积累,医学信息大数据时代悄然开启。如何有效地利用这些海量信息为健康管理和健康决策提供支持,本文分析了大数据对统计学原理和方法提出的挑战,列出了在医学统计学课程教学中应该思考的一些问题。
关键词:大数据;医学统计学;教学
所谓大数据(Big Data),是指具有4V特征且用目前的管理、处理技术手段难以进行有效管理和分析的数据。4V的含义是数据量大(Volume Big),数据量级扩大至PB以及ZB级别;数据产生、输入和处理快速化(Velocity Fast);数据结构和类型多样化(Variable Type)及数据价值密度低(Value LowDensity)。大数据的目的是将数据转化为知识,探索数据的产生机制和过程,进行预测和政策制定。随着医学健康档案“电子化、信息化、数字化、智能化”的管理,随着物联网在医学健康领域的应用,医疗、护理、康复、保健工作流程中产生的数据存储量呈指数增长。如何有效地利用这些海量信息为健康管理、临床治疗、医院决策及卫生政策制定提供支持,是大数据时代医学信息化带来的挑战。美国国家卫生研究院(NIH)为此特设立生物医学大数据研究中心及专项基金。在我国,科技部、国家自然科学基金委、国家社会科学基金委陆续酝酿和启动了“大数据的处理与应用”系列重大研究项目。
统计是一门数据科学,医学统计学是关于医学健康数据的收集、整理、分析和解释的方法论学科。“大数据”处理对统计学的发展提出了新的命题,如何将“医学信息大数据”处理技术融入相关统计学课程教学以促进现代医学信息分析技术的发展?本文做了相关的分析,并提出应该思考的一些问题。
一、大数据对统计学原理和方法提出的挑战
1.统计数据产生由“问题导向”到“数据驱动”
目前,统计数据的产生主要是基于所要研究的问题而主动进行的“数据收集”,落脚点在于如何获取数据。在大数据时代,海量数据随处可得,由数据驱动而进行问题研究将非常普遍。那么,获得数据的关键点不在于如何获得,而在于如何识别与选择。由“问题导向”产生的结构数据是经过严格抽样设计获取的,具有系统误差小、总体代表性好的优势,但是信息量有限,且数据获取周期长。大数据流环境下,海量数据中有价值的数据可能并不多,即数据的价值密度低,且难以避免和判断数据获取的误差和偏倚。在很多情况下,统计数据不需进行抽取,而是“数据样本即总体”;同时,也要研究如何从源源不断的数据中抽取足以满足统计目的和精度的样本,这需要研究新的序贯性和动态性的抽样方法。
2.数据格式和结构复杂多样化
目前统计数据都是结构化数据,如疾病空间分布和时间序列数据等,可使用二维表格表示,可以方便地被常规统计软件读取和进行分析。在大数据背景下,除少量数据具有结构化特征外,更多的是半结构和非结构化数据,如各种格式的文档、图片、网页、图像、音频和视频等。目前,这些半结构和非结构化的大数据仅能做到初步的实时业务应用。如在研究气候变化与人类健康相关的命题时,需要处理庞大的气象数据,而80%以上的气象数据均为非结构化的大数据,如何将这些非结构化的大数据做到降维、分解和长时间序列储存无疑是统计学面临的新命题。
3.大数据的整合及跨库分析方法亟待建立
传统上,数据集的合并和拆分都是利用关系数据库技术,如共同的编码或关键字进行操作。在大数据环境,很多数据集不再有标识个体的关键字,关系数据库链接方法不再适用,需要探讨利用数据库之间的重叠项目来结合不用的数据库。此外,还可以改变分析思路,如直接利用局部数据进行推断,然后整合这些数据集的统计结论。
4.大数据对于统计学核心理论的冲击
一个新生事物的出现将必定导致传统理论和技术的变革。大数据对传统统计学原理和方法的冲击是划时代的。传统的统计学方法和理论立足于应用抽样技术在总体中抽取小样本进行分析,通过样本统计量推断总体的参数和性质。在大数据背景下,我们更关心的不是数据量的大小,而是数据所蕴含的信息量及信息的识别和选择。因此,大数据的预处理如数据清洗、纠偏完全跳出了传统小样本研究的范畴。同时,大数据充满了各种随机的、非随机的误差和偏倚,很难满足小样本数据精度和分布的要求。在大数据时代,需要进一步拓展统计思维,丰富现有统计学的理论和方法,赋予统计学新的生命力。
二、在大数据时代对统计学教学的几点思考
《“十二五”时期统计发展和改革规划纲要》中明确提出,“建立现代统计体系就是建立以现代信息技术为支撑的统计系统”。根据这个纲要,计算机技术、互联网系统、多媒体等现代信息技术在统计技术中将发挥更重要的作用。在医学信息大数据时代背景下,医学统计学教育是否能够与时俱进,迎接大数据带来的机遇与挑战?为此,笔者谈几点思考:
1.补充和加强数学基础和计算机应用课程
在大数据背景的冲击下,统计学教育首先要面临两大冲击。一是大数据背景下的统计模型将会跳出原有的传统统计模型框架,需要更广泛的学习一些数学概念,如拓扑、几何和随机场,这些数学知识将会在庞大数据分析的背景下扮演重要的角色。二是算法和计算机上的实现是传统教育面对的更大挑战,大数据环境下的数据是海量的,同时又是结构化、半结构化、非结构化的混合数据,处理这些技术需要先进的计算机技术平台。在大数据和信息化的时代背景下,在目前医学生的通识教育中,是否应该加强数学基础及计算机应用等相关课程的教育?值得思考。
2.渗透大数据基本知识和统计思维
统计思维的培养,是提高学生处理数据和运用数据分析实际问题能力的重要一环。在大数据时代,并非所有的医学健康问题都通过大数据方式去处理,基于小样本的分析仍然是最基本和最有效的实现方式。因此,传统统计学基础和原理仍然为医学统计学教育的核心和重点。与此同时,结合大数据技术的特点,对统计学的基本知识进行拓展教育,有计划地将大数据的统计分析思维渗透在教学工作中。将大数据的基础知识,如数据来源、数据结构和格式、收集和筛选,在教学中进行适当补充。引导学生将已有的统计学基本原理和方法运用到大数据处理中。
3.扩充实验教学内容,夯实基本软件操作
统计学是一门处理数据的方法学科,重在应用。因此,在系统统计原理教学的基础上,更加侧重实践性和应用性的训练。在目前的统计学教学中,学生普遍比较缺乏的不能将医学实际问题正确的转化为统计学问题,不能根据资料根据资料的设计类型、性质和分析目的灵活选用合适的统计分析方法。通过综合性的实际案例,将医学科研中的实际问题纳入教学,使学生虚拟的置身于科研一线,去感受和完成科学研究中的统计学应用。大数据时代,数据、资料的产生方式发生了很大变化,因此,需要增加部分大数据方面的数据、资料收集和整理方法的训练内容。大数据背景下,数据中除了一些结构性数据外,更多的是半结构和非结构化数据,很难用传统的二维数据表显示方式予以直观化。因此,除了目前常用的统计图、统计表外,还应该逐步补充一些比较复杂的数据透视化技术方面的教学,如探索性可视化描述工具、Tableau、TIBCO和QlinkView以及叙事可视化工具等。
在大数据时代,在统计学的教与学中,不应要求死记有关概念、定理和计算公式,而应加强统计学基础性原理与知识的教学,凸出统计学理论与方法的应用性,建立起大数据统计思维。学习统计学是为了应用和解决实际问题。对教师来说,教好医学统计学的标志是教会学生运用统计思维思考问题和选择合适的统计方法解决实际健康决策及健康管理问题。对学生来说,学好统计学的标志是建立统计思维,能够以问题为导向,在统计思想的引导下,选择合适或最优的统计方法,或者通过创新统计方法,有效地解决实际问题。
大数据已经成为助力互联网+发展的重要手段,成为创客实现梦想的必经途径,其已经成为我们生活中不可缺少的一部分,大数据正在以一种前所未有的态势推动着各行各业的发展,其蓬勃发展的态势也标志着大数据时代的来临。
统计学时展
一、引言
大数据时代以迅雷不及掩耳之势席卷世界,在全球范围内掀起了前所未有的数据革命浪潮。相对于政府单位的统计数据来说,大数据主要利用的是多层次、多样化的数据采集方式,整合了多种数据的开发优势,并且利用现代科学技术手段和高速处理以及信息架构数据等资源,兼具极高的使用价值和判断决策能力。一方面,统计调查数据的多样化发展趋势和电子商务产业的不断发展,为统计数据的使用方式和生产方式制造了不小的麻烦,不断地挑战者政府部门数据管理系统和统计数据的概念。另一方面,信息技术、网络发展以及空间信息技术的不断进步,为统计生产力的升级发展提供了广阔的视角和空间。数据量急剧增长的电子化、信息化和产业化数据,都成为了统计数据发展的重要来源。种类不断增多的“大数据”资源,正在成为政府统计部门利用研究的重要领域。
二、大数据与统计学的区别
统计知识在大数据的利用研究中有多样化的应用形式,主要是对“大数据”进行肢解,对爆炸增长的数据信息进行搜索、分类以及整合主要依赖于统计学。因此,大数据的相关研究在一定程度上运用了统计学的知识。但是,大数据的使用尚未被统计学这门学科充分利用,这主要是因为大数据的运用方式,使用模式和统计学之间存在着重要差异。统计学主要利用的是样本统计资源,样本主要在根据既定的概率标准从总体中抽样调查,但是随机抽样调查是带有成本属性的,例如消耗时间、资本投入的成本等。在样本数量逐渐增加的情况下,样本估计的误差范围是伴随着总体样本数量的增大而逐渐增加的,这是样本统计学不能忽视的缺点。大数据时代最具代表性的就是海量的信息数据化以及即时电子商务信息,大数据在整体上呈现出“总体样本数据化”的趋势,这样的特征恰好可以补充样本统计的弊端。大数据环境下的整体样本统计即使可以囊括全部的样本容量,但是因为很多情况下数据具有非结构性和半数据化的特征,而且大量的数据资源呈现的是重视尾部分布的状态,方差、标准差等标准化的方法变得毫无意义,整体依靠性和不稳定性经常会超越经典时间内的时间序列的整体假设性,所以概率论的应用范围呈现狭窄化的发展趋势。因此,统计学在利用大数据进行样本统计的过程中,可以对整体上的数据资源进行融合和选择,这和样本统计中的数据化处理技术存在异曲同工之妙。
三、大数据时代统计学教育的发展
1.全面培养人才素质
统计学专业的学生需要具备良好与人交往能力。统计学的学生很多都是理科出身的学生,不善于交际。但是在日常的工作中,有数据经验的科学家应该经常和每个部门的工作人员交流,协同工作。怎么样才能让颇具专业性的数据分析结果让普通的老百姓也可以读懂,让每个部门的工作人员都能无障碍地理解,这是不容易做到的。要训练自己的交往能力和沟通技能,主动地参加演讲活动是不错的渠道,演讲活动锻炼了演讲者的自信,在整个演讲的过程中,能否清晰地表达自己的思想以及给人以信服力是至关重要的。需要培养数据常识,广其见闻。数据科学家经常面对各种各样的海量数据,并需要从这些数据中挖掘出有价值的信息,这就需要数据科学家具有强烈的数据敏感性。对数据的敏感程度的训练不是一蹴而就的,要经过长时间的积累和数据分析工作的磨练,同时也可以根据阅读数据分析材料积累阅历,提升对数据资源的敏感程度。
2.培养应用型人才
大数据时代培养的数据科学家需要两方面的基本素质,第一是概念性,也就前面所说的数据科学家需要掌握的基本素养和专业知识;第二是实践性,也就是本文中我们提及的应用型人才,也就是实际操作中处理数据的能力。在高校开展大数据分析研究生学科,最大的问题是没有可用的数据,这就需要高效与大数据企业合作,进行研究生的联合培养,注重学生的实际操作能力,这里面涉及到我们的应用统计学专业硕士的双导师培养制度,一名校内导师一名校外导师,校内导师注重学生的概念性,校外导师注重学生的实践性,学生通过在校外导师单位的实习,从而熟悉并且掌握实际工作中所需要的技能。
3.促进统计与数学、计算机学科合作
“大数据”时代需要的海量数据分析资源仅仅凭借统计学科单一学科的发展是不能满足发展需求的,大数据的数据结构性特征已经抛弃了传统意义上的数据分析模式的非智能化框架,而且数据分析需要利用新型的数据运算方式以及计算机技能分析,这也是进行数据分析工作的拦路虎。所以,数据科学家的成长仅仅依靠单一的统计学科知识的学习是远远不够的,其需要的是数学、计算机和统计学三门学科融合发展,紧密结合。三门学科之间交叉发展,融会贯通,这样既可以发挥学科的优势资源,同时也能弥补其他学科的弊端。
四、结语
数据信息的爆炸式增长使我们在使用统计数据处理信息时需要更多的数据资源,更有甚者,在很多情况下可以利用全面化的数据,数据资源不再是制约统计分析的唯一因素,大数据前提下的统计学效用和粘合度预测的准确程度不断提升,而且可以发现诸多在样本统计基础上未能显现的细节。统计学关键优势就是“见微知著”,也是统计学在数据环境下的约束性妥协。在海量数据汹涌袭来的年代,充分发挥统计学的优势,和大数据资源整合发展,实现“以小见大”和“由繁入简”的有效结合。
摘要:我们已经进入大数据时代,统计学作为处理和分析数据的科学,必然受到大数据的影响。目前我国统计学专业课程设置和教学内容改革还处于探索阶段,统计学教育现状存在亟待解决的问题,统计学教育的改革势在必行。本文在分析大数据时代特征的前提下,分析了我国统计学教育的现状与挑战性问题,讨论了统计学教育改革的内容、方法、借鉴和适应时代要求的变革问题。
关键词:统计学;教育改革;大数据
一、引言
最早提出大数据时代到来的机构是全球知名的麦肯锡咨询公司,该公司在一份研究报告中指出:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来”。
大数据是随着互联网技术的广泛应用带来的数据量和数据类型激增而衍生出来的一种现象,但大数据一词不仅指规模大、种类多的数据集,还包括对这种数据集进行采集、处理与分析以提取有价值信息和直接创造价值的技术构架和技术过程。大数据的第一个特征是数据量巨大。截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。第二个特征是数据类型繁多、异构性突出,包括网络日志、音频、视频、图片、地理位置信息等等。第三个特征是数据价值密度较低,数据中存在大量重复性和无价值性信息或噪声。如何通过强大的计算技术和统计分析等方法迅速完成数据的价值提纯,是大数据时代亟待解决的难题。第四个特征是处理速度快、时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。
目前,不同的学科领域对大数据概念有着不尽相同的解释,但各种解释中大致可以从两个方面去理解。首先,大数据概念体现在数据量的巨大、种类的众多及产生速度的飞快,同时产生的数据集极有可能包含着各种半结构化和非结构化数据;其次,大数据概念还体现在对数据进行处理的手段和流程方面,由于数据量的庞大和类型复杂,利用常规的统计软件已经无法对当今的数据进行及时有效的存储、分析及处理。因此,所谓的大数据并不是单纯指数据流量的巨大,还指其结构的复杂和种类的多样,在数据处理和分析上需要采用高端计算平台或高级统计软件,以及海量数据中存在着可挖掘的潜在的大量价值信息与知识。
近年来,随着高速计算机的应用、信息技术的快速发展,特别是云计算技术的发展,使大数据的存储和分析技术得到迅速发展,目前的核心技术有MapReduce、GFS、BigTable、Hadoop,以及数据可视化等。在数据搜集上,可方便地通过在线互联网数据库获取二手数据或一手实时数据。在数据分析上,传统统计学方法采取的是基于统计模型的样本数据分析,而大数据分析技术则是通过高端计算平台,对大数据中的信息进行挖掘。
统计学作为对数据进行处理和分析的科学,必然受到大数据的影响。在大数据时代,统计学教育必须与时俱进,跟上时展步伐。近年来,有不少文献讨论了大数据环境下我国统计学教育的改革问题(例如[1]-[5]),本文在分析大数据时代特征的前提下,进一步讨论我国统计学教育的现状与挑战、统计学教育改革的内容、方法、借鉴和适应时代要求的变革问题。
二、统计学教育的现状与挑战
2013年,教育部对我国统计学专业设置进行一次新的调整,将原来的既可授予理学学位,也可授予经济学学位的统计学专业划分为统计学、应用统计学和经济统计学三个本科专业[6]。根据教育部高等学校统计类专业教学指导委员会2013年11月公布的数据,当时全国有194所高校开设了统计学专业,156所高校开设了应用统计学专业,164所高校开设了经济统计学专业[6]。目前,全国开设这三个统计学专业的高校个数和在校学生人数与2013年相比都有不少的增加。
面对大数据时代,我们目前的统计学教育无论在培养目标和教学内容上,还是在教育方式和人才培养模式上,都存在着亟待解决的挑战性问题。例如,在专业培养目标和人才培养过程中,我们比较重视课程层面上的评价,比较轻视专业层面上的整体评价,缺乏对学生综合能力的反馈机制。
关于教学内容,目前三个统计学专业在统计理论和应用统计两个方面有不同的侧重。统计理论主要包括:抽样理论、实验设计、估汁理论、假设险验、决策理论、贝叶斯统计、半参数和非参数统计、序贯分析、多元统计分析、时间序列分析、小样本理论和大样本理论等。在数据分析中,现今的统计方法基本以结构化数据为主要处理对象,而对非结构化和半结构化数据的分析和工具涉及较少。因此,现今统计学课程及内容已不能满足从事非结构型和半结构型的大数据研究和商业应用对人才培养的需要,必须进行必要的改革。
对于教育方式,鉴于大数据时代要求,统计分析人员需要具备较高的数学和现代统计学基础,具有较高的软件操作能力,掌握一定的大数据收集、整理、分析、处理和挖掘数据的技能。日本学者城田真琴认为:“数据科学家要有计算机科学专业背景,数学、统计方面的素养和使用数据挖掘软件的技能,善于利用数据可视化的手法展现晦涩难懂的信息,而且具备相应的专业知识、眼界和视野,具有适应社会发展和创造价值的能力”。现今的统计学教育方式还不能很好适应大数据时代数据科学人才培养需要,必须进行必要及时的调整和变革。
对人才培养模式,大数据时代不仅要求培养具有数据处理和分析所需的基本素质与技能,更重视培养从海量数据中发现和挖掘价值信息、把握市场机遇、创造利润的潜在能力。面对大数据时代的诸多挑战,现代统计技术、数据挖掘方法、计算机信息技术、软件工具和理念的日新月异,培养统计人才的教育模式也需要相应变化,统计学教育只有与时俱进,主动做出全面的调整和变革才能适应新时代知识进步和激烈人才市场竞争的需要,积极迎接大数据时代的挑战。
大数据时代对统计学教师有更高的要求,统计学教师需要与时俱进,跟上时代步伐。随着互联网、物联网、云计算等信息技术的发展,对数据的分析和处理的技术也随之要求更高,统计学教师固有的知识体系已不能满足培养现代统计人才的需要,必须进一步深化和更新原有的统计学理论知识,而且还需要学习掌握计算机技术、互联网、数据库和信息科学等有关知识和技术,同时还要熟悉处理非结构型和半结构型数据的知识和技能,以适应现代统计学教育对教师的知识结构和基本素质的要求。
大数据时代对统计专业的学生也提出了更高的要求,他们不仅需要掌握现代统计理论、统计方法和专业统计软件,还要学会如何分析、处理来自互联网或各种实际问题中的海量数据,如何利用统计软件和互联网技术进行数据操作,如何借助软件技术和统计准则判断数据质量,如何进行模型选择和评价模型方法的有效性,如何准确清晰地呈现统计分析结果和结论,等等。
2014年11月,美国统计学会了统计学本科专业指导性教学纲要 [7],该教学纲要对统计学专业提出四个方面的要求:(1)具有扎实的数学和统计学基础、强大的统计计算和编程能力,熟练使用统计软件和数据库;(2)分析来自现实问题的真实数据,真实数据是统计专业教育的重要组成部分;(3)掌握多样化的统计模型方法;(4)具有通过语言、图表和动画等方式解释数据分析结果的能力。美国是统计学教育和人才培养最先进的国家之一,该指导性教学纲要代表着美国统计学专业培养人才的基本要求和发展方向,对我国统计教育的改革具有重要的参考价值。以该指导性教学纲要为参考依据,对照我国目前的统计学本科专业教育,无论是在培养目标和课程设置方面,还是在教学内容和教学方法方面,都存在着亟待解决的挑战性问题。
三、统计学教育的改革
大数据时代的统计学教育不仅是各种统计方法、数据挖掘方法和信息技术手段的延续或发展,更主要的是这些方法的集成应用和在实际数据分析中的真实体验。过去,企业数据库价格昂贵,在统计学教育的教学案例或实验课教学中,很少采用真实和海量的数据库资源,基本都是采用过时或虚拟的数据。今天,像百度大数据引擎这样的数据库的逐步对外开放,将有助于开展“线上大数据统计实验”教学。为了适应大数据时代要求,有必要利用网络资源以及各种数据处理软件,搭建线上大数据分析实验教学平台,全面开展大数据统计实验教学的改革。实际上,借助大数据分析平台,本科阶段的统计学教育就可以融人联机分析和数据的可视化教学。其次,要时刻关注大数据分析理论的进展,及时将新理论新方法融入课堂教学内容。
需要指出的是,在大数据时代,经典统计理论和方法并没有过时,但需要进行改进和进一步发展。这是因为,网上采集的巨型数据集往往存在大量的重复性和无价值数据信息,使得大数据价值密度降低。在对这些数据进行分析处理之前往往需要通过去噪、分层、截断、聚类等方法的预处理,将其变成便于进行分析处理的小数据,继而借助于经典统计方法进行分析和处理。因而在大数据时代仍然需要采用传统统计学的小样本理论和方法。所以,即便是在大数据时代,经典统计方法仍然是进行统计分析的基石,其核心地位不可动摇。所以,在大数据时代仍然要强化统计学的基本理论和方法,尤其是在长期发展和实践应用中经过验证的、成熟有效的经典和现代统计方法,在大数据时代仍然没有过时,但需要结合大数据分析的需要对经典统计方法进行必要的发展和改进。
大数据科学需要统计学与数学、计算机等学科的结合。亚马逊大数据科学家John Rauser 认为:“数据科学家是统计学家和计算机工程师的结合体”。为了满足大数据时代的要求,统计学专业的课程设置需要进行必要的调整。应根据新时代人才培养的要求,增设与大数据前沿领域发展相关的课程,如计算机网络和大数据相关的软件应用,同时要加大实验课和社会实践课的比重,引导学生理解和掌握大数据概念、理论、技术和方法,培养其运用大数据的相关分析工具解决实际问题的能力。对于理论课程,除基本统计理论外,还应开设一些较为现代和深入的课程,如现代贝叶斯方法、神经网络、数据挖掘、应用随机过程论等。另外,还应开设与大数据分析相关的关联规则、决策树、机器学习、支持向量机等课程。
为了培养与时代适应的统计学人才,统计学专业教师应不断更新自身的知识结构和价值观念,改变认识数据、收集数据和分析数据的思维,主动学习和补充互联网、现代数据分析技术、数据库和数据挖掘技术,使自己的知识体系不断更新和提升,跟上时展的步伐。
在大数据时代,要注意培养学生适应社会的能力。统计专业人才培养模式应以提高本专业学生数据分析方面的能力,开阔他们的视野,培养其适应社会的能力。应积极引导学生进入实训场所动手操作和锻炼,尝试以企事业单位的财政、金融、保险、统计、咨询和信息公司等部门为主构建专业性教育实践基地。鼓励学生到大数据相关的机构部门、产业园区和企业中去调查研究和实践。此外,统计专业应积极同其他专业进行合作,联合培养适应新时代要求的数据分析人才。鉴于大数据对数据分析人员在计算机技术、行业认知、业务知识、数据分析工具和方法的要求提高,统计学科应主动与计算机、经济学、管理学等相关学科合作,培养学生的计算机能力、专业素质和业务修养。
“它山之石可以攻玉”,关于统计学专业的课程设置,可以参考和借鉴美国统计学会公布的统计学本科专业指导性教学纲要。根据该教学纲要,统计专业的课程设置应该涵盖五个模块[7]:(1)统计方法与统计理论。建立统计模型并对模型的输出结果进行评价,熟悉统计推断,能够从数据分析中得出恰当的结论。(2)数据操作和统计计算。熟练使用一款专业统计软件进行探索性数据分析,发现和清洗数据中的错误记录,具有编程能力和算法思维,可以进行各种数据操作,还应掌握统计计算技术,能够进行模拟研究。(3)数学基础。熟练掌握微积分、线性代数、矩阵论、概率论和数理统计的基础知识。(4)实践训练和表达能力。具有良好的表达和交流能力,善于通过图示和动画等听众易于理解的方式展示分析结论,并且具有团队合作精神和项目领导能力。(5)特定领域的知识。掌握特定应用领域的知识,并用统计学特有的思维方法来分析和解决特定领域的实际问题。
大数据时代是以数据为中心的时代,统计学专业的教育改革必须适应这个时代的要求。统计数据分析中软件应用能力至关重要。在众多统计软件中推荐使用R和SAS软件,因为R是免费开源软件,其统计建模、统计计算和可视化功能强大,更新迅速,是最新统计方法的主要平台,非常有利于培养学生的编程能力和知识更新能力,而SAS软件被很多公司用于数据管理和数据分析,在实际应用领域具有长期而深远的影响,是数据分析不可或缺的专业统计软件。当然,教学中也可以尝试使用其他专业统计软件,例如经济统计专业学生也可使用SPSS软件,但最好会使用SAS或R软件。在加强软件使用和编程能力的基础上,应加强学生统计计算和统计模拟能力的培养。在大数据时代,强调统计计算的重要性是大势所趋。统计模拟技术是伴随着高速计算机和信息技术的快速发展而广泛应用的现代技术,可用来解决传统学科领域中无法解决的问题。例如,在计算技术飞速发展的今天,贝叶斯统计方法过去曾经面临的计算瓶颈正在逐渐消失,基于马尔科夫链蒙特卡洛(MCMC)技术的统计模拟方法在数据分析中的强大威力正在日益显现[8]。
摘要:移动互联网技术与信息技术的飞速发展加快了大数据时代的来临,而大数据时代的来临在给统计学带来更多发展机遇的同时,也给统计学带来了更多严峻的挑战。为帮助统计学有效应对这些挑战,本文对大数据时代给统计学带来了的挑战及大数据时代背景下统计学应采取的有效改革策略进行了详细的探究。
关键词:统计学;大数据时代;挑战;改革
前言
在这个信息爆炸的二十一世纪,大数据几乎无处不在,交通行业、图书馆、高校学生档案管理、企业财务数据、地方文献等等都是拥有庞大信息量的场所。大数据的产生与发展使得统计学挑战与机遇并存,传统统计学方法已不适用于大数据处理,难以满足大数据处理需求,而大数据处理分析需要以统计学为基础。所以对大数据时代下统计学所面临的挑战进行研究具有重要意义。
一、大数据时代给统计学带来的挑战
大数据时代给统计学所带来的挑战是多方面的,但集中表现在数据的生产、处理与应用方式上以及统计学教育方法、内容和人才培养上。在统计学中,数据的生产主要是通过相关统计部门,如社会保障机构等开展相应的统计工作来获得统计数据,对于数据的预处理方式主要是数据清洗、数据矫正、数据填补等[1]。而在大数据时代中,对于数据的获取则是借助先进仪器设备如传感器、测量仪等来实现的,数据处理是通过各种软件,编写数据库实现的。
二、基于大数据时代背景下统计学的改革策略
1.提高统计人员综合素质
大数据时代背景下,统计学工作的开展与进行对统计人员素质提出了更高的要求,只有统计人员具备较高的道德素质、职业素质才能帮助统计学较好的应对大数据时代给统计学所带来的各种挑战[2]。从企事业单位和高职高校教育机构两方面入手:企事业单位应定期开展岗位培训工作与思想道德教育活动,增强统计人员专业技能,提高统计人员思想认识,鼓励统计人员不断学习新的统计知识理论,掌握新的统计方法,熟练新型统计工具的操作流程,在企业内部为统计人员工作营造良好统计氛围,促进全体统计人员素质全面提升。对于高校等教育机构,应重视起对统计学专业学生素质的培养与提升,从学生入学开始,从大一开始,在统计学专业课教学过程中,为学生营造良好的课堂氛围,加强教师对学生的引导与教育,通过对统计学专业课程的不断学习与统计学专业理论知识的不断掌握,加深学生对统计学的认识与理解,帮助学生充分意识到统计学是一门需要细心、耐心与专心,需要迎合时展,依据社会实际需求来进行学习的一门专业,从而让学生形成自主意识,以主动方式来不断提升自身素质[3]。
2.加强统计人员对新技术的掌握
大数据时代之下,新的数据处理技术、分析工具、处理设备不断出现,这些新的数据处理技术与工具,对于统计学来说既是一种挑战也是一种机遇,挑战是因为统计人员对这些新的技术与工具还不够了解,还没有掌握这些新技术,机遇表现在这些新技术可以成为推动统计学适应大数据时展的有利支撑[4]。但前提是统计学人员对这些新技术有足够的了解与掌握。所以,基于大数据时代背景下,统计学的改革还需要重视起对统计人员新技术的培训工作,加强统计人员对新技术的学习与掌握。企业应积极引进新型数据处理技术与设备,并以专题讲座、培训、实训等方式为统计人员提供学习的机会与平台,通过他们对新数据处理技术的学习使统计学更好的服务于大数据时代。
3.加快统计学课程教学改革
高职高校等教育机构应与时俱进,跟随大数据时展脚步加快统计学课程教学改革,摒弃传统落后的教学理念、方式方法,完善统计学教学设备设施,改善统计学教学环境与教学条件,引进先进统计学教学方法,并在实际改革过程中将统计学教学内容和教学方法与大数据充分融合,使统计学教学内容与教学方法与大数据处理分析相协调、相适应[5]。统计学课程教学改革,包括课程改革与教学改革两部分,只有从课程和教学两方面来对统计学进行改革,才能真正提高统计学对大数据时代的适应性,才能使统计学更好的应对大数据时代带来的各种挑战,更好的把握大数据时代带来的发展机遇。
对于统计学课程改革需要按照新课程标准要求,对课程教学模式、课程目标、课程结构安排,课程内容规划等进行有效整改,进一步提高课程结构安排的合理性,课程目标的科学性与课程内容规划的完整性,保证统计学课程重点突出。对于统计学教学改革,需要教师提高自身教学水平,转变教学理念,采用新的教学方法,构建科学的教学模式,重视实践实训教学,提高学生实践操作能力。
三、总结
综上所述,大数据时代的来临是时展的必然趋势,统计学应客观看待大数据时代给其所带来的各种挑战,并从统计学教育、企业统计人员等各方面来提高统计学对大数据时代的适应性,促进大数据与统计学相互协调发展,充分把握与利用大数据时代给统计学带来的机遇,让统计学成为推动大数据处理与分析的有力工具,大数据时代成为加快统计学教育改革的高效平台。
[摘 要]由于科技进步,大型网络电商不断兴起,博客、微博、微信等社交平台逐渐建立,庞大的数据量随之出现,大数据时代到来的信号已经发出。随着大数据时代的来临,统计学受到了重大的冲击。因为传统的统计学教育主要应用抽样技术,即在总体中随机抽取部分数据样本进行处理、分析。然而,随着大数据的兴起,数据量不断增多,数据的总体性不断强化,对统计学人才的要求也越来越高。所以,在大数据时代下,统计学的发展受到了制约。但另一方面,大数据也给统计学的发展提供了一些机遇,促进统计学的改革创新。为了促进统计学的发展,培养出更多适应大数据时代的新型统计人才,本文对统计学在大数据时代面临的机遇、挑战和发展趋势进行了系统的研究。
[关键词]统计学;大数据;机遇;挑战;发展趋势
统计学是指通过应用数学以及其他学科的专业知识,来搜索、整理、分析、评估数据,从而达到推断、预测所研究对象的未来发展情况的一门综合性学科。随着大数据时代的来临,全球的数据量急速增长,这使在短期内完成收集、整理、分析数据的任务,变得十分困难,同时也影响到了统计学的正常教学。但是,大数据时代也为统计学提供了众多的数据研究对象,为统计学的发展提供了一个良好的平台。在这个平台上,统计学遇到了许多机遇,比如:统计学科体系得到延伸。在大数据时代下,只要相关人员把握住这些机遇,顺应大数据的脉络走向,那么统计学的发展趋势必将趋于良好。
1 统计学在大数据时代面临的机遇
1.1 统计学应用范围的增大
以往传统的统计是根据所要研究的问题而去收集相关数据,再进行整理、分析、最后得出结论。这种统计,一方面,无法保证收集到的数据即是所需要的数据,也就是说数据的时效性得不到保证;另一方面,在大数据时代下,数据量巨大,欲收集到某一方面的代表性数据或者全部数据是十分困难的一件事,这就导致相关人员的工作量巨增,工作压力增大。然而,在大数据时代下,统计学不仅仅根据问题研究数据,还根据数据挖掘其背后的信息。这一研究方向的转变意味着大数据带给统计学新的机遇。随着社会的发展,许多新型产业应运而生,但是多数人不了解这些产业的运营情况以及促进这些产业发展的奥秘。在大数据背景下,通过分析、研究新型数据往往可以解开一个产业的“秘密”,或者是将数据涉及的信息全面地展现出来,从而促进相关产业的发展。因此,统计学应用范围的增大对产业的发展具有重大意义。
1.2 统计效率的提高
传统的统计在收集数据方面,常常会出现数据滞后、失效等情况,而在大数据时代下,数据量大,数据的更新速度快,因此,收集到的数据的质量得到了大幅度提升。不仅如此,在大数据时代下,数据及时性的特点,给数据收集提供了极大的便利,比如:相关人员可以定期进行数据收集,这样不仅能减少工作量,还能确保数据的时效性和准确性。另外,在统计的过程中,数据多样性的特点,给数据分析提供了极大的便利,比如:大数据可以被反复应用在不同方面的研究中。因为,数据的多样性就决定了数据应用范围的广泛性,特别是在数据的统计方面。因此,统计数据时就不该将数据局限于一种用途,而应该深度挖掘数据的应用价值,将数据应用于各类相关的研究方面,从而达到降低相关人士的工作量、控制统计成本、提高统计效率的目的。
1.3 统计学科体系的延伸
在统计学中引入大数据,虽然会给统计学带来一些挑战,但是同时也会给统计学带来机遇。现今,大数据逐渐进入统计学科,数据的庞大性使样本统计中的样本选取和标准确定受到了极大的影响。再加上,在大数据时代下,数据具备总体的特征,简单的抽样调查无法满足新时代对统计的要求。因此,传统统计中的样本统计会朝着总体统计的方向发展,统计学科体系将会成为样本统计与总体统计齐发展的体系,以此掩盖样本统计中的不足,保证统计的有效性。
2 统计学在大数据时代面临的挑战
2.1 样本选取及其标准确定的难度增大
样本统计是现今统计学中最重要的统计方法,统计学正是通过运用该方法对客观事物的数据展开数量特点及数量间关系的研究。样本的选取和其标准的确定,是考察样本统计是否具备价值的重要依据。随着大数据时代的来临,样本选取和其标准的确定,变得越来越困难。一方面,大数据意味着数据量不仅十分巨大,甚至大到超乎想象,而且数据还有分散性和多样性的特点。这使在选取样本的过程时,收集数据的难度系数将变高,标准将很难界定,工作量将加大;另一方面,在大数据背景下,人们面对海量数据,不会只想知道出现这些数据的原因,还会想了解这些数据代表的涵义。这不仅改变了传统统计对数据的诉求,还迫使统计学进行改革、创新。另外,随着众多电商和社交网络的兴起,互联网上的数据量不断增多,其研究价值也越来越高。但是,网络数据大都属于非结构化数据,而统计学研究的是结构化数据。因此,在运用样本选取方法的过程中,难免会错失很多有价值的数据,使样本选取不够全面。总之,大数据时代给统计学带来了挑战。具体的挑战体现在:能否将非结构化数据转化为结构化数据和是否能找到准确分析非结构化数据的方法。
2.2 统计软件及统计方法欠缺
统计软件是基于计算机运算环境下,信息计算机技术迅速发展而研制出来的。它主要用于提升统计学的数据分析和处理的效率,提高一般性的统计实践操作质量,并通过设置统计模型来简化统计的复杂操作。在大数据时代,常见的统计软件有Eviews、SPSS、SAS、Stata等,但是这些软件要运用于大数据,在存储、传输方面还有欠缺,它们还需要得到进一步的完善和升级。可是,完成升级、完善统计软件的任务相对困难,并且无法与互联网、电子商务等公司相提并论。另外,在大数据背景下,数据不仅具备海量化,多样化的特点,而且其获取途径众多,因此,分析、研究数据变得困难,再加上,我国的统计方法相对欠缺,所以,统计学在大数据时代下面临着挑战。
3 统计学在大数据时代下的发展趋势
3.1 加大应用型统计教学力度
统计学和其他理论型学科不同,它是一门实用性极强的学科,无论是非统计学人士,还是统计人员,或多或少的都需要掌握统计学的应用方法和技巧。在大数据时代,数据具有多样性、总体性、分散性及海量性等特点,因此,欲从数据背后得到精确结论,必须对所研究数据进行全面且精准的统计分析。另外,根据大数据的这些特点,不难看出,新时代对统计人才的要求越来越严,对统计学教育也更加重视,因此,在统计学教学过程中,加大应用型统计的教学力度必不可少。应用型统计是指轻理论、重实践的统计教学。这种教学类型,在提高学生的实践操作能力,帮助积累实践经验,掌握统计技巧方面,具有重大意义。教师加大应用型统计学的教学力度,主要从三方面入手。第一,加大数据收集的教学力度。收集数据是统计的基础步骤,也是初步判断统计结论是否有效的参考因素。就某种意义而言,只有加强对数据收集的教学力度,才能保证学生在大数据时代下,能收集到保质保量的数据。第二,加强数据整理的教学力度。由于,在大数据背景下,收集到的数据具有多样化、海量化的特点,所以如何高效地整理这些数据成为一大难题。正因为如此,才在高校中呼吁教师加大对数据整理的教学力度。第三,加大数据透视的教学力度。数据的透视是指通过数据透视化技术,来使非结构化数据直观化的一项教学内容。因为在大数据时代下,会出现许多非结构化数据,而传统的统计方法只能统计结构化数据,所以,加强数据透视的教学力度,有助于提高统计的高效性,帮助培养统计人才。
3.2 提高大数据统计思维
无论是在传统的统计学教育中,还是在大数据时代下,统计思维一直都是教师着重培养的一方面。良好的统计思维,不仅能提高学生收集、整理数据的能力,还是将理论有效地付诸实践的重要保证。从另一角度看,如果统计人员不具备统计思维,那么在海量的大数据下,就无法准确分辨出所需的数据,也就无法高效地完成工作。传统的统计思维包括平均思维、变异思维、普遍联系思维、动态思维等,面对大数据时代下,数据的混杂性和总体性,提高统计思维还需注重培养学生的大数据统计思维。大数据思维不仅具备容错性和复杂性,其还强调数据之间联系和注重相关数据间的分析。
3.3 加强基础性统计知识教学力度
现今,统计学教学现状不容乐观,学生在学习统计学时,普遍会出现基础知识薄弱,畏难情绪较严重的现象。为了改善统计学教学现状,缓解大数据时代下统计学的危机,教师应加大基础性统计知识的教学力度,确保每位学生都能掌握良好的统计学知识,从而促进统计学的发展。由于统计学中的概念、公式较多,而且较抽象,学生不易理解,所以,教师要尽量做到深入浅出,保证学生准确掌握相关知识。但是,不是所有教学内容都可以做到深入浅出,所以,教师应重视基础知识的教学。只有在学生对统计学的基础概念、公式、原理等都充分了解的情况下,才能为后续的学习打下坚实的基础,才能提高后续教学的效率。大数据时代的到来,促使统计学进行改革。在改革后,统计学的教学要求更严,教学内容更深,所以,不具备良好的统计学基础是无法完成学业的,更无法促进统计学的发展,培养出新型统计学人才。
3.4 重视复合型人才培养
统计学不仅能为数学、物理等学科提供数据分析方法,还在生活、经济等领域具备重大意义。以前,数据简单化,来源较单一,所以对统计人才的要求并不高。然而,随着大数据时代的来临,统计人才不再是单纯具备良好统计知识的人,而是复合型人才。在大数据时代下,许多数据比较混乱、庞杂,只有具备良好的编程技能、统计能力的人,才能将其收集、整理为有价值的数据。在大数据时代下,行业间竞争十分激烈,数据的统计工作也变得十分艰辛,只有具备大数据专业知识,超强的数据分析、处理能力的人,才能在这个时代具备强大的竞争力。在大数据时代,统计不是单纯的加减运算,只有具备统计思维、数据甄别能力、计算机专业技术的复合人才,才能高效地进行统计工作。因此,在大数据背景下,培养复合型人才十分必要。
4 结 语
统计学作为教育阶段最重要的学科之一,不仅能促进物理、数学等学科的发展,在推动政府的情报决策、工商业的发展方面也具有重大意义。地方政府在进行市场经济的宏观调控、指导、规划等方面离不开统计,也只有对数据开展精细的分析、统计工作,才能得到更具说服力、更具价值的结论,实践于生活中才更有利。而且,在人口普查、环境评估等方面也会经常运用到统计学。由此可见,统计学十分重要。虽然,我国的统计学教学现状不容乐观,在大数据背景下,统计学还面临众多挑战,但是,相关人员更应看见其中的机遇,把握好时机,共同努力,携手推进统计学的发展。
【摘要】随着信息技术的不断发展,大数据的时代已然来临,大数据对人们的生活生产都产生了巨大的影响。大数据给统计学的发展也带来了许多挑战与机遇,基于大数据背景下的统计学在当前不断地发展。本文对大数据和统计学的概念进行了分析,对大数据时代下的统计学进行了详细的介绍,并提出了一些大数据时代下的统计学的未来的展望。
【关键词】大数据统计学应用
大数据,主要是指庞大的数据资讯,由于其数据之庞大,人们不能利用当下主流的软件在一定时间内对其进行提取、分析从而帮助决策者决策的资讯;统计学,主要是对数据进行分析、整理,再以较为直观的方式呈现出数据的特征,以供人们、参考、决策。随着信息技术的不断发展,当今时代已是大数据的时代,大数据在全世界范围内都得到了不同程度的发展,传统统计学由于自身具有的单调性,被人们将其与大数据紧密结合,并且在各个领域中加以利用。大数据时代下的统计学应用已经成为了一种发展的潮流。社会在不断发展着,信息也在不断地进步,许多人都开始注意到数据的重要性。就目前的情况而言,实用的数据很多,我们可以对其进行利用,从而提高生产力的发展水平,并且解决一些民生方面的问题。因此大数据时代的统计学应用十分重要。
1统计学与大数据的简单概述
1.1统计学概述及其性质
统计学是一门主要对数据进行收集并通过直观的方式将其表现出来的一门科学。在传统的统计学中有两种主要的统计方法,即推断统计和描述统计法。在推断统计中,主要是通过对已知样本进行推断,推断出总体参数,将推断出的数据用概率的方式表示出来。描述统计则是对所收集的数据进行处理,将其结果用统计图等图表形式直观地表现出来。
统计学有包含如下几个基本性质:
统计学的主要目的是对数据进行研究。统计学所研究的数据并不是抽象的,而是客观真实存在的数据。这些数据有大有小,可以是微观的粒子,也可是广阔无垠的宇宙;甚至可以追溯至远古时期的人类发展以及未来的发展。
统计学的主要研究方法是归纳与推断。统计学主要通过对样本数据进行延伸,将其上升至整体,从而得出一般结论。也就是我们所说的通过现象对其本质进行研究。这个方法主要是有小到大,由个体到整体。
统计学的研究结论往往是不确定的。在统计学中对数据的提取主要是通过抽样进行的,抽样数据并不是整体数据,它只能代表整体数据的一部分。因此,不可避免的,统计学研究结论会带有不确定性,这也是传统统计学中不可避免的缺点。
统计学最重要的特点是其联系范围的广阔性。在大部分学科中,以及人们的生产生活中,脱离不了数据,而数据必须要通过统计才能发挥其作用,因此,统计学与各个学科联系紧密,也与人们生产生活息息相关。
1.2大数据的产生与发展
当今时代是互联网高速发展的时代,也属于信息发展的时代。由于信息量的庞大,不可避免地会出现各种各样的数据。大数据就是信息高速发展的产物,它包括了各种各样数据的交汇,它不是传统意义上单一的数据。我们可以将大数据看成是各种数据的集合,通过对各类数据进行整合、交叉运用,在云计算基础上对数据进行处理和运用,并且形成一种可供我们利用的智力资源和强大的知识服务能力。
大数据虽然数据量大,但是价值密度低,数据类型多且复杂,但是处理的速度快,这也是大数据的四大特点。从中我们不难看出大数据十分注重对海量数据的处理,在预测方面具有十分的优势。与目前拥有的其他技术相比,大数据所具有的“速度”“廉价”“优化”这三个方面所综合起来的成本是最低的。在我们的生产生活中,大数据给我们提供的可量化维度是以前所不具有的,它对我们的生活生产带来了许多方便,在新发明和新服务方面起到了不可替代的作用。
大数据不仅给我们带来了机遇也带来了挑战。大数据的数据量之庞大,有更多的数据需要我们分析,传统的抽样方法已不再适用。在大数据面前,对数据精度的要求有所减少,进而更加注重对整体信息的获取;我们也由之前注重事务之间的因果关系转而注重事务之间的相互联系,从中获取对我们更具价值的信息。
目前,在我国许多企业中对大数据利用的能力还不足,产生了效率低、成本高、耗能高等问题。如何对大数据进行利用并推动企业发展是我们当下所面临的问题,在大数据背景下,对海量数据进行高效合理的利用对未来大数据的发展十分重要。
1.3大数据的研究动向与信息问题
1.3.1大数据的研究动向
当前,国外一些机构对大数据环境下的发展提出了一些极具挑战性的问题。比如如何对高度分布的数据资源进行处理,对数据来源的追踪,对样本的核实等等。他们在大数据的处理方法上进行了改进,开发了一系列的算法。在我国,也十分重视对大数据的研究。对大数据的研究还专门召开了会议进行讨论,国家设立了专项的研究计划,设立了专项的研究基金。而大数据最终的服务对象是广大的企业,因此,在企业方面也开展了合作计划。大数据的研究并不能只依靠单一的统计学,其他学科也应该重视大数据对自身学科发展的影响。在计算机领域,相关的计算机人才除了掌握扎实计算机技能,也应该对大数据有所掌握。计算机与统计学关系紧密,因此,计算机领域在大数据与统计学中也扮演了重要的角色。
1.3.2大数据的信息问题
当今时代是数据信息的时代,大数据所包含的数据量十分庞大,人们需要对这些数据研究就必须将这些数据相互融合起来。将数据融合就需要清楚数据的来源以及如何对这些数据进行获取的。在获取数据的过程中,数据的来源复杂并且数量庞大,不可避免地就会出现一些问题。比如原始数据遭到破坏,因为大数据主要注重对数据整体的获取,因此,在某些数据上出现问题在所难免,甚至所取得的数据不是原始数据,而是经过分析推断后的预测数据。因此,我们要引起足够的重视,重视数据的获取,避免取得一些遭到破坏的数据。
另一方面,在大数据的获取过程中也很容易造成数据的缺失。而数据缺失的最直接的结果就是影响数据的分析。有些不同领域的研究却需要相同的数据,这就造成了数据的重叠,比如经济和保险,两者分属于不同的领域,但是在具体的研究过程中某些数据的利用是相同的。在我们对数据进行分析时,要特别注意两个方面的数据。一方面是观察得到的数据,另一方面是实验得到的数据。这两个数据所包含的具体信息是不同的,但是却仍然会使得一些人对数据产生错误的认知。这是因为数据本身是具有特定的范围的,我们对数据进行收集的同时,实际上也就确定了这一属性,所以当我们需要一些超出这个范围的含义就需要我们对这些数据进行推断。
2大数据时代的统计学的具体应用
2.1大数据时代的统计学在企业中的应用
在企业的生产、经济活动中,统计学都占据着十分重要的地位。企业通过对统计方法的利用,建立了风险监测体系。但是单纯运用传统的统计方法是远远不够的,企业往往会将大数据与统计学相互结合,从而对公司进行实时的监管。在企业的生产活动中,涉及了许多方面的数据,包括各个月份、各个季度的总体收入,各个具体项的收入情况,整体支出情况、具体项的支出情况等等,这就包含了十分庞大的数据量。因此,在企业中往往利用大数据对整体的数据进行把握,在根据统计方法进行分析、总结,以此对企业进行实时的监管,并建立了相对完整的风险监测体系。
2.2大数据时代的统计学在农业中的应用
农业的生产与我们息息相关,我们可以以水稻为例,对其进行具体的分析。影响水稻产量的原因有许多,气候、土壤、环境、营养等都是影响水稻产量的重要因素。但是由于技术的发展,水稻在全国范围内十分广阔地种植,利用传统的统计学方法势必不能对影响水稻产量的因素进行很好的分析。但是将统计学与大数据相结合,却能够对影响其产量的原因进行很好的把握。当前,由于科学技术的发展,我们可以对水稻的种植环境进行各个方面的监测,比如土壤、水分、养料等,从而得到一系列的数据,这些数据数量庞大并且数据种类繁多,传统的抽样方法不能够对其进行整体的把握,只有对整体数据进行分析,将其原因进行统计才能真正得出影响水稻产量的因素。这是大数据时代的统计学在农业方面的典型应用,通过对整体数据的把握,并对其进行统计分析,从而得出我们想要的结果。
2.3大数据时代的统计学在其他学科方面的应用
大数据给人们的生产生活都带来了影响,各行各业的劳动者也纷纷通过对数据的利用来带动行业的发展,通过对数据的利用达到解决问题的目的。随着科技的发展,我们在出行之前会习惯性地对交通、天气等状况进行查询。事实上,我们所利用的这些软件都与大数据和统计学息息相关。交通状况主要是对该路况进行实时的监测,比如人流量、车流量等,通过对这些数据的实时监测,再将其进行统计分析,得到具体的交通状况,并且以直观的图表方式呈现给我们。还有我们都十分熟悉的翻译软件,我们日常的学习中,会使用到一些翻译软件,实际上这些翻译软件也和大数据、统计学息息相关。在这些软件当中,储存了十分庞大的词汇量,当我们使用翻译功能是,会统计出最常用的句子,并且按检索次数呈现出来。这些都是大数据下背景下的统计学的应用,这些应用都给我们的生活带来了便利。
3统计学在大数据时代下的机遇与挑战
3.1统计学与大数据的联系十分紧密
统计学主要是对数据进行研究,通过对数据的研究分析进而得出结论。在统计学中,研究的数据范畴十分广,包括定量数据、定性数据、截面数据、实验数据等等,都是统计学所要研究的数据对象。而大数据就是各种数据的集合,它包含了各式各样的数据类型,简单的、复杂的。统计学与大数据都主要是围绕数据进行展开的,这是统计学与大数据之间的一种内在联系。因此,我们可以将统计学与大数据相结合,改变传统统计学中对数据抽样研究的方法,转变成对整体的数据进行研究,从而得出更能为我们所利用的研究结果。
3.2大数据使传统统计学得到改进和补充
传统的统计学中,在对数据量大的数据处理中存在着明显的不足,其数据处理过程中,往往存在滞后性和低频性等问题。我们以经济学里的消费物价指数,也就是CPI为例。我们所得到的CPI报表中,往往在时间上存在着一定的滞后性,本月的CPI数据只能在下个月才能得到相关的数据报表。由于时间上存在着滞后性,许多政策的制定都会受到影响,不能根据情况及时的做出调整。而大数据就随时提供当前阶段的“价格指数”,对市场进行实时的监测,它的时间频率甚至甚至可以小到以天为单位,提供每天的价格指数。借助大数据,可以对市场价格进行实时的监测,我们可以对市场价格作出合理的调节,从而减少出现通货膨胀和通货紧缩的情况发生。我们可以利用大数据对信息全面掌控和对总体覆盖的优势,对数据进行全面地分析,从而补充传统统计学中的不足。
3.3统计学思想在大数据时代中的转变
在当前的统计学中,由于整体数据量庞大,我们往往会通过样本对整体进行分析。在这一过程中,往往十分重视样本数据的精确程度,传统统计学重视样本的数据的精确程度。而大数据往往相反,大数据呈现的是一个整体,由于整体数据十分庞大,对于其数据的精确程度势必不能很好的把握,因此,大数据重视整体数据的情况,对于其样本精确程度并没有做很高的要求。在大数据中,我们的立足点是整体数据而不拘泥于某个样本,看中的也是整体数据所呈现出来的价值,大数据中“样本即是整体”的概念与传统统计学重视样本的概念不同,大数据的这一整体概念对统计学的思想有着十分重要的影响。
3.4统计学与大数据互相促进,共同发展
当前所处的时代是大数据发展的时代,大数据的发展十分迅猛,这给统计学的发展带来重大的影响,使统计学的发展具有划时代的意义。传统的统计学通过样本对整体进行把握,大数据对其进行突破,通过对整体数据的把握,得出一系列更具效益的结论。而在统计学中,其对数据的细致分析,准确推断,对统计理论的应用和掌握也十分值得借鉴。只有将二者进行结合,才能发挥更大的作用。我们应该充分利用大数据所带来的巨大信息量,运用统计的方法对其进行整体感知,在大数据时代的发展中,迎接它所带来的机遇和挑战。只有将大数据和统计学进行有效的结合,才能给我们的生活生产的发展做出贡献。
4结语
一个新事物的到来,必然会对传统的事物产生影响。大数据时代的到来也对统计学产生了深刻的影响,大数据给统计学带来了新的生命力。目前很多学科的发展都融入了大数据的潮流之中,作为与大数据联系紧密的统计学如果不进行改革创新,那么终将会被边缘化,阻碍自身的发展。大数据给统计学带来了挑战,但是不可否认的是大数据也给统计学的发展带来了机遇,我们在抓住机遇的同时还应该意识到传统的统计学中,一些方法已经不能满足当今数据的分析。基于这一现状,统计学家不能盲目将传统的数据环境当成研究的目的,而是应该积极融入到新事物当中,迎接挑战,使大数据时代下的统计学能够得到更好的应用和发展。
摘要:大数据给应用统计学专业带来机遇与挑战。本文针对应用统计学专业的自身特点和大数据下的新特点,剖析了现有教学体系中存在的问题,探讨和改革了应用统计学专业人才培养目标定位、课程调整与设置、教学内容、教学手段等。
关键词:大数据;应用统计学;教学改革
一、研究背景
自2002年桂林理工大学在广西开办了第一个统计学本科专业以来,针对当时理学学位的统计学专业培养的学生虽然数理基础相对扎实,但普遍统计思想不够,实际应用能力较弱的现状和特点,对统计学专业进行了全方位的改革研究,确立了"数学与统计学相融,从培养学生扎实的数理基础和极强的统计分析应用能力有机相结合的理念出发,构建了新的课程体系和教学内容,取得了系列研究成果。2009年研究成果开创“应用性、实验性、案例性”一体化的统计学专业课程体系和教学模式,获得广西高等教育自治区级教学成果二等奖[1],并在其后分别把统计学学科建成广西重点学科和广西高等学校优势特色专业,以及把应用统计实验室建成广西高等学校重点实验室。
虽然我校统计学专业的教学改革和建设取得了许多成果,但近几年,我们也逐渐感觉到在大数据新形势下,我校应用统计学专业的教学体系还有一些不适应的地方,且某些问题还有日益凸显的趋势,我们原来的某些研究成果已不再适应新时代的要求,这就迫使我们继续进行改革研究,探讨在大数据背景的新形势下,如何培养统计学专业复合型和应用型人才,如何准确把握统计学的发展方向与发展形势,如何调整人才培养模式,如何调整相关课程和课程内容,以培养适应大数据背景下社会经济发展需要的统计学专业人才。
许多国家越来越重视数据在大数据时代重要作用,我国也不例外,2012年9月,国家统计局第7次局务会提出,尽快开展在政府统计中应用大数据的研究。2013年可以看作是我国政府统计之大数据元年。2015年9月《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)[2]颁布,标志着我国正逐步进入大数据建设的新时代,为此,国家统计局积极推动大数据在各方面的应用与实践。而大数据的核心是数据,应用统计学学科是与数据分析处理联系最为紧密的应用性学科,因此,应用统计学专业的教学体系应顺应大数据发展的趋势。在大数据背景下,应用统计学专业在继承传统数据分析技术的基础上,对所需的数据处理技能提出的需求更高了。这就是说,大数据对应用统计学的培养目标,以及教学内容等的冲击无疑是最大且不可避免的,这给应用统计学专业带来了巨大的挑战,同时也为应用统计学学科的发展带来了前所未有的机遇。
大数据逼迫人们改变分析、处理数据的手段、思维和理念,这就逼迫应用统计学专业改革必须引入新手段、新思维和新理念。培养应用统计学人才必须与时俱进,才能不断适应大数据新时代的要求,这关系到应用统计学专业培养的人才能否适应和满足社会的需求,因此,这一研究是十分必要、十分迫切且有着重要的理论和实际应用意义。
二、大数据背景下应用统计学专业的改革探讨
1.培养目标的转变。大数据时代给应用统计学带来机遇与挑战,同时引发了对应用统计学培养目标的新思考。目前应用统计学专业教学体系的培养目标是,培养学生收集、整理和分析数据的能力的“应用型”专业人才。然而,在大数据背景下,除了要求学生具备数据收集、处理和分析的能力外,还要对其应用领域的背景知识有所了解,这就要求应用统计学培养“复合型”专业人才。因此,如何从培养“应用型”向“复合型”人才进行转变,是在大数据背景下应用统计学专业培养目标必须解决的首要问题。在定位应用统计学专业的人才培养目标是培养“复合型”专业人才后,就得重新探索教学体系的调整和设计。传统的应用统计学专业教学体系专业的主干课程有数理统计、抽样技术与方法、回归分析、计量经济学、多元统计分析、统计软件等。而在大数据下,强调对全数据开展分析,不需进行随机抽样,即不是在给定的精确下,利用样本推断和分析总体;同时,大数据注重数据之间的相关关系,而不是像传统统计那样强调数据之间的因果关系。现有的教学体系没有涉及这些内容,与大数据时代的要求有些不相适应。因此,我们必须创新传统的应用统计学专业教学体系,重视大数据的不同的分析方法、分析技术,在课程设置、教学内容等都要围绕着数据的分析方法和技术展开。
2.教学内容改革探讨。虽然在大数据时代下,必然要对数据收集、分析方法等进行改革和创新,但与此同时我们也清楚地意识到,对大数据的搜集、分类、分析等都仍需要依赖传统的统计学方法,因此,大数据分析离不开传统统计学,大数据分析是对传统统计学的补充而不是替代,建立在样本统计和预测分析之上的传统统计学仍发挥着主导作用。所以,在应用统计学专业的改革中,我们强调深化基础,培养拥有厚基础、宽口径的学生。加深应用统计学基础理论知识学习,夯实数学基础知识,让学生学好数学分析、高等代数、概率论、数理统计等基础课程,打好理论基础,通过这些课程的学习不但打好学生的数理基础知识,培养他们的抽象思维能力和逻辑推理能力,因为只有理论基础打牢了,才有后劲,才能更好地学习新知识,适应新形势下的要求。同时,在大数据背景下,应用统计学专业课程教学要培养宽口径的统计学复合型人才,由于一些大数据充满了各种随机的、非随机的误差和偏倚,不满足传统的统计方法和理论对数据的苛刻要求,不能用传统的统计方法进行分析。因此,必须对现有的应用统计学专业的课程体系、教学内容等作出相应的调整和改革。这就需要对应用统计学专业课程内容进行协调和整合,在精选知识、内容衔接与交叉融合上狠下工夫。探索在一些课程中,增加介绍一些大数据方面的概念和应用,例如在时间序列分析、多元统计分析、统计预测与决策分析等课程内容中引入大数据分析的理论和实践案例。大数据对统计学专业人才提出了更高的要求,除了应具备数据收集、处理和分析的能力以外,还应具备很强的自我学习、自我提高的能力,以适应大数据时代数据量大、总类繁多、时效性高等发展特点。这就要求学生自主学习、阅读大数据等相关资料,掌握国内外最新动态和进展,这可通过布置课外作业、课外读书报告和课外论文检查学生自主阅读学习的效果。同时,特别要注重课程的开放性教学和研究,以适应大数据时代的要求。(1)样本概念的深化。全样本(总体)研究是大数据方法的重要特点。过去,由于缺少收集和分析数据的各种工具,数据收集、处理能力受到限制,因此,产生了随机抽样的理论方法,从而达到用较少的样本推断、预测总体的目的。然而,大数据时代数据收集、处理的方式和技术都发生了翻天覆地的改变,现在我们可以通过数据库、互联网、各种通讯工具等获得各种各样的海量数据。这时,随机抽样在某些情况下就失去了它原有的意义、地位和作用。方便、廉价的数据收集,数据处理、存储能力的提高,使得全数据分析模式成为可能。因此,大数据背景下不需随机抽取,可用总体进行分析,也可用与分析目的相关的数据进行分析。所以,在大数据时代,传统应用统计学面临着新的任务和挑战,首先要改变对样本、对不确定性等的重新认识,转变抽样调查的功能和地位,建立新的收集、梳理、分类数据的方法。大数据的分析和处理与传统样本数据的分析和处理的方法有许多不同,传统的统计学的理论和方法是以随机样本来推断总体,即它的理论和方法几乎都是建立在样本的基础上的,是建立在随机抽样基础之上的统计推断,其理论基于"样本数据-分布理论-概率保证-总体推断",这种用样本推断总体的理论和方法,不可避免的会出现误差。而大数据时代的特点是信息处理迅速、获得途径广泛、价值密度低,这样在处理数据时就不需要进行随机抽样,可以全体数据作为样本,而即大数据关注的不是随机样本,而是总体,这不同于传统的统计推断分析,大数据时代可以收集全数据进行分析,这一特点刚好能弥补样本统计必然会带来误差的劣势。因此,应用统计学应该补充、适应大数据时代的全数据分析模式,将大数据总体统计的思想、思维和方法纳入到教学体系和教学内容,从传统的样本统计转向样本统计和总体统计相结合,这是应用统计学发展的必然趋势。探讨在什么课程、如何引入全样本统计尤其重要。我们研究实践了在抽样技术与应用等课程教学中,新增大数据背景下的全样本理念,阐明样本统计和总体统计的差别、如何搜集大数据,以及大数据样本常存在缺乏代表性、信息冗余、存在噪声、呈现重尾分布、长相依和不平稳性时如何选用合适的统计分析方法,以尽量避免分析结果的系统偏差等。(2)相关分析与因果分析并重。在传统统计分析中,因果关系占据重要的地位。我们可以根据概率P值进行因果关系检验,从而确定两个变量之间是否存在着显著的因果关系。即传统统计分析是建立在假设的基础上揭示数据相互之间是否存在因果关系,因此,传统统计分析比较注重因果分析。但大数据时代由于数据海量、结构复杂、要求数据处理速度快等特点,造成因果分析往往不可行。而相关关系分析不需要建立在假设的基础之上往往可行,且相关关系分析不易受偏见的影响而发生错误。因此,大数据改变了传统统计注重因果关系检验的思维,注重相关关系分析,而不是因果关系分析,大数据时代的重要特点是注重相关分析,以及建立在相关分析基础上的预测分析。侧重相关性研究的思想是大数据方法的重要特点,大数据时代相关分析方法的重要性日益凸显。大数据时代,相关分析的运用范围之广、重要性之大引起了我们的重视和研究,我们在教学中从传统的注重因果分析向相关分析与因果分析并重转变。传统的相关分析基本上是线性相关分析,大数据研究的相关分析不仅是线性相关,更多的是非线性相关关系。传统的统计研究方法,如建立各种回归方程、估计模型参数、假设检验等因为大数据的特点而无法实施。针对大数据的相关关系分析不同于传统的相关关系的分析,我们在教学中重点不是做传统的逻辑推演,而是重点阐明如何搜索、分类、归纳、分析大数据,以及如何找出数据之间的相关性并据此进行预测。阐明大数据时代相关分析思维的重要性,以及相关分析在特征选择、变量依赖关系识别中的实用性。
摘 要:随着科学技术的迅速发展,大数据时代来临,从科学角度看,大数据通过对信息的整合分析处理,形成快捷全新的数据分析方法,这为大数据与统计学架起互通的桥梁。大数据时代的变革为统计学发展起到了重要的推动作用,未来挑战与机遇同在。文章首先对大数据时代下的统计学做出概述,接着陈述统计学在大数据时代影响下的变革,再次分析大数据时代下统计学面临的挑战,最后解读大数据时代下统计学的发展与机遇,以期为相关领域的研究提供有价值的参考。
关键词:大数据时代;统计学;发展
一、大数据时代下统计学概念概述
教科书上对统计学给出了这样的定义“有效搜集整理分析随机性数据,对考察问题给出推断与预测,最终为行动提供数据支持”,这就是统计学。从根本上看,统计学是一门与数据有关的学科。众所周知,美国总统奥巴马通过数据团队的帮助得到连任的机会,阿里巴巴的马云很早就把大数据作为企业发展战略。随着我们走进大数据时代,网络科技给搜集数据带来方便,传统的设备已经无法容纳大量的数据,我们对其进行更新,通过对大数据的分析,我们为社会传递出有效的、有价值的信息,这一切为社会的发展起到了不可替代的推动作用。
统计是社会各界乃至各环节不可或缺的因素,在商品交换过程中,统计有先导作用,市场经济信息也需要统计学的帮助,大数据时代,我们的统计数据不再局限于随机抽样调查,电话调查等高成本的搜集方式,通过互联网及移动终端,我们可以获得更多数据样本,可以说我们的社会进入高速发展的时期,大数据时代下的统计学也进入全新的发展阶段。
二、统计学在大数据时代影响下的变革
1.从样本的角度看,样本概念得到深化
我们知道统计学离不开样本,有效的样本能够正确反映情况,大数据时代样本概念与传统不再相同,通常我们得到诸多网络数据,一种为静态,即直接在客户端创建的数据,无需提取即可使用,成本低,另一种为动态数据,即数据随着时间的推移而变化,最终表现为所有数据的总和,可见此时的样本不局限于随机抽样,直接可以做选定分析。
2.从类型方面看,呈扩大之势
在过去数据通常指结构化数据,有固定的标准,大数据时代数据不仅局限于固定的结构,还有异构数据,再有存储方式也发生了改变,大数据可以直接将探测的信号容纳进去,由网络系统作为工具,可以识别各类结构或非结构的数据并进行快速存储。
3.收集概念得到扩展
传统的统计过程中,我们有目的的进行数据收集,效率低,成本高,随着大数据时代来临,我们将收集步骤化,第一预先处理好数据的识别与处理,第二做好分析,提炼出所需要的信息,最后做好存储,就这么简单。面对大量的数据,我们的分析、识别等都需要注意,大数据不代表万能,我们还是要注意数据的安全性,尽量控制收集成本。
4.数据来源较传统不同
曾经我们根据研究目的去做统计收集数据,这些数据源都是已知的,在核对方面相对容易。大数据时代,我们得到数据变得容易,但通过互联网收集数据后,目的性变弱,大多数记录没有源头,很难识别记录身份,可见,大数据时代做好数据来源登记开始变得重要。
5.量化方式也发生变化
对于传统的结构化数据,量化方式是成熟的,可以将收集到数据直接分析得出结果,大数据时代,很多异化结构数据几乎无法做直接分析取得结论,当下,很多结算及专家在研究处理非机构化数据,力争将大数据时代统计推向新的高端。
6.分析思维发生改变
从分析过程看,传统分析需要进行三步走,即定性、定量,最终定性。大数据时代,统计分析过程仅需要两步即定量、定性;从证实分析方面看,传统思路为假设、验证,事实证明传统证实分析有很大误差,而大数据时代,我们的思维为发现,总结,这是整合,发现最终定论的过程,在此过程中会有很多发现。
7.统计软件变得越来越多
传统统计学中,我们比较熟悉的软件有SPSS、SAS、STATA等,大数据时代,我们分析技术为非关系型,主要以数据中心为基础,将软件与大数据结合,分析过程得到很大简化。综上,大数据时代给了我们更多的主动权,这些更促使我们推动大数据时代统计的发展进步。
三、大数据时代下统计学面临的挑战
大数据时代给我们带来了更多的好处,统计学的大数据化是大势所趋,但传统与更新的交错间还有一些不相容的方面,对于革新我们还是要从各个方面做谨慎考虑与慎重调整。
首先从样本标准的角度看,大数据时代我们可以轻松得到很多样本,此量大到可以视为总体,随着互联网科技的不断发展,大样本标准也应随着发展,传统统计学将界限定在30,大于30为大样本,小于30为小样本,大数据时代这个界限略显低,没办法清除干净干扰信息,这会影响分析结果,因此,加强数据来源的同时还要更新大样本标准,将更大规模的样本数量代替旧有的数量,以适应大数据时代的要求。
其次从样本选取与形式的角度看,传统统计学固定结构化数据内藏着一定的统计规律,尽管我们能够发现研究对象的数量关系,但并不是所有的事物都有量化指标,一些被量化的指标也不一定能够清楚的解读研究对象,目前大数据采集数据超过80%为有结构数据,传统的统计数据库没有办法对这些数据做很好的处理,而大数据通过建立非结构数据库,对数据做有效转化,发挥多元化分析作用,无形中降低了样本的选取标准,将统计范围扩大化。
最后统计软件的开发是一项挑战。我们常用的统计软件主要以构建模型之间的变量与数量关系的方式分析研究对象,如我们熟悉的SPSS等。大数据时代,我们很多以数据为基础做非关系分析技术,谷歌利用MAPREDUCE实现了月处理400PB数据的工作量,雅虎也利用云计算平台实现了100PB的存储工作,未来大量的数据处理需要更快捷更科学的软件,对于软件的研发与升级将是一种挑战。
四、大数据时代下统计学的发展与机遇
1.大数据时代下统计质量更高
从国际数据标准SDDS中得到的统计质量标准可以看到,适用、准确、时效、平衡是统计质量的内涵。其中适用是指统计信息符合要求,统计信息最大化的满足客户的用途,大数据的覆盖很大程度上促进适用功能的提升;传统角度我们说时效性主要指统计的时间更短,让客户及时了解统计信息,大数据时代网络化完全满足时效性各类要求;准确是指估值与真值之间的差别,数据中存在误差在一定范围内属于正常,大数据时代我们的全面性最大程度包容了误差,也缩小的了误差,统计更加真实可信;平衡性也被称之为协调性,大数据时代,数据结果的核对与检验都经得起客户的不断核查,可以使数据的平衡性得到很大提升。
2.大数据时代统计成本降低
首先,从数据收集角度看,大数据时代可以不再依靠人力做电话调查或问卷调查,甚至有些普查动用全国力量,耗费大量人力财力,通过互联网、移动通信等,我们大大降低人力成本,数据收集快,成本低,准确性也高;其次从数据利用角度看,传统统计过程中,一旦资料过期就需要再起启动抽样分析过程,对外公布手段也有局限性,大数据时代,我们收集数据更轻松,且数据可多次被利用,综合比算,数据的成本大大降低。
3.大数据时代统计学作用范围扩大
传统统计学有各种局限性,比如受成本、观念等影响,统计学主要用于行业与部分统计,随着大数据时代的来临,统计学被应用到各行各业,比如、金融、医学、计算机行业等,从这个角度看,社会的新计划让信息传递发生质变,统计学作用价值得到认可并服务扩大,这样推动自身发展的同时更服务社会服务人民,为整个国家发展进步起到不可估量的作用。
摘 要:随着社会经济的迅速发展,科技信息技术的进步,大数据走入了我们的日常生活,大数据的统计与分析影响着各行各业的发展。因此,对大数据的统计显得格外重要,在大数据时代研究统计学的发展也显得尤为重要。
关键词:大数据;统计学;发展
由于科学技术的不断发展,大数据席卷了全球,各行各业在经营管理中都离不开大数据的统计与分析,对于政府单位来说,大数据更如经常便饭,大数据主要利用多样式和多层次的采集方式进行数据采集,在分析数据时利用现代科学技术手段和高速处理数据的信息系统,分析的数据结果为公司或者政府单位的决策做参照。大数据的发展给统计学不仅带来了机遇,更重要的还有挑战。一方面信息技术和网络科技的发展为数据收集和整理带来了便利,另一方面由于近几年电子商务的迅速崛起,数据量更加的繁杂,所以又给数据统计时带来了麻烦,种类不断增多的大数据资源,正在成为政府统计部门分析研究的重要领域。
一、大数据与统计学的区别
我们就大数据自身而言,要想在信息化迅猛发展、数字爆炸式增长的现代信息平台中寻找到自己想要的有效数据,就必须依靠数据统计来完成。这就充分证明了关于大数据的相关研究是要和统计学紧密的联系在一起的。但是其与统计学也存在巨大的差别,它的使用模式和运用方式是不一样的。统计学需要依靠样本抽样的方法来进行数据整体和提炼的,这就意味着会有人力、物力以及财力的投入,其成本相对于大数据来说是比较高的而且过程是相对比较繁琐的。而大数据主要依靠网络信息平台,在海量的电子数据信息中查找自己所需要的数据,具有来源广、数据量大、整体性的特点,其是以整体的数据作为一个大样本进行工作的,数据相对于统计学来说更加的精确化及标准化。因此,统计学和大数据的结合过程中,要充分发挥大数据全面性和统计学高效性的特点,在利用统计学进行大数据样本的统计过程中要对整体的数据资源进行选择和筛选,这样能避免样本统计的弊端,还可以把样本统计的优势发挥到极致。
二、大数据时代下统计学教育的发展
(一)培养全方面素质人才
统计学专业的学生与文管专业的还不一样,文学专业的以及管理专业的学生都比较善于交际,善于沟通,而统计学是理科专业,很多学生只善于埋头做题计算,这样的话在以后的工作岗位就会感觉吃力,因为做数据统计,必须要与其他部门学会沟通,协同工作这样才能把数据统计和分析的准确。要锻炼自己的交际能力和沟通能力,针对不同数据信息做出不同的沟通与交流,从数据中挖出有价值的信息,需要本身具有数据敏感性,但是对数据的敏感程度也不是先天所带来的,更不是一朝一夕就能锻炼出来的,而是要经过时间的积累和数据分析工作的磨练,同时也可以根据案例型的数据分析材料,积累阅历,提升对数据资源的敏感程度。
(二)培养统计学专业的应用型人才
大数据时代下培养的统计学应用型人才应该具有两方面的基本素质,第一是概念性的,也就是说统计学的相关人才应该掌握统计学基本理论知识和基本素养,这是基本要求,也是培养统计学人才的前提。第二就是实践性,也就是本文中我们提及的统计学专业的应用型人才,就是在实际操作中处理数据分析数据的能力,应用型人才需要利用理论知识解决实际问题,也需要有较多的经验与阅历,不能只会纸上谈兵。在高校开展大数据分析学科中,最大的问题就是没有真是可用的案例和数据,这就需要学校与公司企业走合作道路,这样一来不仅可以得到真实有效的数据,还能将学生送到企业去实习,进行校企联合,注重学生的实际操作能力,这是培养统计学专业应用型人才的关键点,也是统计学专业人才培养模式中的重点。
(三)促进统计学与信息计算科学的融合
在大数据的分析与研究时,仅仅凭借统计学科的支撑是不够的,大数据的数据结构性特征已经抛弃了传统意义上的数据分析模式的非智能化框架,而且数据分析需要利用新型的数据运算方式以及计算机技能分析,这也是进行数据分析的问题所在,因此要想做好数据统计和数据分析工作,只单单依靠单一的统计学科知识的人学习是远远不够的,其需要的是数学,信息技术,统计学三门学科的融合发展,紧密结合三门学科之间的交叉发展,融会贯通,利用各科优势资源相互弥补不足,这样才能为大数据的收集,统计,分析做出科学准确的结果。
三、结语
学习统计学的优势在于:我们可以利用统计学进行大数据的有效整合和利用,使得我们在使用数据时可以更加的便利和高效。随着信息科学技术的进一步发展,来自各方面的数据出现井喷的状态,这就增添了我们在数据统计和信息处理时的困难。在现在这个信息化数据爆炸式增长的形势下,我们要充分全面的利用各方面的数据资源才能充分发挥统计学的优势,做好预测和分析,同时充分将统计学的优点与完备的大数据资源实现有效的整合,让统计变得通俗易懂。
摘要:随着大数据时代的到来,统计学专业教育教学将面临大数据的信息与识别、大数据的数据产生方式与抽样方法、大数据的统计整理与统计分析等方面的挑战。中西部地区二三本高校统计学专业教育教学,在院校构成与专业方向、学历教育层次、学生培养规模、学科建设、师资力量、课程设置与教育教学手段等方面具有自身的特征和不足,与大数据时代的发展方向和需要存在较大差距。为此,应注意从以下五个方面进行改进和完善:普及大数据知识,积极引导学生认识和熟悉大数据;认清教育教学与大数据之间的关系,正确定位专业发展目标和方向;改革和创新现有课程设置,丰富和完善计算机与统计软件类课程;提升统计学专业授课教师的职称与学历,革新知识容量和结构;加强统计专业教育教学的组织支持和制度保障。
关键词:大数据;中西部二三本高校;统计学专业;教育教学
一、前言
随着大数据时代的到来,大数据已成为变革组织、变革经济和变革价值的力量。鉴于大数据发展对经济社会和生产生活的影响愈加深入,我国高等教育领域和统计学专业领域的相关专家学者进行大量的思考,并形成一些思想和成果。但是,有关大数据时代背景下统计学专业教育教学的研究成果相对较少。从研究主题和关注领域来看,不同学者的研究成果差异较为明显,但大致可以分为以下几类:一是大数据时代统计学面临的机遇与挑战;二是大数据时代背景下统计学教育教学应该如何改革和创新;三是高职院校统计学教育教学领域中某一问题;四是其他一些具体或个别问题。从研究结论来看,大数据时代的来临,统计学研究方法、统计学专业教育教学方式与内容、教师知识结构、人才培养模式与方案等,均面临诸多挑战,同时也会带来变革与创新的机遇。
与多数著名财经类高校和一本高校相比,我国中西部地区不少二三本高校在师资力量、专业建设、学科建设、人才培养方面,还存在不少缺陷和不足。所以,作为与大数据研究技术和方法紧密的统计学专业,二三本高校更应该对其进行认真思考和科学定位与设计,从而避免在未来更加落后和遭到淘汰。本文基于上述背景和现实需要,对中西部地区二三本高校统计学专业教育教学进行认真思考和更进一步的探讨。
二、中西部地区二三本高校统计学专业教育教学的现状
(一)院校构成与专业方向
目前,开设统计学专业教育教学的中西部二本高校主要以地方财经类院校、师范院校和部分理工类院校为主。从专业方向来看,地方财经类院校主要以社会经济统计、金融统计、风险管理与精算学为统计学专业的方向;师范类院校则主要依托数学系,一般是从概率论、数理统计、多元统计等相关课程的教学中衍生而来,通常以数理统计为专业方向;而理工类院校则以数理统计或者应用统计为主要研究方向,同时兼顾本院校的专业构成和传统研究领域,如生物卫生统计等。多数三本院校没有开设统计学专业,考虑到招生的便利性和就业前景,开设统计学专业的三本院校通常以社会经济统计、金融统计为专业方向。
(二)学历教育层次
从学历教育层次来看,多数地方财经类院校统计学专业以本科和硕士研究生层次为主,个别传统悠久、实力较为雄厚的财经类院校上升到博士研究生的层次;师范类院校和部分理工类院校则以本专科层次为主,少部分院校则开展了硕士研究生层次的教育,或者与拥有硕士学位授予权的院校开展硕士研究生的联合培养。开设统计学专业的三本院校一般会开展本科学历层次的教育,毕业后通常授予经济学学位。除了上述几类开展统计学专业教育教学的二三本高校外,还有个别省市的统计学院(学校)。但是该类院校一般隶属于省统计局,通常以国民经济统计和核算为专业方向,在较长的历史时期开展中专层次的教育,近十年来多数学校则实现专科层次学历教育的转变,只有少部分学校上升至本科层次的学历教育。
(三)学生培养规模
从学生培养规模来看,就本科学历层次而言,地方财经类高校统计学专业每年招生规模一般为100人左右,师范类院校一般为150人左右,部分理工类院校招生规模和三本院校一般为50人左右,与一本高校相比,招生规模偏小。统计学专业研究生教育,包括应用统计硕士(专业学位)和学术型研究生两大类,多数地方财经类院校开展统计学专业普通研究生的教育。目前,全国共计80余所高校开展应用统计硕士教育,中西部地区高校有31所,其中二本高校12所(包括8所财经类院校、4所师范大学),近年来应用统计硕士招生规模和学术型研究生基本持平。8所财经类院校中,西安财经大学招生规模最大,应用统计硕士招生规模和学术型研究生分别达到25人和30人,山西财经大学、安徽财经大学、江西财经大学三所院校两类研究生招生人数为20人左右,而兰州商学院、贵州财经学院、新疆财经学院招生人数为10人左右,河南财经政法大学招生人数则不足5人。4所师范类院校中,河南师范大学两类研究生招生人数为10人左右,安徽师范大学、湖南师范大学招生人数为5人,广西师范大学应用硕士招生则高于学术型研究生,两者之和为20人左右。其余的财经类院校和师范类院校研究生招生规模存在与上述学校类似的特点。
(四)学科建设
统计学专业学科建设的效果,可以通过教育部学位中心公布的学科排名和近年来中国大学统计学专业排名进行评判。2012年教育部开展第四轮学科评估,教育部学位中心公布一级学科最终排名结果。在该次统计学科评估中,全国具有“博士一级”授权的56所高校中有46所参评,还有部分具有“博士二级”授权和硕士授权的高校参加评估,参评高校共计87所。所以,最终的统计学学科排名结果显示,中西部地区有12所一本高校、23所二本高校参加该次评估,学科整体水平得分在74分以下,排在第22名之后。其中,西南大学得分为72分,居于中西部二本高校之首,山西财经大学、西安财经学院得分为70分,其余二本高校得分为69分、68分、66分、65分和64分的分别有4、4、3、9、1所高校。三本高校因为不具备统计学学科硕士授予权,所以没有参加该次学科评估排名。
此外,在2014年5月,中国校友会网公布2014中国大学统计学专业排名。该专业排名将学科专业分为4个星级(最高为6星级,最低为3星级),学科专业层次分为顶尖学科专业、一流学科专业、高水平学科专业、知名学科专业四类,办学类型分为研究型、行业特色研究型、区域研究型、区域特色研究型、专业型和应用型六类。在该统计学专业排名中,参评高校有87所。其中,中西部地区有17家二本高校参评,学科专业星级均为3星级,学科专业层次为中国知名学科专业;办学类型方面,只有太原理工大学为区域研究型,其余16家院校均为专业型;办学层次方面,太原理工大学、西北师范大学、武汉科技大学和长沙理工大学被评为中国知名大学,其余13家院校没有相应归属。除了上述排名外,中国金苹果科教评教网,也公布2012-2013中国大学本科教育统计学类专业排行榜,有94所高校参评。但是,只能查询到该排行榜前20名的高校,所以本文没有采用该结果对中西部地区开设统计学专业的二三本高校学科建设情况进行评判。
(五)师资力量
从师资力量来看,中西部地区二三本高校统计学专业仍然相对薄弱,特别是三本高校师资力量配置尤为薄弱。就中西部地方财经类院校、师范院校和部分理工类院校而言,与同领域一本高校相比,其师资力量配置比较完备,院系设置和师资规模、结构类似,差异主要体现在教师的职称结构、学历结构和科研实力方面。其中,这些差异一方面在于国家人事制度和管理体制,另一方面在于学校所能提供的薪酬待遇和教学科研平台相对有限,不能吸引更多的高层次人才。而三本高校则与同领域二本高校相比,其师资力量配置不健全,师资规模、结构仍有较为明显的缺陷与不足,与同领域一本高校相比差距很大。造成这种差异的原因除了上述两个方面外,还与三本高校对教育教学的短视和其天生的缺陷有很大关系。
目前,每个省都制定了本省《事业单位专业技术岗位结构比例控制标准》,将“教育事业单位”中的“高等院校”分为“211工程”重点建设院校、与教育部共建院校、设有博士点和其他省部共建院校、设有硕士点院校、其他本科院校、省管高等专科学校、高职高专院校、成人专科学校和技师学院等若干类。对高级职称人员所占最高比例要求依次逐步降低,“211工程”重点建设院校正高级、副高级职称所占比例为15%和30%左右,分别高于高职高专院校、成人专科学校和技师学院10~15个百分点;对中级职称人员所占最高比例依次逐渐上升但差异较小,“211工程”重点建设院校为45%左右,低于高职高专院校、成人专科学校和技师学院5个百分点左右;对初级职称人员所占最高比例则依次逐步提高,“211工程”重点建设院校一般不超过10%,低于高职高专院校、成人专科学校和技师学院仅20个百分点。国家人事制度和管理政策中关于不同院校职称结构的要求,在一定程度上对二三本高校广大教师尤其是中青年教师的晋升成为一种障碍,限制他们的职业生涯发展和提升。
中西部地区二三本高校院校所提供的教学科研平台受到局限,一方面与学校当前自身实力有关,另一方面也与教育行业所存在的歧视和潜规则有关。广大一本高校由于自身具备较强的实力,在学术、纵向科研项目申报、横向课题申请、对外学术交流方面具有先天的优势。在职称、学历和相应材料质量接近或相同的情况,相应的杂志社优先发表著名高校和一本高校教师的学术论文,尤其是一些排名榜首的期刊几乎不发表第一作者单位为二三本高校的教师的学术论文,行政主管部门和企业也优先审批这些高校的项目,从而形成明显的虹吸效应和马太效应,对广大二三本高校造成严重的歧视和不公。不少青年教师在二三本高校工作若干年之后,如果职称和学历得到足够提升之后,比如获取博士学位、博士后顺利出站和评完高级职称后,多数选择一本高校或本领域内著名高校作为新的就业岗位,从而规避和去除教学科研平台带来的限制。
高校院校所提供的薪酬待遇,一方面与学校自身所获取的教育经费、学校所处的阶段及其发展目标和方向有关,另一方面与学校所拥有的产业和创收项目有很大关系。中西部地区广大二本高校所获取的教育经费主要以学生缴纳的学费、所在省市行政主管部门划拨的财政事业经费为主,两者占教育经费总额的80%左右,甚至更高。中西部地区多数省市经济社会水平在全国处于中下游水平,财政收入规模相对较小并且增速相对缓慢,而教育经费支出占财政支出的比重比较稳定,所以中西部地区广大二本高校所能获得财政拨款增长较为缓慢,从而影响到学校发展目标的实现速度和进度。而广大三本高校的教育经费几乎全部来源于学生缴纳的学费,当前公立高校每个学生财政型教育经费提高到12000元左右,三本高校生均教育经费投入水平与公立高校相比处于劣势。随着近年来物价水平的持续上涨和人力资源成本的逐渐提高,三本高校出于生存的需要,近年来对招聘教师的职称、学历和薪酬待遇没有进行明显提升。因此,毕业于全国“985”高校、成绩相对优异的统计学专业研究生,尤其是博士研究生,综合考虑薪酬待遇和职业生涯规划的需要,就业时首选一本高校,其次是二本高校,不愿意或者不乐意到三本高校来就业,从而造成三本高校统计学专业师资规模、职称与学历结构很难得到提升与改善。
(六)课程设置与教育教学手段
从课程设置与教育教学手段来看,与广大一本高校和著名财经类高校相比,中西部地区二三本高校统计学专业基本类似和比较接近,但是三本高校的差距依然较大。就中西部地区二三本高校而言,由于师资力量和学生基础、接受能力的差异,在统计学专业不少课程尤其是专业核心课程的教学过程中,教师对课程知识、原理、方法的理解与讲解方面,与广大一本高校和著名财经类高校仍然有明显差距,从而对学生的启发与引导仍显得较为薄弱。就中西部地区三本高校而言,除存在上述类似问题之外,还存在因人设课、因事设课、变相压缩学时等现象,统计软件类课程的种类和学时量与一二本高校相比差距明显,课程设置仍然需要健全和完善。比如,本科生通常课程教学每个学时为50分钟,每学期正常上课教学时间为18周,加上两周的考试时间,一般每学期教育教学期限为20周。但是有不少三本高校在统计学专业教学过程中将每学时减少为45分钟,每学期正常上课教学时间和考试时间合计仅为18周。此外,对于一些统计学专业的专业基础课和专业核心课,不少一本高校与二本高校通常进行每周4学时的授课,选修课程的设置也突出统计学专业的特色和需要。但是,有不少三本高校则进行每周3学时的授课,因人设课现象较为严重,要么短期聘用校外兼职教师进行授课,而选修课程的设置也脱离统计学专业学生学习和未来发展的需要,不能激发学生的兴趣和求知欲,教学效果较差。
三、中西部地区二三本高校统计学专业教育教学的定位和出路
(一)普及大数据知识,积极引导学生认识和熟悉大数据
大数据是一个新生事物,全球80%左右的大数据产生于近四年。大数据正在处于推广和发展阶段,其未来的影响也会更加深远和广泛。大数据在给统计学带来机遇的同时,也带来不少挑战。统计学家、统计学专业的授课教师,必须在传统统计数据环境的基础上,积极学数据这个新生事物,学会适应新的大数据环境,从而拓展统计学的新应用领域,创造和发现适应大数据的新统计方法。就目前中西部地区二三本高校统计学专业教育教学的实际来看,不少教师听说过大数据的提法,但对大数据的概念、特征、意义、分析方法,以及如何处理大数据和大数据的未来发展方向,认识不是很清晰和深刻。所以,对中西部地区二三本高校统计学专业的广大教师而言,不但要积极学习和熟悉大数据,更重要的是利用课堂和课余时间,有计划、有步骤地向统计学专业的学生积极宣传和介绍大数据的有关概念、知识和方法,使学生对大数据有一个清晰、客观、正确的认识和观念,早日将其引导到大数据的发展之路上来。
(二)认清教育教学与大数据之间的关系,正确定位专业发展目标和方向
由上述分析可知,中西部地区二三本高校统计学专业教育主要以本科层次为主,一些实力较强的二本高校开展了硕士研究生层次的教育,个别高校开展博士研究生层次的教育。本科教育是通才教育,强调扎实地学好基础课程,为以后工作或者研究打好基础,而研究生教育则强调提高独立研究、独立创新的能力。从知识结构和层次来看,统计学专业本科生所学知识和课程的涉及范围较宽,但深度不够,而研究生层次的教育与大数据的距离更为接近,更能满足大数据分析对于统计方法和技术的要求。
统计学专业的培养目标是培养应用型统计专业人才,即培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。而对大数据进行分析,需要将统计学、计算机、数学和社会科学等多学科进行融合。因此,大数据时代,统计学专业的培养目标要转向培养复合型专业人才。这使得传统的统计学专业培养目标面临两个方面的转变,一是注重统计学与其他专业之间的融合,二是如何实现由应用型人才向复合型人才的转变。
中西部地区二三本高校由于师资力量、课程体系设置、教育投入规模等方面的不足与局限,在较短的一段时期内实现上述两个方面的转变有较大困难。根据不同学历层次教育与大数据之间的联系和自身高校的实际,当前中西部地区二三本高校统计学专业教育教学应以原先的培养目标为主,在现有课程设置和师资力量方面率先进行改革和创新,在不断夯实和提升自身实力的基础实现这两个转变。
(三)改革和创新现有课程设置,丰富和完善计算机与统计软件类课程
在大数据背景下,统计学专业课程设置应进行改革和创新,根据大数据的发展方向和要求,提升现有课程或开设新的课程。根据中西部地区二三本高校统计学专业教育教学的实际,改革和创新现有课程设置,主要从以下三个方面做起。
一是加强对数据收集部分内容的讲解与训练。就统计数据的收集而言,一般在统计学课程中的“统计调查”与“抽样与抽样分别”部分进行讲解和说明,为此,不少学校开设市场调查分析与预测或者抽样技术的课程。大数据时代,大数据的产生方式更加丰富和多样化,数据的抽样方法也发生很大变化。在当前大数据抽样技术不甚明朗的情况下,应继续加强对传统抽样方法与技术的讲解深度和训练力度,同时注重补充有关GDP核算、普查和CPI、PMI等重要指标数据抽样技术的有关知识和实践操作规程。
二是有针对性地增加计算机类相关课程。目前,中西部地区二三本高校统计学专业开设的计算机类课程主要以计算机基础课程、计算机高级语言和计算机网络课程为主,远不能适应和满足大数据对统计学专业的要求。为此,需要在课程设置中增加Office办公软件、专业数据语言等课程,使统计学专业学生具备大数据分析对计算机操作的基础技能。
三是健全和完善统计软件类课程。目前,中西部地区二三本高校统计学专业开设的计算机类课程主要为R语言、SPSS或者SAS、E-views,一般来讲,以其中两个软件的教学为主。但其存在的最大问题是软件课程授课教师相对较少,学生对软件的学习和操作训练不够系统和完备,不少学校统计软件课程只是针对基础统计学、计算经济学基础、多元统计的部分内容来进行。所以,健全和完善统计软件类课程首先体现在加强对现有统计软件所学内容的广度和深度以及训练方面,其次应增设3门以上的软件课程供学生选择和学习,加强实践操作技能的培养和提升。
(四)提升统计学专业授课教师的职称与学历,革新知识容量和结构
无论是形成大数据的思维模式和普及大数据知识,还是改革和创新现有的课程设置,最终主要靠统计学专业授课教师来开展和执行。所以,提升统计学专业授课教师的素质是关键。职称反映着高校教师在学科建设和教学科研领域的积累与付出,学历则代表着教师在专业领域和科研能力方面的突破与提升。所以,应对大数据时代统计学专业教育教学面临的挑战,实现上述途径的方式,一方面,中西部二三本高校需要提升现有统计学专业授课教师的职称与学历,改造和提升现有教师的规模及其专业结构、学历结构和职称结构,扩大计算机和数据库类课程教师、统计软件类课程教师的力量。另一方面,现有的教师尤其是专业基础课和专业核心课程的教师,要积极学数据的有关知识和方法,不断提升自身处理和解决大数据有关问题的能力。
(五)加强统计专业教育教学的组织支持和制度保障
改革和创新现有的课程设置,丰富和完善计算机与统计软件类课程,需要增加这些课程的内容和学时,并且聘用更多资历更高的教师。所有这一切,都需要在统计学专业教育教学的软硬件建设方面投入更多的资金、人力与物力,而这与学校对统计学专业学科建设与教学建设的重视和大力支持是密不可分的。为此,中西部地区二三本高校统计学专业的教育教学,在未来仍然需要继续加大投入,同时辅之以积极和良好的人事政策支持与后勤保障。所以,大数据时代中西部地区二三本高校统计学专业教育教学的革新和突破,离不开所在院校的组织支持和制度保障。
摘要:统计学是培养经管类专业学生定量分析能力的重要课程,大数据时代的到来对统计学提出了新的要求。本文围绕大数据时代对经管类专业数据分析人才的需求,以专业特色为导向,运用“知识+能力+应用”模式进行统计学模块化、层次化课程体系构建。
关键词:大数据;经管类专业;课程体系
大数据时代给社会经济发展带来了机遇和挑战,社会各行各业对数据分析需求大幅上升,需要借助数据分析实现数据的增值,挖掘数据背后的潜在价值,为其经营管理决策、投资决策提供智力支持。随着社会经济发展对具有数据管理和数据分析能力的应用创新型经济管理人才的需求逐渐攀升,也引发了对高校经管类专业学生能力的更高要求。面对纷繁复杂的社会经济环境,经管类专业学生必须能够广泛应用定量分析技术,能够从海量数据中获取有效数据,运用科学的方法从这些数据中提取出有用信息,建立相应的模型,作出最优决策。
统计学是培养经管类专业学生定量分析能力的一门重要课程,是众多高等院校经管类专业的专业基础必修课,是以后深入学习相关定量方法类课程(诸如计量经济学、管理运筹学、市场调查与预测等)的基础。因此,统计学课程体系设置是否合理,将直接影响到学生获取有效数据和分析数据应用能力的培养,进而影响学生定量分析能力的培养。
一、经管类专业统计学课程体系存在的问题
1.课程教学定位模糊。我国高等院校经管类专业统计学教学中的最大弊端在于一直按照前苏联划分方式将其归类为一门偏重于简单数据整理课程,而将相应的统计分析所采用方法和理论归为数理统计,因此在教学中不重视对后者的学习。然而,西方发达国家的统计学课程是同时包括这两个部分内容的,尤其是后一个部分内容是定量分析的重要基础。因此,在传统统计学教学定位下,学生只认识了基本理论与概念,却掌握不了处理和分析数据的能力,这与经管类专业应用型人才培养目标相背离,难以适应大数据时代社会各领域对经济管理人才素质的新需求。
2.课程体系有待完善,与经管类专业融合不够。目前,大多数高等院校经管类专业统计学课程设置只涉及理论统计学这一领域,未将统计分析方法与相关经管类专业知识有机结合。在这样的课程体系安排下,学生虽然掌握了统计基本理论和方法,但难以体会到统计在本专业学习中的应用价值,当面临现实的经济、管理问题却无能为力,不会运用所学统计方法,结合专业知识对实际问题进行定量分析。这种状况与经管类人才定量分析能力培养目的相违背,难以实现具有创新能力的经管类人才的培养目标。
因此,如能结合经管类专业特点,对统计学的课程体系进行优化建设,势必能够培养出具有定量分析技能,满足社会需求和企业需求,符合大数据时代人才素质要求的经济管理人才。
二、大数据时代经管类专业统计学课程体系构建
1.明确课程教学定位。目前,统计学教学中偏重于统计学基本概念、基本模型和基本方法的理论知识学习,系统性较强,有利于学生全面了解统计学的知识体系,但是对统计思维能力的培养和统计方法的应用重视不够,这不仅会让学生望而生畏,从而失去学习的主动性与积极性,更为重要的是学生不能够学以致用,在自己本专业深入学习过程中不会运用统计学知识来解决实际的经济管理问题,而在教与学中出现的这些问题源头在于教学定位不够准确。因此,本文提出新的课程教学定位:以应用创新型人才培养为导向,提高经管类专业学生定量分析能力为目标,结合经济学科和管理学科的特点,通过统计学的理论教学、案例分析、课程设计、实验(践)等教学环节,培养学生统计思维能力和统计应用能力,具备运用统计学理论与方法,研究社会经济管理领域有关数据收集、整理、分析等解决实际问题的综合能力,以适应大数据时代对经济管理人才的新需求。
2.课程体系优化建设。根据新的教学定位,统计学课程体系优化建设的基本思路:一是课程体系设置要强调基础知识、注重灵活应用、突出定量分析的教学理念和教学目标;二是课程结构上,突出专业针对性,强调统计学科和经济学科、管理学科的有机结合,使课程特色化;三是建立实践教学体系,加强学生实践能力的锻炼,为学生提供综合素质和能力提高的实训平台;四是将统计分析软件的运用融入到课程体系之中,加强统计分析软件的技能培养。
因此,本文将运用模块化系统集成思想,根据经济与管理类各专业的要求,提出按专业分模块,按模块分层次,按层次定内容的改革方案,构建“课程体系课程子系统课程模块具体内容”的递阶控制结构模型,具体如图1所示。
在统计学课程体系优化建设中,我们运用系统科学的方法构建出模块化、层次化集成的课程体系在整体功能上达到了最佳状态。
课程基础子系统是统计学理论基础和统计思维培养阶段,由统计学基本原理和基本理论构成,体现了“厚基础”的功能。课程应用子系统和课程案例子系统是统计分析能力训练阶段,首先结合认知性案例模块系统介绍统计分析方法,让经管类专业学生了解统计分析方法的基本原理,其次进一步结合专业特色案例模块和统计分析软件模块,通过分专业教学方式,使不同专业学生能够体会到统计学在本专业中的应用,增强学生的学习兴趣,体现了“强能力”的功能。课程实践子系统是统计应用能力实践阶段,是培养大数据时代应用型经管人才的重要环节。课程实践主要包括课堂实践和实验室模拟,课外实践主要包括社会实践活动、实训实习和相关竞赛,通过课程实践和课外实践两大平台训练学生运用所学统计调查、统计整理和统计分析等知识解决实际问题的综合能力。课程选修子系统是统计应用能力扩展阶段,该阶段在学生掌握统计学相关知识的基础上,通过选修统计预测与统计决策两大模块,进一步培养学生的定量分析能力。
三、结束语
大数据时代经管类专业统计学课程体系构建,应注重强化基础理论,突出知识的实用性和创新性,做到统计知识与实例分析相结合,与软件应用相结合,理论教学与实践教学相结合,与实际应用相结合。根据经管类各专业特色,以“知识+能力+应用”模式进行模块化、层次化课程体系设置,从本质上提升学生的数据素养和信息素养,提高解决实际问题的定量分析能力,以适应大数据时代对人才素质的新需求,使具有数据管理和数据分析能力的经济管理人才在就业市场上更具有竞争力。