统计学大数据分析模板(10篇)

时间:2023-11-18 10:08:44

导言:作为写作爱好者,不可错过为您精心挑选的10篇统计学大数据分析,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。

统计学大数据分析

篇1

【关键词】大数据 高中统计 数据分析 内容数据链

大数据的价值性,快速性,大量性,多样性,和预测功为教育提供了一种可能目前教育的形式多种多样,慕课、微课、网络公开课等等。大数据时代下的教育是怎样的呢?是基于个性化学习,是量化的,自我组织学习内容的教育,不仅要了解学生“心声”,认知水平和学习兴趣,而且要师生互动、合作探讨学习内容,将传统课程、教学、教材的内容数据化,利用可视化技术,提高学习兴趣。提升内容吸引力。高中统计内容必须系统化、过程方法直观化,这对高中的统计内容提出了挑战。使专题块和课程案例集以数据知识链为核心,使教育在大数据时代下的“量化”。

一、高中统计内容的新契机是大数据

使教育由数字支撑变化到数据支撑。高中统计教学场景布置,统计内容设计,学习场景的变革等等过去靠“敲脑袋”或者“理念灵感加经验”的东西,在背景为物联网、云计算、大数据下,变成一种由数据支撑的“行为科学”.用数据分析的方法对高中统计内容进行分析、挖掘,利用大数据更改高中统计内容,建立主线为“统计知识链”、目标为培养“数据分析能力”首尾呼应内容数据链,使高中统计内容的系统更加优化。

由于各种原因使高中统计内容,没有得到较好的发展.直到国家教育部颁布了各种政策,统计才得以发展.然而各种问题的存在仍然困扰着我国统计教学发展。大数据关注每一位学生的个性化需求与发展,关注学生的自我意识,分析群体心理,让教师关注学生的兴趣爱好,选择适合学生的方法,让学生自主的、创新的学习。

正如教育家张韫所说:“大数据时代的到来,让社会科学领域的发展和研究从宏观群体逐渐走向微观个体,让追踪每一个人的数据成为可能,从而让研究每一个个体成为可能.对于教育研究者来说,我们将比任何时候都更接近发现真正的学生。”大数据在充分了解学生各种需求,目前处于的状态的情况下合理运用各种统计内容,各种现代化的教学方式,不拘泥于传统化教学方式,利用各种资源形成螺旋式上升的统计内容数据链。使每一位学生都乐于学习,其个性化学习需求成为可能。

二、高中统计内容数据链在大数据视域下的内涵

数据高中统计内容的核心研究对象,数据分析是重点,统计学习是在初中的基础上,进一步学习数据统计方面的各种方法;用各种操作培养学生的归纳推断能力、统计思维、数据分析素养,提升学生在数据分析方面的能力,统计内容数据链为学生统计能力的提升提供了研究平台。把课程目标,学生需求、与大数据算法,数据链式结构有机结合起来是大数据视域下的统计内容数据链核心思想,利用大数据,将统计内容数据化,增强内容的可读性,衔接性、合理性、连贯性,织成统计知识,形成统计内容数据链。例如:具体环节为:链宿是“样本估计总体、”等数据分析方法,链源是“系统抽样,等距抽样、分层抽样”,链节是的数据描述、统计图形.通过统计知识的实际应用使“统计知识链”为统计内容数据链的内化,“统计能力链”为其外化,“统计能力链”,“统计素养链”为其发展,成为对学生产生重大影响的“统计思想链”所以,利用大数据的科学方法可使统计内容体系最终形成的统计思想体系;数据结构的链式模型,将促进学生创新思维,增强学生的参与积极性,使高中统计集“知识链、能力链、素养链、思想链”于一体。

三、高中统计内容大数据视域下下的数据链设计

(一)高中数学统计内容知识结构

各种版本的高中数学统计内容都介绍了基本的获取样本数据的获取,提取方法,就是我们常说的用样本推断总体,部分推断整体.统计知识注重培B学生数据分析的能力,利用实例讲解数据的各种思想,方法结合在一起,提高学生的综合能力。例如:结合具体问题情境,学习如何进行数据收集,分析,如何思维理解其含义。

(二)高中数学统计内容的教学要求

课标充分重视高中数学统计内容,并采取了有效的改进和创新措施。教学过程中,注重学生自我特长的发展,创新教学方式,不拘泥于传统的书本知识,强调以人为本,面向未来,让学生有数据意识,学会用数据说话,将统计知识运用于实践。

(三)高中统计内容在大数据视域下数据链设计

量化教育是大数据时代的可行教育,通过数据了解学生的个性化需求,促进学生的个性发展,注重创新式培养。结合教材利用现代化信息技术设计出学生乐于接受的教学方式。从“数据读心”,到“抓心入心”,再到“知心交心”,最终形成“数据育心”的培养链是统计内容数据链的设计原则。例如:分层抽样内容数据链的设计.首先,将分层抽样知识系统化。其次,将分层抽样的过程方法直观化。最后,依据统计内容数据链的设计原则和学生个性化学习需求,动态生成分层抽样内容数据链。把具体问题数据化。使分层抽样内容数据链成为满足自我发展需要的“知识链、方法链、素材链”。

四、结语

综上所述,对统计内容数据我们应该就地取材,因地制宜,开创多种方式的教学方式,注重学生的个性化需求,不要拘泥于传统的教材,注重培养学生的创新思维和自主参与能力,要让学生发挥主观能动性,积极主动的自己去思索,发展自己的特长,学会将具体的事情数据化不用数据的思想去思考问题,去看世界,老师也要探索更好的教学方法。将现代化的科学技术与传统枯燥的教材相结合创造出一种能够发挥学生潜能,特长的教学方式,要循循善诱,引导学生。总之,统计内容数据链能更好地使学生不断提升自己的数据分析“能力链”使学生学会用统计思想、统计方法、统计思维、统计观念、统计意识来认识世界,改造世界。

参考文献:

篇2

一、引言

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”(麦肯锡咨询公司)大数据时代已经到来了,决策将日益基于数据和分析而做出,而并非基于经验和直觉。大数据应用已经在商业、经济等领域取得了显著的成功。而在目前,教育领域中,各种数字学习环境的普及和推广,越来越多的人员在网络环境下发生学习行为。学习者与学习系统之间,学习者与学习者之间,学习者与设备之间,每天都在发生大量的交互数据,这些数据有着海量的数据规模(Volume)、多样的数据类型(Variety)、快速的数据流动和动态的数据体系(Velocity)、巨大的数据价值(Value),这些都符合大数据的4V特性。海量的数据给传统教育数据的存储和分析都带来了巨大的挑战。如何通过技术手段对教育大数据进行分析处理,使教育领域的方方面面都受益,最终有效促进教与学,已经越来越受到研究者的重视。而学习分析理念的提出,为教育大数据的应用找到了很好的途径。

二、学习分析概述

早在2010年美国新媒体联盟的《地平线报告》中就预测学习分析技术将在未来的四到五年内成为主流。第一届学习分析和知识国际会议认为:学习分析技术是测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其产生的环境的技术。

学习分析所服务的对象涉及教育系统的各个相关人员,学习者、教育者、教育研究者、教育管理者、学习服务提供者等等。使用数据挖掘、社会网络分析、统计分析等多种技术对教育大数据进行解释和分析,根据解释与分析的结果,评估学习者的学习进展,预测未来的表现,并发现潜在问题,以便学习者能更准确地把握自己的学习情况,优化学习过程,教育者能及时调整教学活动和教学内容,优化教学方法和教学策略,为学生提供个性化的教学资源与建议,同时也能为教育管理者的决策提供科学依据。国外对学习分析技术的研究已经取得了一定的效果,而国内还处在理论研究和综述阶段。基于教育大数据的学习分析系统的构建可以为学习分析的应用和实践提供重要指导,更好地提高学习效率,有效促进教与学。

三、学习分析系统的总体架构

国内外许多学者都从不同角度对学习分析进行了整体框架的设计,但每个框架都有其局限性,经过实践验证的框架依然很少。学习分析的基础和核心是海量的教育数据。围绕数据开展数据的采集、存储、分析、表示以及应用五个环节的活动。本文以数据为核心,依据数据流动的过程来构建一个更加灵活和可扩展的学习分析系统的架构模型(见图1所示)。

图1 学习分析系统架构图

学习者的学习行为发生在各种数字环境中,如传统的学习管理系统、网络课程以及开放学习环境(MOOCs)等,社会性学习系统,如博客,微博,各种社交网络等。交互当中所产生的数据都会被记录到原始数据库中,而原始数据来源众多,形式不一,存储和处理都有困难。通过聚集、抽样、维归约、离散化和二元化等预处理,让原始数据更加适合挖掘,将预处理得到的学习数据存储到学习数据库中,与学习者相关的一些基本数据存储在学生信息库中。在特定的时间中学习分析引擎会从学习数据库和学生信息库中获取数据进行分析,依据需求不同,在分析过程中使用不同的数据挖掘和分析工具及模型。分析结果作用于学习者、教育者、研究者、教育管理者等不同层次,提供相应的教育干预,学习内容和过程、教学设计和策略优化。当然,分析结果也要以报告或可视化图表等形式在展示平台输出。

四、结束语

学习分析是大数据技术在教育领域中的应用。在大数据技术的支持下,深度挖掘学习行为模式,交互数据之间所隐藏的潜在价值,学习质量分析,个性化教学内容推送等都将成为可能。在对学习分析进行不断深入研究的同时,也存在许多挑战。如何快速有效地收集和预处理来源多样的原始数据,使用哪种工具、算法能更准确地得到有效预测,如何做到保护学生隐私等,都是我们要考虑的问题。相信这些挑战都将在不久的将来得到解决。

【参考文献】

[1]Barwick H.The “four Vs” of Big Data.Implementing Information Infrastructure Symposium[EB/OL].2012-10-02.

篇3

近年来,移动互联网、大数据等信息技术发展日新月异,已经成为推动教育变革的重要力量。移动通信终端的普及为学生营造了泛在英语学习环境,大数据技术开启了个性化智能教育时代,翻转课堂、MOOC、微课等新型教学模式层出不穷,虽然它们不能取代传统教学模式,但英语教师必须与时俱进,重视信息技术对传统英语课堂的改造和提升,以全新的视角思考英语教学的变革方向。

一、研究理论概述

1.泛在学习理论

泛在学习是指任何人在任何时间和任何地点都可以通过泛在网络实现任何知识内容的学习。泛在网络和泛在计算技术为人类实现随时随地的泛在学习提供了技术保障,信息技术和教育技术的融合发展正深刻改变着知识的传播方式和学生的学习方式,不断重构着教育和学习的生态环境。一方面,移动通信终端的多元化发展解除了传统英语学习对地点的约束,翻转课堂、MOOC等新型教学模式使学生可以自由地选择学习时间、进度、内容和学习方式。另一方面,传统教学设备正在向数字教学设备变迁,教育领域信息基础设施建设有效地推动跨区域教学资源整合,海量的多媒体教学内容必须和学生的碎片化时间有效结合,教师需要针对不同学情的学生进行精准施策和差异化施策。

2.学习生态理论

学习生态是由学习群体及其所处的环境共同构成的生态系统。系统由信息技术、多媒体教学设施等支撑,通过以合作、交流、共享、互动为特征的教育实践,实现知识信息传递和有效学习,从而促进系统的不断优化。学生与学习环境、学生和学习群体之间密切联系、相互作用,通过知识的吸纳、内化、创新、外化、反馈等过程实现有效学习[1]。在泛在学习的背景下,学习生态研究的是教育信息、学习主体、教师、教育信息环境之间相互作用的生态系统,需要从教育信息化建设和应用的视角研究各个生态系统成员之间的相互作用规律,维护生态系统的平衡发展。

3.有效学习理论

有效学习是指学生在教师的指导下,针对学习内容采取适合自己的学习策略,积极主动地参与到学习过程中,高效率地完成知识建构,从而实现学习目标并优化自身知识结构的学习行为。有效学习是对学习内容、学习方法、学习过程、学习结果的价值追求[2],学生可以实现对知识的深层次理解和灵活应用。学习内容的优化在大数据背景下表现为对海量学习内容的筛选、清洗与转化[3],使之满足学生的学习需要。学习方法调整是建立在对学生学习情况进行多元评价的基础上,根据学生个人学习偏好、认知习惯、学习方式、情感态度因素、学习内容的变化而动态进行的。学习过程的积极参与是指学生能够积极主动地学习,充分和师生进行合作、交流,善于提出问题、分析问题和解决问题。学习评价是学生改变学习计划、优化学习方法的重要手段,对学生学习可以起到引导、激励、启示和教育作用。

二、当前英语泛在学习模式存在的主要问题

1.传统课堂教学和线上教学环节缺乏有效衔接

首先,魍晨翁媒萄Ш拖呱辖萄г诮萄Ы谧唷⒅识范围上没有有效衔接。例如,学生不知道如何在线上学习课堂上没有掌握的知识点,或者在线上环节重复学习课堂中已经掌握的知识点。其次,缺乏对课堂英语学习和个性化英语自主学习的融合创新设计。在传统课堂教学中,整齐划一的教学标准无法满足英语学习分层分级的差异化教学要求。不同学情的学生对学习时间、空间、内容、方式的需求不尽相同,教师在教学中没能和学生线上学习的大数据分析结果进行有效的融合对接,仅根据自身的教学经验和主观判断作为实施因材施教的依据,因此其决策缺乏精准性和稳定性。

2.泛在学习缺乏生态性系统设计,学生英语泛在学习的用户黏性不高

当前泛在学习过程特别是在线学习过程缺乏师生互动性、社交互动性、线上线下互动性。泛在学习仅停留在将文字、图像、视频等教学资料数字化、网络化、集成化和泛在化的阶段,这在某种程度上增加了学生英语学习的选择性和便利性,但缺乏针对不同学生的学习黏性设计,因此泛在学习效果并不理想。

3.英语泛在学习体系缺乏具有“参与感”和“现场感”的语言学习环境

建构主义理论认为,知识的获得是在学习环境的特定情境作用下,借助教师的帮助与学习伙伴的协作,通过意义的建构过程实现的。因此在英语泛在学习过程中,必须增强学生在特定情境下的沟通和交际活动的参与性[4]。例如,如果在英语课程设计和在线学习设计环节,鼓励学生广泛参与学习内容、学习方法、学习偏好的设计,就会让学生感受到教师对学生的爱与尊重,从而增强学生学习的主动性和积极性,使不同学情的学生都能在学习过程中体验自我实现感,实现自主学习。另外,教师缺乏对学生多元需求的感知和把握,缺乏语言锻炼的“现场感”设计,使学生无法在接近真实生活情境的语言环境中得到语言交际锻炼。

三、基于大数据分析的英语泛在学习生态系统

移动通信和大数据分析技术的发展为有效解决当前英语泛在学习模式存在的问题提供新的方式和途径。基于大数据分析的英语泛在学习生态系统以学生的英语学习需求、特征、习惯、喜好等大数据挖掘为切入点,联合学校、互联网教育机构、教材编写人员、教师、信息化支撑机构、教育管理机构、在校学生和在职学员等生态系统成员共同把泛在学习落实到教学环境、模式设计、资源开发、评价机制和管理机制等工作中,不仅仅是教育内容资源和信息的共享空间,而且是实施素质教育和个性化学习的公共服务平台。因此,本文构建了基于大数据分析的英语泛在学习生态系统,主要包括大数据采集、大数据存储、大数据分析、大数据应用四个子系统,并构建了系统体系结构模型(图1)。

1.大数据采集子系统

首先,大数据采集子系统要实现数据、文字、图像、音频、视频、多媒体等结构化数据和非结构化数据采集,实现跨区域、跨机构、跨教学环节的数据互联互通和数据采集功能,解决教育数据资源配置效率不高的问题。其次,实现英语教学设计、教学实施、课程内容建设、网络学习内容资源建设、语料库建设、学生学习认知过程监控、学生学习情感态度监控和学习评价等全教学链条的数据采集功能,为生态系统成员之间的共生发展提供良好的数据资源基础。

英语教学设计数据主要采集教师按照教学大纲和教学目标要求对不同学生制定的学习内容、学习进度、学习路径等数据,厘清学生在课堂上和网络上分别学什么、在哪学、怎么学的问题。教学过程数据主要采集教师在教学中帮助学生解决英语学习问题的经验、做法和策略,包括情感态度、认知因素的调控、语言情境的构建、师生的有效互动等。课程内容数据主要是采集教师、学校、互联网教育机构课程教学内容数据,包括教材内容、课件、题库、案例等授课内容资料,以及以上资料经过碎片化处理的数据资料。

网络资源数据库主要采集互联网、校园网上英语学习方面的相关资料。英语语料库数据主要采集中国学习者英语语料库、美国当代英语语料库等语料库内容,以及英语教材、英美小说、散文、演说词、电影剧本、新闻稿等英文自然语料。学习行为数据库主要采集学生课堂学习行为和线上学习行为数据。课堂学习行为包括是否预习、复习等,线上学习行为数据采集学习日志、学习习惯、学习时长和学习路径等。学习评价数据主要采集教师或者在线学习系统对学生的学习能力、学习方法、学习策略运用、学习过程和学习结果的评价数据。学习情感态度数据主要是通过问卷、访谈等方式采集影响学生英语语言习得的动机、态度、焦虑、自信等指标。

2.大数据存储子系统

大数据存储子系统主要实现对大数据采集子系统采集的海量结构化、非结构化数据进行数据清理、归档、压缩,实现一体化数据存储。可以实现跨区域、跨系统的英语泛在学习数据的融合,解决不同教学机构、数据结构、操作系统带来的信息孤岛问题。英语学习数据仓库是指集成了大数据分析子系统和应用子系统决策分析所需的泛在学习数据,这些数据是按照一定的英语学习主题进行组织,是在对原有分散的各类英语泛在学习数据库数据进行加工、汇总和整理后得到的,有效地消除了各类源数据中的不一致性,所以英语学习数据仓库的信息均是关于学生英语泛在学习全局情况的一致性信息。数据仓库的这些全局性信息同r通过网络云平台实现英语泛在学习数据的云端存储,可以直接由大数据应用子系统调用。

3.大数据分析子系统

认知因素和情感因素是影响英语习得效果的两个重要方面。大数据分析子系统首先结合学生应该达到的学习目标对学生个体的英语学习认知行为和学习的情感态度进行数据挖掘,分析学生的动机、态度、焦虑、自信、兴趣等情感因素,以及学习毅力、能力、习惯、方法、英语水平和常犯错误等认知行为因素,对数据挖掘结果进行聚类运算和分类处理,根据学生的学习认知行为和学习态度情况将学生细分,以识别不同学生之间相似的泛在学习需求,以及某个学生个体在不同学习阶段泛在学习需求的差异性。同时,大数据分析子系统会对学生的学习过程和学习结果进行动态综合评价,并根据学习评价结果判断学习方案的优劣,有针对性地进行线上和线下学习方案的调整。

4.大数据应用子系统

大数据应用子系统包括学习信息推送系统、学习信息定制系统、在线互动学习系统、语言情境仿真系统、知识关联推荐系统、知识精准搜索系统、知识树形管理系统和娱乐在线学习系统等应用。学生可以通过学习终端连接到相关应用系统进行英语语言知识的有效学习。学习信息推荐系统自动推荐给学生的学习信息是学生应掌握而目前未掌握的英语知识。学习信息定制系统可以满足学生根据自身学习需求而定制某类主题的学习信息。学生一方面通过在线互动学习系统可以和辅导教师进行交流互动,解决学习中遇到的问题,另一方面可以通过社交软件实现和其他学习者的沟通和交流,共享英语学习经验。

语言情境仿真系统可以实现某类主题的英语学习情境的在线仿真,让学生在接近真实环境的英语语言情境中进行英语交际锻炼。知识关联推荐系统是根据学生所学知识点,自动关联推荐对应的拓展知识点。知识精准搜索系统可以帮助学生快速实现英语知识的精准有效搜索,从而进行有针对性的学习。知识树形管理系统可以实现学生已掌握知识和未掌握知识的树形目录管理,实现线上学习和课堂学习知识管理的无缝链接。

基于大数据分析的英语泛在学习生态系统有利于充分发挥信息技术对传统英语教育的改造提升作用,可以有效促进信息技术与教学过程、内容、方法和教学评价体系的深度融合。在生态系统的价值取向上注重以促进学生全面健康发展为中心,注重需求导向的个性化学生培养模式。在学生习得效果评价体系上注重加强学习过程评估,强调过程评估和结果评估相结合。系统注重充分挖掘学生的个体差异,充分挖掘学生的学习潜能,围绕学生英语学习习惯的形成和学习情感态度的培养,以现代信息技术为辅助手段,将英语语言知识进行碎片化、情境化、可视化处理,通过采取教育信息推送、关联推荐和定制化相结合的方式实现知识的在线传播,给学生提供个性化、定制化的英语学习信息服务,带给学生全新的英语泛在学习体验。

参考文献

[1] 张豪锋,卜彩丽.略论学习生态系统[J].中国远程教育,2007(4).

[2] 曹贞.以有效学习为目标的大学课堂教学[J].教育与职业,2007(26).

篇4

1 引言

随着计算机科学技术的不断进步,数字信息化的时代已经到来,21世纪是信息化全球大爆发的时代,信息全球化已经渗透到生活的每个角落,校园作为人口比较密集的场所,很多高校都在投入大量的人力以及财力用于校园信息数字化网络的建设,校园数字化网络的建设为校园数字化网络管理提供了足够的保证,能够进一步提高各高校的信息化管理水平。

高校数字化建设是完全建立在高校的校园网网络的基础上,目前,校园网络已经实现了光纤入网的条件,校园数字化建设能够完全将目前比较先进的互联网技术、信息技术、多媒体技术融为一体,充分地将校园的科研工作、管理工作、生活以及教学等工作集成起来形成一个统一的整体,最终为高校的全面信息化教学打下坚实的基础。

高校数字化网络的建设实质上是借助先进的信息化技术将高校的各个部门的各种信息资源进行有效的整合、集成以及优化,进一步提升高校的信息资源的合理利用以及配置。

2 校园一卡通

校园一卡通是“数字化校园”建设的最为重要的组成部分,校园一卡通具备的主要功能必须包括身份认证功能、数据管理功能、金融服务功能、综合消费功能、公共信息管理功能等。校园一卡通能够有效地集成高校内的所有资源以及子系统,通过校园一卡通能够掌握每一个持卡用户动态的、实时的情况,不仅能够加快高校数字化管理系统建设的进度,还能够进一步提升高校的数字化管理水平。

校园一卡通数字信息管理系统的建设是IC卡技术应用比较成功的典范之一。真正意义上的校园一卡通并不仅要具备消费以及结算功能,而是通过智能的数字化管理实现高校内的各种业务管理。校园一卡通必须能够将高校内的消费以及管理集成与一身才可以称之为真正实现了校园一卡通管理,才能通过校园卡实现校园内的学籍管理、消费、结算、身份识别、网上付费等。

3 校园一卡通建设

校园一卡通是目前高校流通非常广泛的信息集成平台,也是目前大部分高校所采用的信息管理平台。校园一卡通管理系统建设是建立在“集中控制、信息共享”的需求上的,因此,校园一卡通系统的设计是多个信息功能模块的有效集成,具体实现的设计思路是将所管理的资源集成在统一的互联网平台,并采用统一的数据库服务器,对资源采用绝对安全的、统一的身份ID认证体系,进而实现信息数据的安全集成、安全传输、安全管理。校园一卡通可以通俗的理解为各个管理系统、射频设备、读卡设备等终端的高效集成,进一步提升了系统管理的智能化水平。

随着各个高校的校园信息化、网络化建设的逐渐深入,高校内的所有信息资源的整合过程已经进入到了全面的规划以及实施阶段,现阶段。校园一卡通的建设必须与高校现有的人事、教学、身份认证等MIS系统以及其余的高校信息应用系统紧密的结合,通过全面的、安全的统一身份认证机制实现高校信息资源的无缝集成及其共享,使得校园一卡通能够友好的融入校园,成为校园信息化建设的非常重要的组成部分,通过校园一卡通的有机整合,能够有效地避免高校的不必要投入,进一步提高高校的信息化建设进度,为高校系统之间资源的无缝共享打下坚实的基础。

4 校园一卡通数据管理

校园一卡通的核心部分内容便是数据,数据信息资源的安全将直接影响到整个校园一卡通系统的安全运行。数据存储行为是校园一卡通在高校校园中应用的最重要的数字化行为,数据IC卡存储的数据不仅包括纯粹的相关数据信息,还包括功能信息、系统运行状态信息、系统交互之间产生的交换数据以及各个功能模块产生的历史记录信息,数据信息的安全存储是确保校园一卡通能够正常运行各个功能模块的关键保障,数据存储行为不是简单的将数据入库操作,更重要的是采用合理的数据加密技术措施以及认证机制确保相关数据的安全,为系统的安全性防护添加一层核心屏障,除此之外,信息资源数据的安全存储行为贯穿到整个系统的设计、研发、实现、实施、管理等各个阶段,甚至包括硬件资源的选取都必须严格遵守对应的安全策略。

校园一卡通数据的安全传输是数据数字化行为的又一重要属性,特别是涉及到财务的相关数据。因此,数据的安全传输必须建立在专有的局域网内,必须在物理以及软件上实现局域网与外部网络的完全隔离,数据在传输的过程中必须采用各种安全措施以确保传输的数据不被修改,比如信道签名、数字签名等。

除此之外,校园一卡通的数据管理行为还必须具备数据恢复功能,由于网络的突然故障或者系统的严重故障经常会造成数据丢失或者损坏,校园一卡通的数据管理必须建立完善的历史数据备份记录,能够自行修复损坏数据,使得系统运行数据正确、可靠、稳定。

5 校园一卡通消费行为

现阶段,校园一卡通在各个高校中应用的最为广泛的便是高校的消费管理上,可以将其理解为高校学生以及教职员工的“电子钱包”。高校校园一卡通消费管理系统采用目前先进的IC卡信息载体,对高校中的学生以及教职工消费行为进行有效的管理。

校园一卡通消费管理系统的建设是实现高校各个部门以及后勤管理服务部门信息化建设的关键手段,能够将后勤服务以及消费管理相关资源进行优化、整理、重构,进而实现后勤资源以及管理资源的合理配置,将复杂的、种类繁多的各种资源充分的利用起来,帮助高校的后勤管理以及校务管理实现过程的高效协调、合理优化,进而实现大幅度提升校园后勤以及校务的信息管理水平,以进一步提升后勤以及校务的服务效率以及高校的效益。

高校员工以及学生的消费行为是后勤管理工作的重点。校园一卡通消费信息管理系统的建设能够有效地缓解校务以及后勤管理工作的繁重业务,简化校务以及后勤的工作流程,实现以较少的人力资源实现全校的合理化管理的目的,在提高后勤服务质量的同时,也实现了精简校园后后勤以及校务管理人员的目的,一定程度上降低了高校的整体管理经费。

校园一卡通消费信息管理系统很大程度上提升了高校的财务管理水平,也实现了高校财务的无纸化办公,消费管理系统的建设能够有效地规范高校内的费用结算管理,进而确保财务的正确管理,有效地规避了一些漏洞,不仅提高了财务的管理水平,还进一步改善了财务管理的工作模式,使得高校的消费行为更加灵活多变,一定程度上提升了高校财务以及消费的管理水平。

目前,校园一卡通的消费行为实现了食堂饮食消费,超市购物消费,饮水消费、洗澡消费、个人医疗消费、四六级考试报名消费、有偿上级消费、个人账户自助存款消费等,基本上实现了高校的可以消费的所有领域。

6 校园一卡通身份认证行为

校园一卡通在高校中应用的另外一个重要数字行为便是身份认证管理,校园一卡通系统需要将校园网网络内的各个子系统有机融合,因此需要将各自独立的相关验证进行统一管理,采用统一的认证机制对用户身份进行统一管理,用户身份的认证以及授权目前校园一卡通研究的重点领域。

校园一卡通的身份识别系统采用目前比较先进的智能卡技术,通过用户身份信息的识别实现高校校内门锁的控制、门禁的控制、重要安全通道的控制、校内各项考勤制度的管理、参会人员的会议签到等,并在此基础上有机地结合了安全防范相关技术措施以及计算机网络控制技术措施,通过软件系统的高效管理实现对校园一卡通用户身份的安全认证和识别。

门禁管理系统是控制和管理校内人员出入的有效措施,通过该系统能够准确有效地对校内人员的出入进行数字化控制,最重要的是确保了校区各个场所的安全,很大程度上提升了持卡用户身份识别的正确性以及效率。

考勤管理系统能够及时地将学生的上课出勤率反馈到学校,还能够有效的考察教职员工的出勤情况,通过考勤管理系统能够有效的实现教务课程的合理化安排,能够提高学生以及教职员工的出勤情况,实时掌握学生在校的一切活动。

校园一卡通的身份认证功能模块的实现能够真正意义上实现校园网网络用户的的身份信息的安全存储以及数据共享。网络认证技术是现阶段应用比较广泛的一套集管理、计费以及认证于一体的安全性极高的综合性网络信息管理系统,网络认证与校园一卡通的有效集成是未来校园一卡通身份认证的发展趋势,涉及到高校内的每个校园一卡通的用户,身份认证系统的整合能够有效的加速高校网络数字信息化建设的进度。

7 结束语

随着各个高校实现校园数字现代化管理意识的不断加强,高校校园管理数字化建设进度也变得愈加强烈,基于智能芯片应用的计算机网络信息化管理系统也变得越来越普及,高校学员以及教职员工众多,往往持有大量的传统的卡片以及不同的证件,比如学生证、图书证、上机证等,一定程度上增加了高校的管理成本,还使得学生的管理水平变得异常混乱。

传统的校园管理模式已经无法满足现阶段的教育模式。信息时代当然离不开教育信息化管理。校园一卡通强大的功能能够有效地融合高校内的一切资源以及子系统,能够实现校园系统以及资源的有机集成,真正意义上的实现校园的数字化系统建设,使得数字化行为轨迹深入到高校数字化管理的方方面面。

参考文献

[1] 宋文功,杨培敏. “数字化校园”与“校园一卡通”关联的实现[J]. 长沙铁道学院学报(社会科学版). 2006(01).

[2] 赵震伟. 数字化校园一卡通系统的研发[J].思茅师范高等专科学校学报. 2009(03).

[3] 王正坤,蒋涛涛. 试论基于数字化校园的一卡通系统的构建[J].农业网络信息,2009(08).

[4] 王筱超,王蔚.校园一卡通平台的规划与建设研究[J].现代计算机(专业版). 2009(05).

篇5

随着大数据时代的到来,各企业采用了新的策略,获得了更多的利润。对于统计专业来说,改变发展策略,使培养出来的专业人才能够适应大数据背景的需求是其主要任务。目前,高校统计学专业逐渐认识到大数据时代综合性人才培养的重要性,并对专业建设进行了相关改革。

一、大数据时代对统计学的影响

大数据时代的到来对现代统计专业的发展造成了新的冲击,要确保培养出来的人才能够起到应有的作用,首先要了解大数据时代对统计专业所造成的影响。

(一)大数据时代使数据结构和数据性质发生变化

网络技术以及基于网络技术的电子商务等新的数据记录模式标志着大数据时代的到来。大数据时代,不再依赖于抽样调查的记录模式,网站浏览、视频监控都将形成大量数据。传统的数据结构甚至是数据性质发生了变化。大量的数据信息对于需求者来说,如何甄别其可用价值成为关键。传统的数据可以二维表格显示和整理。但大数据时代所产生的数据具有多样化和复杂化特征,往往包含了大量的音频、视频、HTML等。这要求大数据的收集具有较强的目的性,才能实现其价值。

(二)大数据时代要求统计分析方法和统计思维更新

大数据时代的主要特征为数据多且复杂,数据分析要求分析者对总体进行分析。在这一背景下,参数统计不再具有意义,假设检验法也随着总体分析而失去价值。数据的复杂化对传统大数据统计思维造成了巨大的冲击,要求统计者具有活跃的思维。只有对传统数据的改变进行分析,并且树立新的统计方法。

二、大数据时代下的统计学发展新策略

为适应大数据时代的需求,统计学专业的发展势必要对传统模式进行改革。目前,多数高校统计学专业已经认识到大数据对于其发展带来的冲击。为此,本文提出了以下策略,以及能够帮助统计学取得更好发展。

(一)加强统计应用性教学

根据大数据时代数据的总体分析特征,数据分析人员应掌握全面的分析方法。在人才培养过程中,应致力于培养实践分析能力,提高数据和资料收集能力,并且培养其强烈的数据价值观,使其能够从众多数据中找到所需的。另外,对传统模式进行改革,增加大数据统计内容,以适应时代的需求。基于大数据的结构特点,实施资料透视化教学,提高分析者对复杂数据的分析能力。

(二)培养大数据统计思维

在人才培养过程中,新的统计思维的培养具有重要意义,即强调数据分析实践能力的提高。统计思维的培养有助于数据分析者对复杂的数据进行区分,从而整理有效信息。在大数据时代,不仅要以传统的平均思维、动态思维和变异思维为基础,还要注重基于整体分析的大数据思维。另外,还要培养数据分者的复杂性思维,以应对复杂的数据库。总之,大数据时代需要数据分析者具有全面的、创新性的思维。

(三)强化基础性统计知识

统计学自身具有复杂性,其改变多且抽象。基础的统计知识是进一步掌握大数据分析思维的基础,可见学习基础性统计知识的重要性是不言而喻的。为此,应该采取深入浅出的方法,利用多媒体等方式使复杂的数据统计清晰化、简单化。结合具体的案例使数据分析者正确认识统计概念、掌握统计原理和方法。此外大数据分析不再是一种专业,而是更倾向于一种技术,这要求我们将大数据分析与统计学以外的相关知识相互联系。注重真实相关与伪相关的讲解,强调商务智能的开发和分析。只有具有坚实的基础,才能确保数据分析者大数据分析思维的养成,适应现代社会的需求。

(四)加强复合型人才培养

为适应大数据时代的需求,复合型人才的培养是关键。所谓复合型人才,是指其不但要具有专业的数据分析能力,还要相应的具备管理以及其从事专业的技术。大数据时代,高校应建立全面的人才培养模式,注重培养人才的数据分析能力、编程能力等,使其真正了解大数据,懂得如何利用大数据对其所处的行业起到积极作用才是关键。总之,大数据时代对综合性人才具有更高的需求,大数据时代不仅培养的是一种能力,而且是一种思维,是对全新模式下的数据的分析和利用。高校作为人才培养的重要基地,其教学模式的改革、对大数据时代所需教学模式的认识是高校的主要任务。

三、总结

统计学是经济学的基础课程,传统的统计人才培养具有定向性。而随着大数据时代的到来,数据产生的形式多样,且具有复杂性。大数据分析不仅是作为一种专业存在,而是应以一项必备的技术而存在。大数据时代,传统的统计思维和统计方法发生了改变,统计人才培养方式的改革也就势在必行。(作者单位:海南师范大学)

参考文献:

[1] 朱怀庆.大数据时代对本科经管类统计学教学的影响及对策[J].高等教育研究,2014(3).

[2] 姚寿福.经济管理类本科专业统计学课程教学改革思考[J].高等教育研究,2012(3).

篇6

大数据在如今社会已经成为热点词汇,不仅在计算机领域,在其他各个行业都能够得到运用,为各个行业提供便捷,为了让大数据能够得到充分利用,下文将对大数据分析相关方面进行讨论。

一、大数据与大数据时代

(一)大数据大数据是在当今科技飞速发展的情况下,一种新兴的信息数据处理技术。随着社会科技的进步,各行各业对于数据的应用也越来越广泛,传统的数据处理技术耗时较长且精准度较为低下,已经不能满足现代科技对数据应用的要求。新时代的大数据系统具有超大的数据容量,同时兼容半结构化与结构化的数据,远远超出传统数据库管理系统的管理能力。因此新的大数据技术就此诞生。大数据在发展过程中,具有比为鲜明的特点。与传统数据处理技术相比,大数据具有数量庞大、多样化、速率快、价值高的特点。在信息处理的速度不断加快的当今社会,这样的特点为大数据的广泛应用打下了坚实基础。由于数据的数量较为庞大,且各种数据近年来的增长趋势呈指数型,其数据的种类和形式也各有不同。其次,合理利用大数据技术,能够在一定程度上降低成本,提高效率,因此,大数据处理各项关键技术的进一步的开发与利用已成为了提高自身效率,实现核心竞争力的重中之重。

(二)大数据时代大数据时代是指在物联网技术、计算机技术、数据信息处理技术的基础上,通过互联网途径,大量收集并处理分析数据资源,而形成一种新型的信息时代。大数据时代的主要核心内容是对庞大的数据体系进行处理以发挥价值,从而提升数据分析效率以及数据应用价值。大数据时代是由多种信息技术共同组成,可以有效地避免数据处理中不同步、使用不方便的情况发生,具有高效可靠的数据处理、整合、分析及汇总的功能。因此,大数据时代的新型数据处理技术可最大程度的对数据进行分析与挖掘,极大提高处理数据的效率。

二、大数据时代与统计学

(一)大数据时代与统计学的关系统计工作是集数据的搜集、整理、分析和解释为一体的系统的过程。大数据与统计二者互相依存,通过统计的方法和原理对数据进行整理和分析,提高数据的精确度和适用度,以此来实现数据的价值和利用率。由此看来,大数据与统计学的联系既紧密,又存在区别。大数据与统计学的关系甚为密切,它们都是关于数字的学科。统计学为大数据提供了了施展方向,而大数据将统计学引领至更深更广的空间。共性之一就是社会与数据。几乎所有的行业与大数据都有着密切联系,这些联系或直接或间接,而人们正是通过获取数据并进行分析,从而才能得到商业知识和社会服务等能力。大数据与统计学的区别。首先,信息规模不同。大数据的分析对象是与某事物有关联的所有数据,要求数据量庞大。统计学则是用样本来分析和推断总体的数量特征。在大数据时代,则可以通过各种方法和渠道获得全面而又完整的的信息资料,从而完成更多从前无法完成的事情。其次,动静标准不同。数据经过了搜集、整理、分析的过程就很有可能因为精确性不足而被认为失去了用处。而大数据时代,则不必再担心这个问题,数据的精确性和原始性不在被过分重视,人们可以接受复杂数据。第三,数据搜集形式不同。在以往数据搜集形式主要是抽样调查,方法局限。而在大数据时代,特点是信息爆炸和互联网飞速发展,这一情况得到改观。最后,思维方式不同。大数据时代人们的思维发生转变,人们开始更多的关注事物的相关关联。

(二)大数据对统计学研究工作的影响首先,大数据丰富了统计学的研究对象。在大数据时代,我们既可以以结构化数据作为测量单位对文本、图像和视频等进行分析,还可以对非结构化数据实行分析。其次,大数据影响了统计学的工作进程。统计数据需求丰富,原有的统计抽样分析不能在适应时代的发展,而现代科技方法如透过传感器自动收集数据等方法取代了传统方法,更加便捷有效。

三、大数据数据分析理念

篇7

中图分类号:C8 文献标识码:A 文章编号:1674-098X(2017)01(c)-0136-02

近年来,对大数据的研究和应用已经受到我国各界人士的广泛关注,国家统计局已经把信息处理技术列为关键性的创新技术工程之一。随着我国大型计算机的迅速发展,处理大规模的复杂数据的能力逐渐提升,从这些大数据中提取有效信息的能力也逐步加强,毫无疑问,我国进入大数据时代的脚步将会进一步加快,人们将会感受到大数据时代下给其带来的生活、工作上的便利。

1 大数据和大数据时代简介

1.1 大数据

大数据是指远大于一般数据的巨量资料,需要人们通过全新的处理模式才能获取其中有价值的数据信息。“大数据”这一概念最早由维克托在《大数据时代》一书中引用得来,最开始对其定义为:不通过传统的随机分析方法直接对所有数据进行分析处理,主要有大量、高速、多样和价值4个特征。

大数据可以分为大数据技术、大数据工程、大数据科学和大数据应用等领域。目前受到最多应用的是大数据技术和大数据应用。人们通过收集数据,提取有效信息就可以为企业发展或者社会活动提供最有效的实施途径。因此,可以这样说,在大数据的王国里,最成功的企业就是那些善于运用机遇的公司。

1.2 大数据时代

大数据时代是建立在信息时代的基础上,通过互联网、物联网等渠道广泛搜集海量数据资源并对其进行存储、提取和展示。在大数据时代,几乎所有人都能够享受从任一数据中获得所需要的信息,大数据时代也具有社会性、广泛性、公开性和动态性4个特征。大数据时代的发展将会引领社会众多领域和行业的变革,对人类的生产、生活方式产生深远影响。

在大数据时代下,传统的数据分析思想已经不再适用,应该做出改变。首先,应该转变抽样思想,大数据时代下的样本即总体,已经不再依靠少量样本分析事物的相关规律;其次,要转变数据精确测量的思想,大数据时代要学会接受繁冗复杂的多样性数据;最后要转变探究事物的因果关系思想,转为研究事物的相关规律。以上思想的转变,均与统计学有关,因此,下面将分析大数据对统计学带来的具体影响。

2 大数据对统计学研究工作的影响

2.1 大稻莘岣涣送臣蒲У难芯慷韵

大数据影响的领域范围非常广泛,在大数据时代,不仅能够对以结构数据为度量单位的客观主体,还可以对不能用数据衡量关系的文本、图片、音像等非结构数据进行分析,大大扩展了传统统计学的研究范畴。

2.2 大数据影响统计学的工作进程

统计学是对所搜集的数据进行整理和归纳的方法论学科。大数据时代的资料十分丰富,分析数据已经不再需要抽取样本了,因为数据总体即是样本。此时,传统的统计学抽取样本分析的工作方法已经不再适用,而是被现代化通过传感器自动采集数据的方法所取代。

3 大数据时代下数据分析理念辨析

3.1 数据分析理念

传统的数据分析是指用统计学方法将收集的数据资料进行系列分析,以便最大化地开发数据中的功能,从中提取有价值的数据,再和未经处理的数据进行对比,发挥数据的作用。大数据时代下的数据分析,由于数据量非常大,数据本身的动态特性使人们要研究的数据难度加大,因此,大数据时代的数据分析一般利用统计学的理念,采用更广泛的方法统计和分析数据,以此摆脱对数据样本的依赖,也可以避免数据的流动性给分析结果带来的不确定性。大数据时代更加注重数据的增值分析工作,研究数据的未来走向,使其中有价值的数据可以增值,将有效数据有机整合,能够及时发现问题和解决问题。

3.2 数据分析的主要程序

3.2.1 数据整理

统计数据的整理主要分为4个步骤:审核统计资料、对资料进行分组、汇总和编制统计表格或图表、保管和公布。当统计对象为数据资料庞大、类型复杂、要求处理速度快的大数据时,这些步骤就显得繁冗了,尤其是图表的绘制是没办法实现的,因此,只需要对资料进行审核和存储。大数据的审核和存储不同于传统意义上的数据审核和保存,大数据时代利用先进的现代化工具进行数据的审核和保存。

3.2.2 数据的开发

传统数据的样本量较小,目的主要着眼于解决问题,数据的时效性较强,数据的使用价值会随时间流逝而降低。而大数据的流动性很强,随着时间的推移会越来越壮大,而且具有推陈出新、价值重塑的可能,因此,在大数据时代,数据是会不断增值的,开发大数据,是一项有重要意义的工作。

3.2.3 数据的应用

其中分别对教育、运输、消费品、电力、石油与天然气、医疗护理、消费金融等进行分析和预测。根据这些行业的特点,可以总结出大数据挖掘商业价值的基本方法为:客户群体细分,为每个群体量定特别的服务;模拟现实环境,发掘新的需求的同时提高投资的回报率;降低部门联系,提高整条管理链条和产业链条的效率;降低服务成本,发现隐藏线索产品和服务的创新。从图1中可以看出,大数据的应用群体十分广泛,能否对获取的数据及时、迅速处理,对该行业的发展具有重要意义。

4 结语

该文主要对大数据时代下数据分析理念进行了相关的分析和研究。首先对大数据及大数据时代的概念做了简要阐述,接着分析了大数据对统计学的两点影响,最后分析了大数据时代下的数据分析理念。总而言之,在现代社会,大数据的应用已经成为时代新的特征,能否从海量数据中提取有价值的信息做出相应的预测,对于企业或者个人的发展具有重要意义。

篇8

二、数据科学的统计学内涵

(一)理论基础

数据科学中的数据处理和分析方法是在不同学科领域中分别发展起来的,譬如,统计学、统计学习或称统计机器学习、数据挖掘、应用数学、数据密集型计算、密集计算方法等。在量化分析的浪潮下甚至出现了“metric+模式”,如计量经济学、文献计量学、网络计量学、生物统计学等。因此,有学者将数据科学定义为计算机科学技术、数学与统计学知识、专业应用知识三者的交集,这意味着数据科学是一门新兴的交叉学科。但是这种没有侧重的叠加似乎只是罗列了数据科学所涉及到的学科知识,并没有进行实质性的分析,就好似任何现实活动都可以拆解为不同的细分学科,这是必然的。根据Naur(1960,1974)的观点,数据科学或称数据学是计算机科学的一个替代性称谓。但是这种字面上的转换,并没有作为一个独立的学科而形成。Cleveland(2001)首次将数据科学作为一个独立的学科提出时,将数据科学表述为统计学加上它在计算技术方面的扩展。这种观点表明,数据科学的理论基础是统计学,数据科学可以看作是统计学在研究范围(对象)和分析方法上不断扩展的结果。一如统计学最初只是作为征兵、征税等行政管理的附属活动,而现在包括了范围更广泛的理论和方法。从研究范围的扩展来看,是从最初的结构型大规模数据(登记数据),到结构型的小规模数据(抽样数据)、结构型的大规模数据(微观数据),再扩展到现在的非(半)结构型的大规模数据(大数据)和关系数据等类型更为丰富的数据。从分析方法的扩展来看,是从参数方法到非参数方法,从基于模型到基于算法,一方面传统的统计模型需要向更一般的数据概念延伸;另一方面,算法(计算机实现)成为必要的“可行性分析”,而且在很多方面算法模型的优势越来越突出。注意到,数据分析有验证性的数据分析和探索性的数据分析两个基本取向,但不论是哪一种取向,都有一个基本的前提假设,就是观测数据是由背后的一个(随机)模型生成,因此数据分析的基本问题就是找出这个(随机)模型。Tukey(1980,2000)明确提到,EDA和CDA并不是替代关系,两者皆必不可少,强调EDA是因为它被低估了。数据导向是计算机时代统计学发展的方向,这一观点已被越来越多的统计学家所认同。但是数据导向仍然有基于模型与基于算法两种声音,其中,前文提到的EDA和CDA都属于基于模型的方法,它们都假定数据背后存在某种生成机制;而算法模型则认为复杂的现实世界无法用数学公式来刻画,即,不设置具体的数学模型,同时对数据也不做相应的限制性假定。算法模型自20世纪80年代中期以来随着计算机技术的迅猛发展而得到快速成长,然而很大程度上是在统计学这个领域之外“悄然”进行的,比如人工神经网络、支持向量机、决策树、随机森林等机器学习和数据挖掘方法。若响应变量记为y,预测变量记为x,扰动项和参数分别记为ε和β,则基于模型的基本形式是:y=f(x,β,ε),其目的是要研究清楚y与x之间的关系并对y做出预测,其中,f是一个有显式表达的函数形式(若f先验假定,则对应CDA;若f是探索得到的,则对应EDA),比如线性回归、Logistic回归、Cox回归等。可见,传统建模的基本观点是,不仅要得到正确的模型———可解释性强,而且要得到准确的模型———外推预测能力强。而对于现实中复杂的、高维的、非线性的数据集,更切合实际的做法是直接去寻找一个恰当的预测规则(算法模型),不过代价是可解释性较弱,但是算法模型的计算效率和可扩展性更强。基于算法的基本形式类似于非参数方法y=f(x,ε),但是比非参数方法的要求更低yx,因为非参数方法很多时候要求f或其一阶导数是平滑的,而这里直接跳过了函数机制的探讨,寻找的只是一个预测规则(后续的检验也是基于预测构造的)。在很多应用场合,算法模型得到的是针对具体问题的解(譬如某些参数是被当作一个确定的值通过优化算法得到的),并不是统计意义上的推断解。

(二)技术维度

数据科学是基于数据的决策,数据分析的本质既不是数学,也不是软件程序,而是对数据的“阅读”和“理解”。技术只是辅助数据理解的工具,一个毫无统计学知识的人应用统计软件也可以得到统计结果,但无论其过程还是结果都是可疑的,对统计结果的解释也无法令人信服。“从计算机科学自身来看,这些应用领域提供的主要研究对象就是数据。虽然计算机科学一贯重视数据的研究,但数据在其中的地位将会得到更进一步的加强”。不可否认,统计分析逐渐向计算机科学技术靠近的趋势是明显的。这一方面是因为,数据量快速膨胀,数据来源、类型和结构越来越复杂,迫切需要开发更高效率的存储和分析工具,可以很好地适应数据量的快速膨胀;另一方面,计算机科学技术的迅猛发展为新方法的实现提供了重要的支撑。对于大数据而言,大数据分析丢不掉计算机科学这个属性的一个重要原因还不单纯是因为需要统计软件来协助基本的统计分析和计算,而是大数据并不能像早先在关系型数据库中的数据那样可以直接用于统计分析。事实上,面对越来越庞杂的数据,核心的统计方法并没有实质性的改变,改变的只是实现它的算法。因此,从某种程度上来讲,大数据考验的并不是统计学的方法论,而是计算机科学技术和算法的适应性。譬如大数据的存储、管理以及分析架构,这些都是技术上的应对,是如何实现统计分析的辅助工具,核心的数据分析逻辑并没有实质性的改变。因此,就目前而言,大数据分析的关键是计算机技术如何更新升级来适应这种变革,以便可以像从前一样满足统计分析的需要。

(三)应用维度

在商业应用领域,数据科学被定义为,将数据转化为有价值的商业信息①的完整过程。数据科学家要同时具备数据分析技术和商业敏感性等综合技能。换句话说,数据科学家不仅要了解数据的来源、类型和存储调用方式,而且还要知晓如何选择相应的分析方法,同时对分析结果也能做出切合实际的解释②。这实际上提出了两个层面的要求:①长期目标是数据科学家从一开始就应该熟悉整个数据分析流程,而不是数据库、统计学、机器学习、经济学、商业分析等片段化碎片化的知识。②短期目标实际上是一个“二级定义”,即,鼓励已经在专业领域内有所成就的统计学家、程序员、商业分析师相互学习。在提及数据科学的相关文献中,对应用领域有更多的倾向;数据科学与统计学、数学等其他学科的区别恰在于其更倾向于实际应用。甚至有观点认为,数据科学是为应对大数据现象而专门设定的一个“职业”。其中,商业敏感性是数据科学家区别于一般统计人员的基本素质。对数据的简单收集和报告不是数据科学的要义,数据科学强调对数据多角度的理解,以及如何就大数据提出相关的问题(很多重要的问题,我们非但不知道答案而且不知道问题何在以及如何发问)。同时数据科学家要有良好的表达能力,能将数据中所发现的事实清楚地表达给相关部门以便实现有效协作。从商业应用和服务社会的角度来看,强调应用这个维度无可厚非,因为此处是数据产生的土壤,符合数据科学数据导向的理念,数据分析的目的很大程度上也是为了增进商业理解,而且包括数据科学家、首席信息官这些提法也都肇始于实务部门。不过,早在20世纪90年代中期,已故图灵奖得主格雷(JimGray)就已经意识到,数据库技术的下一个“大数据”挑战将会来自科学领域而非商业领域(科学研究领域成为产生大数据的重要土壤)。2008年9月4日刊出的《自然》以“bigdata”作为专题(封面)探讨了环境科学、生物医药、互联网技术等领域所面临的大数据挑战。2011年2月11日,《科学》携其子刊《科学-信号传导》、《科学-转译医学》、《科学-职业》专门就日益增长的科学研究数据进行了广泛的讨论。格雷还进一步提出科学研究的“第四范式”是数据(数据密集型科学),不同于实验、理论、和计算这三种范式,在该范式下,需要“将计算用于数据,而非将数据用于计算”。这种观点实际上是将数据从计算科学中单独区别开来了。

三、数据科学范式对统计分析过程的直接影响

以前所谓的大规模数据都是封闭于一个机构内的(数据孤岛),而大数据注重的是数据集间的关联关系,也可以说大数据让孤立的数据形成了新的联系,是一种整体的、系统的观念。从这个层面来说,将大数据称为“大融合数据”或许更为恰当。事实上,孤立的大数据,其价值十分有限,大数据的革新恰在于它与传统数据的结合、线上和线下数据的结合,当放到更大的环境中所产生的“1+1>2”的价值。譬如消费行为记录与企业生产数据结合,移动通讯基站定位数据用于优化城市交通设计,微博和社交网络数据用于购物推荐,搜索数据用于流感预测、利用社交媒体数据监测食品价等等。特别是数据集之间建立的均衡关系,一方面无形中增强了对数据质量的监督和约束;另一方面,为过去难以统计的指标和变量提供了另辟蹊径的思路。从统计学的角度来看,数据科学(大数据)对统计分析过程的各个环节(数据收集、整理、分析、评价、等)都提出了挑战,其中,集中表现在数据收集和数据分析这两个方面。

(一)数据收集方面

在统计学被作为一个独立的学科分离出来之前(1900年前),统计学家们就已经开始处理大规模数据了,但是这个时期主要是全国范围的普查登记造册,至多是一些简单的汇总和比较。之后(1920-1960年)的焦点逐渐缩聚在小规模数据(样本),大部分经典的统计方法(统计推断)以及现代意义上的统计调查(抽样调查)正是在这个时期产生。随后的45年里,统计方法因广泛的应用而得到快速发展。变革再次来自于统计分析的初始环节———数据收集方式的转变:传统的统计调查方法通常是经过设计的、系统收集的,而大数据是零散实录的、有机的,这些数据通常是用户使用电子数码产品的副产品或用户自行产生的内容,比如社交媒体数据、搜索记录、网络日志等数据流等,而且数据随时都在增加(数据集是动态的)。与以往大规模数据不同的是,数据来源和类型更加丰富,数据库间的关联性也得到了前所未有的重视(大数据的组织形式是数据网络),问题也变得更加复杂。随着移动电话和网络的逐渐渗透,固定电话不再是识别住户的有效工具变量,相应的无回答率也在增加(移动电话的拒访率一般高于固定电话),同时统计调查的成本在增加,人口的流动性在增加,隐私意识以及法律对隐私的保护日益趋紧,涉及个人信息的数据从常规调查中越来越难以取得(从各国的经验来看,拒访率或无回答率的趋势是增加的),对时效性的要求也越来越高。因此,官方统计的数据来源已经无法局限于传统的统计调查,迫切需要整合部门行政记录数据、商业记录数据、个人行为记录数据等多渠道数据源,与部门和搜索引擎服务商展开更广泛的合作。

(二)数据分析方面

现代统计分析方法的核心是抽样推断(参数估计和假设检验),然而数据收集方式的改变直接淡化了样本的意义。比如基于浏览和偏好数据构建的推荐算法,诚然改进算法可以改善推荐效果,但是增加数据同样可以达到相同的目的,甚至效果更好。即所谓的“大量的数据胜于好的算法”这与统计学的关键定律(大数定律和中心极限定理)是一致的。同样,在大数据分析中,可以用数量来产生质量,而不再需要用样本来推断总体。事实上,在某些场合(比如社会网络数据),抽样本身是困难的。数据导向的、基于算法的数据分析方法成为计算机时代统计学发展无法回避的一个重要趋势。算法模型不仅对数据分布结构有更少的限制性假定,而且在计算效率上有很大的优势。特别是一些积极的开源软件的支撑,以及天生与计算机的相容性,使算法模型越来越受到学界的广泛重视。大数据分析首先涉及到存储、传输等大数据管理方面的问题。仅从数量上来看,信息爆炸、数据过剩、数据泛滥、数据坟墓、丰富的数据贫乏的知识……这些词组表达的主要是我们匮乏的、捉襟见肘的存储能力,同时,存储数据中有利用价值的部分却少之又少或尘封窖藏难以被发现。这除了对开采工具的渴求,当时的情绪主要还是迁怨于盲目的记录,把过多精力放在捕捉和存储外在信息。在这种情况下,开采有用的知识等价于抛弃无用的数据。然而,大数据时代的思路改变了,开始变本加厉巨细靡遗地记录一切可以记录的数据。因为:数据再怎么抛弃还是会越来越多。我们不能通过删减数据来适应自己的无能,为自己不愿做出改变找借口,而是应该面对现实,提高处理海量数据的能力。退一步,该删除哪些数据呢?当前无用的数据将来也无用吗?显然删除数据的成本要大于存储的成本。大数据存储目前广泛应用的是GFS、HDFS等基于计算机群组的文件系统,它可以通过简单增加计算机来无限地扩充存储能力。值得注意的是,分布式文件系统存储的数据仅仅是整个架构中最基础的描述,是为其他部件服务的(比如MapReduce),并不能直接用于统计分析。而NoSQL这类分布式存储系统可以实现高级查询语言,事实上,有些RDBMS开始借鉴MapReduce的一些思路,而基于MapReduce的高级查询语言也使MapReduce更接近传统的数据库编程,二者的差异将变得越来越模糊。大数据分析的可行性问题指的是,数据量可能大到已经超过了目前的存储能力,或者尽管没有大到无法存储,但是如果算法对内存和处理器要求很高,那么数据相对也就“大”了。换句话说,可行性问题主要是,数据量太大了,或者算法的复杂度太高。大数据分析的有效性问题指的是,尽管目前的硬件条件允许,但是耗时太久,无法在可容忍的或者说可以接受的时间范围内完成。目前对有效性的解决办法是采用并行处理。注意到,高性能计算和网格计算也是并行处理,但是对于大数据而言,由于很多节点需要访问大量数据,因此很多计算节点会因为网络带宽的限制而不得不空闲等待。而MapReduce会尽量在计算节点上存储数据,以实现数据的本地快速访问。因此,数据本地化是MapReduce的核心特征。

四、结论

(一)数据科学不能简单地理解为统计学的重命名,二者所指“数据”并非同一概念,前者更为宽泛,不仅包括结构型数据,而且还包括文本、图像、视频、音频、网络日志等非结构型和半结构型数据;同时,数量级也是后者难以企及的(PB以上)。但是数据科学的理论基础是统计学,数据科学可以看作是统计学在研究范围(对象)和分析方法上不断扩展的结果,特别是数据导向的、基于算法的数据分析方法越来越受到学界的广泛重视。

(二)从某种程度上来讲,大数据考验的并不是统计学的方法论,而是计算机科学技术和算法的适应性。譬如大数据的存储、管理以及分析架构,这些都是技术上的应对,核心的数据分析逻辑并没有实质性的改变。因此,大数据分析的关键是计算机技术如何更新升级以适应这种变革,以便可以像从前一样满足统计分析的需要。

(三)大数据问题很大程度上来自于商业领域,受商业利益驱动,因此数据科学还被普遍定义为,将数据转化为有价值的商业信息的完整过程。这种强调应用维度的观点无可厚非,因为此处是数据产生的土壤,符合数据科学数据导向的理念。不过,早在20世纪90年代中期,已故图灵奖得主格雷就已经意识到,数据库技术的下一个“大数据”挑战将会来自科学领域而非商业领域(科学研究领域成为产生大数据的重要土壤)。他提出科学研究的“第四范式”是数据,不同于实验、理论、和计算这三种范式,在该范式下,需要“将计算用于数据,而非将数据用于计算”。这种观点实际上将数据从计算科学中单独区别开了。

篇9

2019年12月,农业农村部、中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知,部署了用数字化引领驱动农业农村现代化,加快农业农村生产经营、管理服务的数字化改造的发展战略,将全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平作为农业农村发展的目标[1]。农业农村的数字化建设离不开专业人才的培养。农林经济管理专业毕业生的就业方向主要有农业经营单位、面向农业农村的政府管理部门、事业单位、科研院所等。随着农业农村数字化发展战略的推进,给传统的农经人才培养带来了一系列的挑战[2]。在数字经济和智慧农业的时展背景下,数据分析能力是农经专业学生重要的核心竞争力。如何提升农经专业学生数据分析能力,是农经专业人才培养中面临的重要课题[3]。

1农业农村数字化发展战略给农经人才培养带来的挑战

1.1对农经人才的数据思维的更高要求

在大数据时代,无论是农业生产经营活动,还是农村的行政管理中都有大量的数据资源。农业企业、农业合作经营组织、农产品产销数据、农产品溯源数据为农业经营者提供了生产、物流、销售环节大量的数据资源。经营者需要认识到数据是一种新的生产要素,要调动数据作为生产要素的属性,让数据分析为管理决策服务[4]。在数字中国的建设进程中,各级政府部门工作人员通过各级各部门的行政管理智能,收集了大量省、市、区、县级的区域经济社会发展数据。社区网格化管理下收集了微观层面的农业经营单位数据、农村常住人口数据、医保数据、扶贫数据、农村小额信贷数据。这些数据资源是政府提高行政效率、提高政务服务质量的宝贵资源。

1.2对农经人才的数据分析能力的更高要求

在大数据时代,每天都有海量数据生成,如何能更好地利用这些数据,让数据能发挥其为管理决策服务的功能,与数据使用者的数据分析能力是密切相关的。例如,农业经营单位在农业生产环节的农业投入数据、农产品销售数据、电商平台的客户反馈评论、农产品库存的动态数据,如何整合分析这些数据,要求农业经营者系统掌握数据分析、数据挖掘、文本分析等多元化的数据分析方法。政府管理部门掌握的农业人口的迁移数据、农村常住人口网格管理数据、农村居民医保数据、扶贫数据等,数据类型丰富,数据量庞杂,如何实现数据库的整合,要求政府部门工作人员掌握数据库管理、大数据分析技术。

2农经专业数据分析课程群建设中存在的问题

2.1课程之间连贯性不足

以笔者所在的高校为例,为农经专业本科生开设的数据分析类课程,见表1。数据分析课程群包括了通识教育、专业教育和实践教育。从目前的课程设置来看,涵盖了数据库、统计学、经济计量学、多元统计、大数据分析等领域,内容丰富。数据库应用由计算机学院开设,是一门通识教育课程,在授课时教师往往将其视为一门计算机类的入门课程,在教学中没有针对农经专业学生的特质,将数据库的教学与其在农经领域的应用结合起来。学生在学习中往往会觉得该课程与专业联系不够紧密,教学内容枯燥,缺乏学习兴趣。

2.2学生学习的软件种类繁多,但不够深入

在统计学和多元统计课程中,学生将学习EXCEL、SPSS或者R语言的应用,在经济计量学课程中学生将学习Eviews或STATA的应用,在数据挖掘与大数据分析课程中学生将学习Python语言的应用。在每一门课程中学习的软件都不同,对于软件的学习缺乏连贯性和延续性,虽然学生接触的软件种类多,但是由于学时所限,每一种软件都只是入门级的介绍,无法进入到深度学习。

2.3与专业课学习联系不够紧密,缺乏应用机会

学生缺乏在专业课学习中运用数据分析类课程所学知识的机会。数据分析类课程主要介绍数据分析方法和软件的应用,但大部分都安排在第5学期和第6学期。学生在学习了数据分析方法后,缺少在专业学习领域里运用这些方法的机会。例如学生若要完成产业经济学、农业技术经济学、农产品国际贸易学的专题研究、课程论文,需要用到统计学、经济计量学、大数据分析的方法,但在第2-4学期开设大量专业课的学期,数据分析类课程还没有开设。若能将数据分析类课程尽量靠前安排,学生可以在后续的专业学习、课题研究中运用所学的方法,一方面夯实数据分析技能,另一方面也可以增加学生对专业课的学习兴趣。

2.4排课不够科学

在大三阶段,学生可以选修多元统计、数据挖掘与大数据分析、Python语言三门选修课。但到了大三,学生专业课的学习任务重,选修课种类考虑繁多,学生选课可能出于兴趣、学分安排或者准备考研保研考虑,并不是每一位同学都会选修上述课程。尤其是计算机能力不太强、对数学类课程感到困难的同学,会倾向于选择难度小的课程。

3基于项目驱动式教学理念的数据分析课程群改革

3.1开展项目驱动式教学的意义

项目驱动教学法是基于行动导向的探究式教学方法,是将真实的或模拟的项目转化为教学项目,结合课程内容将项目分解为若干工作任务,创设工作情境,引导学生完成任务,进而实现项目教学目标的教学活动[4-5]。项目驱动式教学法最显著的特点是“以项目为主线、教师为主导、学生为主体”,改变了以往“教师讲,学生听”被动的教学模式,完善了学生主动参与、自主协作、探索创新的新型教学模式。与传统教学方法相比,教学实施过程中,学生的目标更清晰明确,可避免传统课堂教学的被动性,进而提高学生学习知识的兴趣和主动性[6]。在数据分析课程群中引入项目驱动教学,一方面能让学生运用所学的数据分析方法分析现实问题,创设数据分析情境,加深对所学方法的理解和运用,激发学习兴趣,培养自主学习能力;另一方面也可以有针对性地创设围绕“三农”问题的数据分析项目,让学生从数据分析中加深对“三农”问题的感性认识,培养对农经专业学习的兴趣,提升对农经专业的认同度。具体来讲,可以从以下方面开展对数据分析课程群的改革[7]。

3.2统筹规划教学内容,加强课程间的连贯和递进

农经专业数据分析课程群目前主要包括必修课数据库应用、统计学和经济计量学,选修课多元统计、数据挖掘与大数据分析,以及实践课R语言与统计应用、Python语言。统计学教学的重点在于对基础性的统计方法的运用,经济计量学教学的重点在于让学生掌握经济计量分析的范式,如何利用经济计量模型开展实证分析。多元统计强调对复杂多维数据信息的提炼。数据挖掘与大数据分析教学的重点在于大数据时代数据挖掘方法的应用。此外,针对于目前学生所学的软件门类过多,软件操作不够熟练,建议在统计学、多元统计、数据挖掘大数据分析中统一采用R语言进行教学,让学生通过几门课程的学习,能够熟练掌握一种统计分析软件。

3.3基于项目驱动对教学内容进行整合及优化,调动学生主动参与

例如统计学课程介绍了基础性的统计分析方法,在后续课程经济计量学、多元统计、数据挖掘与大数据分析中引导学生运用基础性统计分析方法,对数据进行初步的统计分析和整理,为经济计量分析、多元统计、数据挖掘做好数据处理上的准备,让学生体会到关联课程中所学知识的联结。鼓励学生积极参与“三下乡”活动,开展田野调查实践,围绕“三农”开展调研,运用统计和计量方法对调研数据进行分析,鼓励学生参与到教学中来,培养学生的学习兴趣,学以致用。

3.4建设“项目驱动”实践教学模块

结合农经专业课程体系,建设数据分析课程群“项目驱动”实践教学模块。在农经专业的课程体系中开设的农业经济学、农产品贸易、农村社会学等专业性课程对大量的“三农”问题进行了探讨,这类课程中涉及的城乡差异问题、收入和消费问题、农产品价格波动、农产品贸易等现实问题的研究,都离不开基于现实数据的定量分析。因此,在农经专业的数据分析课程群中可以结合教学内容引导学生对专业课学习中热点问题的研究,围绕课程教学大纲,建设“项目驱动”实践教学模块,理论联系实际,让学生在研究项目中运用所学的数据分析方法,加深对专业知识的理解。

4农经专业数据分析课程群优化方案

在大数据时代,数据分析能力是学生的核心竞争力之一。数据分析类课程在建设中要强调理论与实践的结合,不能只是将教学停留在课堂上,引入体现专业特色的实践教学环节。可以从以下几方面开展数据分析课程群的优化:第一,数据分析基础类必修课安排在大一学年。在第1学期,可以安排R入门、Python入门、数据可视化课程,让学生尽早接触当前主流的数据分析软件,激发学生对R或Python的学习兴趣,让学生自我拓展学习空间。R入门、Python入门、或者数据可视化课程都属于数据分析的基础课程,无需其他先修课程。在这一时期,让学生开始接触数据分析软件,学习数据可视化的分析工具,有利于培养学生的数据思维、数据意识和软件实操能力。第二,将与农经专业课有关的专业必修课统计学、经济计量学安排在第3-4学期学习。统计学课程需要学生先行修读高等数学和概率论课程,经济计量学需要学生先行修读微观经济学、宏观经济学,因此可安排在第3-4学期。让学生在掌握了一定经济管理专业知识后,可以更好地体会统计学、经济计量学方法论学科的应用价值。第三,将数据分析进阶类选修课多元统计、大数据分析、数据挖掘、机器学习等课程安排在第5-6学期。为高年学生提供丰富的数据分析类选修课,让学生结合自己的兴趣、未来的发展规划学习更加多元化的数据分析技术。鼓励学生能在专业论文习作、学科竞赛中有更多的机会运用自己所学的数据分析方法,增加学生的收获感和成就感,挖掘学生的学习潜力。第四,改革课程考核评价体系,采用项目式管理和评估的思路,由学生自主开展一个数据分析项目,从收集数据、提出问题、分析数据到提炼研究结论,开展小组团队成员互评。教师跟踪学生的项目开展过程,从学生的学习态度、投入程度、数据分析质量等综合评价学生的学习效果。

5结束语

将项目驱动教学引入到农经专业数据分析课程群的建设,让学生参与到教学中去,突破传统教学中“教师教学生学”的局面,让学生通过参与项目,运用数据分析方法解决项目中的实际问题,激发学生的学习兴趣和潜能,让学生体会到所学知识的应用价值,让学生不再对数据分析类课程望而生畏。本文的研究对于农经专业学生数据分析能力的培养有重要的意义,强调理论与实践的结合,提高学生数据分析的高阶能力,也能为同类课程开展项目驱动教学提供借鉴。

参考文献:

[1]农业农村部中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].

[2]李虹贤.农业经济管理专业人才培养模式创新研究与实践[J].智慧农业导刊,2022,2(7):110-112.

[3]冯开文,陶冶.农业经济管理专业实践教学改革———以中国农业大学经济管理学院为例[J].教育现代化,2017,4(23):54-56+63.

[4]杜洪燕,陈俊红.乡村振兴背景下中国数字农业高质量发展路径研究[J].南方农业,2021,15(21):213-214.

[5]金娥.基于项目式学习的《现代教育技术应用》课程学习框架的设计与实践研究[D].武汉:华中师范大学,2021.

篇10

一、应用统计学的主要步骤和要点

1.1样本的选择

样本是应用统计学方法实践的首要要素。所有的统计归纳和对比分析都是建立在样本群的调查之上的。所以样本的选择至关重要,既需要具有随机性,又要有代表性,不能过于偏向某一领域又不能不顾及权重的配比。

1.2统计方法的确定

应用统计学科中有很多统计学的方法,可以对样本量进行多种处理与计算,既可以简单分析样本的分布特征,又能够从时间序列上获取其趋势。而一些复杂的统计学模型则提供了更加精确和量化的对比模拟方案。

1.3统计结果的分析

对统计结果的分析也是统计学应用的重要环节,在分析时不仅要考虑结果直接体现出来的表面特征,还要学会从表面特征挖掘出其背后可能存在的因素与条件,进而得到一个比较合理科学的解释。

二、应用统计学在生产实际中的应用表现

2.1应用统计学在经济学领域的应用

经济一直是我国发展过程中重点关注的对象,经济基础决定上层建筑,所以有效的把控经济走势,快速精准的判断经济拐点,果断坚决的进行经济指导和干预才是推动和保障我国经济稳步发展的关键。应用统计学作为一门需要使用统计学理论进行现状分析的学科,恰好可以满足经济学发展的需要。越来越多的经济分析实例需要建立在完善和科学的统计结果之上,而经济学专业的学生也不断加强自身的统计学相关知识。例如对于金融行业来说,无论是风险投资还是项目推广,都需要提前对市场进行预判,对受众和用户进行一个大概的了解。应用统计学就能够在进行样本选定和调查后,根据长期经验得到的指数建立模型,分析客户心理和消费能力等要素,进而为后续的发展指明方向。

2.2应用统计学在医学领域的应用

2020年一场突发的公共卫生事件牵动着全球人民的心,一种新型的病毒在人群中大肆传播,造成身体健康的严重损害甚至夺去生命,对医学领域带来了巨大的挑战。这时,应用统计学的知识和理论就为防疫战疫提供了重要的理论依据。通过前人对类似传染病的统计结果,建立一个传染病扩散速率和死亡率等的数量关系,各个参数都由经验给出,从而就可以针对不同的病毒传播特征得到一个模型,既可以比较早的对未来情况有一个把握,又能够为公众提供一个科普的窗口,提醒人们注意保护和预防。

三、统计学理论在大数据时代的应用

3.1数据分析、统计学理论之间的结合

应用传统统计抽样方式,无法对庞杂数据来进行分析、处理,也难以展现出大数据的知识密度,获取的分析结果自然不够精确,这无疑会影响数据的挖掘、使用成效。将数据分析、统计学理论之间结合,能够打破传统数据分析模式的限制,充分发挥出大数据的价值。大数据内容多元、混乱,对数据形式准确性要求不高,可以利用统计学分析方式来对比数据变化,同时,大数据对数据精度的要求并不是很高,而是“以量取胜”,更加侧重于整体研究,通过数据分析、统计学理论之间的结合融合了两者优势。

3.2创新数据分析理念

大数据具有价值、多样、高速、大量4个方面的特点。基于大数据分析的特点,既往相关专家总结出了如下公式,即:大数据=高频海量数据+复杂类型的数据。在大数据时代下,数据分析工作便是对海量数据的分析、归纳、统计、总结,挖掘出其中具有价值的信息和内容,进行对比,以得出具有价值的信息。在数据收集、处理环节中,需要进一步创新数据分析渠道,扩充数据来源,对于相关人员而言,要具备数据积累、处理的意识。大数据具有一定的流动性,在时间的流逝下,数据信息数量会继续增加,因此,相关人员要具备创新化的数据分析理念,让数据真正实现增值,以帮助人们更好地解决问题。

四、加强校企深度合作,构建统计专业学生的培养体系策略

4.1完善校企合作政策法规保障

首先,政府应以立法的形式完善专业教育校企合作相关法律法规,通过法律对院校与企业在开展合作中的责任、义务与权利加以确认,为校企双方在人才培养方面的深层合作提供制度保障。其次,保证政策“落地”,一方面可通过教育宣讲的方式,强化院校、相关企业以及社会组织等对有关政策的深入了解,从而获得合作各方的配合与支持;另一方面,在政策实施过程中还要及时收集反馈信息,并针对合作受阻原因,继续完善相关政策,保证政策真正“落地”。

4.2开创多元化的合作模式

第一,可通过“产教结合”的方式,这也是当前校企合作的主流模式,主要包括短期性实习、参观考察、专业技能竞赛等形式。第二,实行“订单式培养”模式,为企业定制输送专业人才,此模式只能应用于特定合作项目。第三,实行“校企共建”模式,校企双方通过整合资源,在合作中充分发挥各自优势,实现校企双方的良性互动。

4.3打造“双师”高校教师队伍