多元统计分析论文模板(10篇)

时间:2023-02-28 15:58:42

导言:作为写作爱好者,不可错过为您精心挑选的10篇多元统计分析论文,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。

多元统计分析论文

篇1

二、因子分析

法因子分析法是指从被评对象的观察变量的相关度出发,利用降维的思想,把繁杂的变量尽可能归纳为几个综合因子进行分析的的一种多变量统计分析方法。其基本思想是:将观察变量按相关度的高低或联系的紧密程度进行分类,类别内部变量相关性高,联系紧密,而类别之间的变量则相关度较低,联系稀疏,每一类变量则代表一个公共因子。具体步骤为:

篇2

关键词: 高校;科研状况;因子分析;聚类分析;评价

Key words: colleges and universities;research status;factor analysis;cluster analysis;evaluate

中图分类号:G463 文献标识码:A 文章编号:1006-4311(2016)31-0015-04

0 引言

科研能力是衡量一所高校科教水平的重要标志。某高校作为省重点高校有着悠久的办学历史,科研水平在省内也是名列前茅,本文针对该高校20个学院的各项科研指标进行多元统计分析,建立了描述科研水平的各类变量,包括各类科研项目的经费总额、各类论文的发表数量、论著发表数量,投入科研人员数量等。但由于各学院规模不一,各学院科研性质也不尽相同,为了保证研究结果的平衡性,本文采用对科研成果人均贡献率的方式进行研究。然而进行统计分析时,并非变量收集的越多越有利,变量间信息的高度相关、高度重叠会给统计方法的应用带来许多困难,因此本文借助SPSS统计分析软件,采用因子分析方法,在众多变量中提取影响各学院科研状况的主要因子对问题进行分析,最后通过因子变量的聚类分析对评价结果进行验证。国内学者目前主要集中对我国体育事业进行科研状况分析,如贾志强、郑岩平对我国1995-2000年篮球科研状况作了分析。张金、夏秀荣对我国1994-2003年排球科研状况作了分析。在高校科研状况分析方面,孟学英、陈春华利用调查问卷方式对我国部分高职院校教师科研状况做了调查分析。同时国内对多元统计方法的应用也主要集中在医疗、经济方面,如孟莹、谢守祥等利用多元统计分析方法对江苏省经济差异化做了分析。王曦、宋剑南利用多元统计分析方法对影响中医症候的主要因素做了研究。利用多元统计分析方法结合高效科研状况评价分析还鲜有研究。本文结合多元统计分析分析方法对某高校科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。

1 因子分析方法简介

因子分析是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量之间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究问题的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。进行因子分析的步骤如下:①根据研究问题选取原始变量。②对原始变量进行标准化并求其相关阵,分析变量之间的相关性。③求解初始公共因子及因子载荷矩阵。④因子旋转。⑤因子得分。⑥根据因子得分值进行进一步分析。

2 各学院科研状况的因子分析

2.1 数据分析和指标选取

本文选用的数据来源于某高校2006年至2015年的统计数据。设定数据中8个指标变量分别是X1:2006-2015年横向项目金额人均贡献率(万元/人);X2:2006-2015年市校级项目金额人均贡献率(万元/人);X3:2006-2015年省部级项目金额人均贡献率(万元/人);X4:2006-2015年国家级项目金额人均贡献率(万元/人);X5:A类论文人均贡献率(篇/人);X6:B类论文人均贡献率(篇/人);X7:C类论文人均贡献率(篇/人);X8:论著数量人均贡献率(项/人)。数据详情见表1。

在进行数据分析前,进行KMO检验,P值为0.000,检验结果是显著的,同时KMO值达到0.577,结果见表2,表明数据之间具有一定的相关性,可进行因子分析。

从表3变量共同度表中可以看出因子分析的变量共同度均较高,表明变量中的大部分信息均被因子所提取,说明因子分析的结果是有效的。

2.2 因子提取和因子解释

现应用主成分分析法来进行因子提取和因子个数的确定,从表4中可以看出只有前三个因子特征根大于1,并且前三个因子特征值之和接近80%,故提取前三个因子基本包含了全部测评指标的绝大部分信息,因子分析效果较理想。

由于初始载荷阵结构不够清晰,不便于对因子进行解释,因此对因子载荷矩阵实行旋转,达到简化结构的目的,使各变量在某些因子上有较高载荷,而在其余因子上只有小到中等的载荷。这里采用方差最大正交旋转法进行因子旋转。结果见表5。

从旋转后的因子载荷矩阵来看,第一个主因子在省部级项目金额人均贡献率、国家级项目金额人均贡献率、A类论文人均贡献率、B类论文人均贡献率上具有较高载荷,第二个主因子在C类论文人均贡献率、论著数量人均贡献率上具有较高载荷,第三个主因子在横向项目金额人均贡献率、市校级项目金额人均贡献率上具有较高载荷。

2.3 因子得分和因子变量

本文采用回归法估计因子得分系数,并输出因子得分系数矩阵见表6。

根据表6可写出以下因子得分函数:F1=-0.014横向项目金额人均贡献率-0.078市校级项目金额人均贡献率+0.263省部级项目金额人均贡献率+0.293国家级项目金额人均贡献率+0.178A类论文人均贡献率+0.508B类论文人均贡献率+0.021C类论文人均贡献率+0.174论著人均贡献率(1);F2=-0.159横向项目金额人均贡献率+0.065市校级项目金额人均贡献率+0.00省部级项目金额人均贡献率-0.057国家级项目金额人均贡献率-0.235A类论文人均贡献率+0.393B类论文人均贡献率+0.328C类论文人均贡献率+0.570论著人均贡献率(2);F3=0.442横向项目金额人均贡献率+0.582市校级项目金额人均贡献率+0.123省部级项目金额人均贡献率+0.010国家级项目金额人均贡献率-0.076A类论文人均贡献率-0.219B类论文人均贡献率+0.384C类论文人均贡献率-0.010论著人均贡献率(3)

通过上述公式(1)、公式(2)和公式(3)可得到各个学院的因子得分。从而获得三个因子变量,由于这三个因子变量是线性无关的。因此,可以利用它们对各个学院的科研状况做统计分析。

3 各学院科研状况的综合评价分析

下面利用三个因子变量对2006年-2015年该高校各学院科研状况做多元统计分析,并对各学院近10年来科研状况进行综合评价。

首先画出三因子变量的散点图,对各学院近10年来科研状况做对比分析。以第一因子变量为横坐标,第二因子变量为纵坐标,第三因子变量为竖坐标的三维散点图如图1所示。

从图1中可以看出P学院、O学院、M学院等的第一因子很高。说明这些学院在国家级项目人均贡献率、省部级项目人均贡献率、A类论文人均贡献率、B类论文人均贡献率上成绩突出,但在横向项目人均贡献率上稍显不足,这些学院应该在保持尖端学术科研的前提下,多加强与企业的合作,创造更多产业应用成果。L学院、R学院、N学院等的第二因子很高,说明这些学院在论著人均贡献率、C类论文人均贡献率上成绩突出,这与这些学院的科研性质是密不可分的,第二因子很高的学院可以在保持自己科研特色的前提下,多关注学术前沿的相关信息,争取在尖端科研中有更大的突破。如B学院、I学院等的第三因子很高,说明这些学院在横向项目人均贡献率上成绩突出,这些学院可以在紧密保持与企业的科研联系的基础上,加强自己在学科特色科研中的研究,多出一些基础研究方面的尖端科研学术成果,增强学院在科研创新中的能力。

最后利用系统聚类分析法对各学院科研状况进行聚类分析,即利用三因子变量对20个学院进行聚类,结果如表7所示,M学院、P学院、O学院和J学院为一类,B学院、I学院为一类,其它学院为一类。这个结果与散点图分析的情况基本类似。

4 结束语

本文针对某高校各学院科研状况进行综合评价分析,通过对高校近十年科研指标数据进行因子分析,将八个指标变量分为三个科研因子,分别是高端科研因子、校企合作科研因子、基础科研因子,并给出了因子得分模型,对各学院近十年的科研状况给出了分析,最终的聚类分析结果也对各学院科研状况做了验证说明。论文的研究成果为科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。

从分析结果来看,因学院科研特色不同,导致各个学院在学术科研这个万花筒中所扮演的角色也各不相同,但各学院之间还是应当加强科研合作,取他人之长补己之短,这样才能为该高校向科研大校、科研强校的进军道路上打下坚实的基础。

参考文献:

[1]薛薇.SPSS 统计分析方法及应用[M].二版.北京:电子工业出版社,2006:303-349.

[2]张文彤.SPSS11统计分析教程―高级篇[M].北京:北京希望电子出版社,2002:166-210.

[3]李卫东.应用多元统计分析[M].北京:北京大学出版社,2008:226-240.

[4]阎慈琳.关于主成分分析做综合评价的若干问题[J].数理统计与管理,1998(2):22-24.

[5]胡永宏,贺思辉.综合评价方法[M].北京:经济科学出版社, 2000.

篇3

[2]肖彦花.统计学理论与方法[M].长沙:国防科技大学出版社,2005:4-5.

[3]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:2.

[4]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2012:5.

[5]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:20.

[6]袁山.统计分析工具在历史研究中的应用[J].中国青年政治学院学报,2002(4):88-93.

[7]邱均平,王曰芬等.文献计量内容分析法[M].北京:国家图书馆出版社,2008:157-158.

[8]丁牧羊,王Q淇.《周礼》文档名词再研究[J].档案学通讯,2015(6):32-39.

篇4

与此同时,如果统计学方法应用不当,不仅不能准确地反映科研结果,而且还可能带来错误的结沦。Rosenfeld 等比较了不同年表的文章,在20 世纪90年代以后有更多的文章使用了统计推断,而且比较复杂的统计分析方法如多因素分析等也更多的应用于临床研究中,但同时也存在使用统计方法欠妥或叙述不清的情况。

因此本文将对医学科技论文常见统计学方法的正确应用进行讨论,希望加强作者的统计思维,进而提高期刊论文的统计质量及学术水平。

2、统计学方法的内容

统计软件包、统计分析方法及检验水准是统计学方法必须描述的3 方面内容。SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界学术界公认且最常用的两大统计软件包[6]。检验水准即A,表示组间实际无差别而统计结果判断为有差别,犯这类错误的概率[1]。实际工作中常取 A=0.05,表示本次研究计算所得P 值必须小于0.05,才能认为组间差异有统计学意义。统计分析方法的准确描述是科技论文科学性的关键所在。统计学方法一般包括统计描述和组间差异性检验(即:假设检验) 两部分内容。

3、统计学方法的正确选用

统计方法的选择取决于研究设计、数据资料类型和变量值的分布。计量资料常用u检验、t检验(.配对t检验)、 F检验;计数资料用 检验;等级资料、偏态资料或不明分布的资料可用秩和检验等。每种显著性检验方法均有其适用范围, 如方差分析(F检验).要求数据服从正态分布, 且各总体方差齐, 否则不宜作方差分析, 若改用非参数统计方法, 则会降低统计效率, 故常在可能情况下, 通过变量变换(如对数变换、平方根变换、反正弦函数变换、例数变换等)使资料转换为正态分布, 以满足方差分析或t检验的应用条件。医学期刊中最常见的是t检验和 检验, 这两种方法误用也较为多见。

3.1重复t检验

多个样本均数间的两两比较(又称多重比较)不宜用t检验, 因为重复数次,t检验将增加第一类错误的概率, 使检验效率降低。此时宜用方差分析, 并在此基础上用两两比较方法..(如.SNK、LSD、Duncan法等)。对于同一对均数间的差异, 用t检验无显著性, 而两两比较可能有显著性, 可见错误选用统计方法将推出错误结论。

3.2行列标 检验误用

行列表 检验用于2个或多个样本率(或构成比).比较, 它要求行列表中不宜有1/5以上格子的理论频数T

3.3需要注意的统计学问题

3.3.1无足够的统计学信息

论文中未说明统计方法和 取值, 无均数、标准差或率及t值、 值等统计量, 甚至未作假设检验直接下结论。不少临床医学论文作者只在文中提及P值大小并据此推断结果的显著性。实际上, 临床医学研究关心的是各组之间结局(如疗效)的差别大小, 而不单纯是统计学显著性, 因此应同时说明检验方法、 水平、统计量值、P值和可信区间, 以便让读者了解所用的方法和结论是否适当及其临床的实际意义。

3.3.2统计图、表

统计图、表是统计描述的重要工具。统计图宜少而精, 应按资料性质和分析目的选用适合的统计图形, 统计图虽直观但不能代替精确的数据或统计量同。统计表宜简单明了, 层次清楚, 一般采用三线表。常见的统计表运用不当有.. 标题复杂或过于简略甚至无标题, 辅助线过多, 标目繁杂, 层次不清。另外, 表内不宜留空格, 暂缺或未记录可用“…” 表示, 无数字用“一”表示, 数字若是“0”则填明“0”。

3.3.3统计软件使用的误区

目前计算机应用已十分普及, 统计软件的使用也非常方便, 但软件只能解决计算问题, 并不能替代人脑的统计思维。根据资料的分布特征和数据特点选择统计方法, 正确地解释分析结果并推导出正确的结论, 这是科研工作者在做统计分析时必须首先掌握的, 计算只是一种工具。有了诸如SASA、SPSS等高级统计软件包, 复杂了多元分析如多重回归、多因素方差分析等已变得十分容易, 于是一些作者片面追求使用高深的多元统计方法且多种方法一起用, 误以为统计方法用得越高级, 文章水平越高。实际上如果使用不当, 多元统计方法使用得越多, 错误可能也越多。一个精心设计的临床研究, 资料可能用简单的t检验或 检验就足以说明问题, 若滥用多元分析、结果会适得其反。

4.结语

通过上面的分析,在医学研究中必须正确运用统计学,这是科研工作的科学性所决定的。搞科研,首先必须尊重科学。借助统计学这个有用的工具,可以去探索未知事物,揭示和阐明客观事物变化的规律性。

参考文献:

[1]于国艺, 周晓彬, 王俊. 医学论文常见统计方法误用分析.编辑学报, 1998;10(3):132.

篇5

一、引言

 

在我国数学已经是全民教育了,数学作为基础学科,一个人从小学到大学要经历近十几年的数学学习,但是近年来,在对工科、经管类硕士研究生的数学基础课教学中发现,其中仍然存在着许多问题亟待解决,本文将通过对教学过程中所出现的关键问题进行分析、归纳总结,探究其产生的原因并试图给出解决这些问题的方法和途径。

 

二、教学现状分析

 

我校面向工科、经管类硕士研究生开设了《数值分析》、《统计计算》、《偏微分方程数值解》和《多元统计分析》四门数学公共基础课,由学生在导师指导下从中任选一门作为学位课,在教学过程中存在以下一些几方面的问题:

 

(1)部分学生的数学基础薄弱、适应能力差。由于硕士研究生招生规模的增加,学生的数学基础参差不齐,客观上造成了一些学生对数学课程学习的畏难心理,加之由于学时的限制以及研究生阶段学习的特点,使得教师在讲授过程中不能面面俱到,所以对基础知识差的学生造成了学习困难、跟不上教师的节奏,学习效果不佳的状况。

 

(2)教学思想和观念滞后于时代的发展。研究生数学基础课的教学观和部分学生的学习观存在着与创新人才培养目标不相适应的现象:以科研和论文为主的价值取向淡化了数学基础课程教学和学习的重要性,误认为课程学习的目的只是为了修满学分,从而忽视了数学基础课程学习对科学研究和论文的基础性作用。

 

(3)缺乏实践性教学环节。尽管数值分析、统计计算、偏微分方程数值解和多元统计分析作为数学公共基础课开设,但它们本身具有极强的应用性,涉及到大量的计算,而这些计算往往要借助于专业的软件通过计算机来实现,而教学中缺少相应的上机实践环节。

 

(4)缺乏课堂教学评价与激励机制。目前研究生期末考试分数是作为评价教学效果的唯一依据,缺乏对学生学习过程的评价。

 

针对以上存在的问题,在教学过程中需要结合数学课程的特点和学生的实际情况,从教学内容和教学方法方面进行改革,提高数学课程的教学质量。下面结合具体的教学实践,介绍在数学公共基础课教学中实施的做法和认识。

 

三、教学改革的具体措施

 

1.优化教学内容,改革教学方法

 

在以往在研究生数学教学中存在着重理论、轻实践,重推理、轻应用的倾向,由于工科、经管类学生的数学基础相对薄弱,这样的教学方法在一定程度制约了学生的学习热情,所以我们在教学过程中根据工科、经管类研究生学生的数学基础及今后的发展方向,提出了加强基本概念、原理和方法的教学,淡化繁杂的公式推导及定理证明的教学原则,同时强调在教师在教学过程中用自己在教学与科研中的体会去启发学生思维,激发学生的学习与创新的动力,培养学生的数学思维能力。例如在多元统计分析中,讲授维沙特分布、霍特林分布和威尔科斯Λ分布三个重要的分布时,就采用与一元统计分析中x2分布、t分布、F分布三个分布对应比较,简化推理过程,着重强调应用原理,达到事半功倍的效果。

 

2.加强数学课程的实践性教学

 

实践性课程在研究生能力培养过程中起着非常重要的作用,实践性教学环节不仅能检验学生的数学理论知识、动手能力与研究水平,还可以提高学生分析问题、解决问题的能力,为学生今后从事科学研究奠定基础。我们的做法是在教学过程中遵循学生对数学知识需求和学习能力提高的要求,密切联系实际,一方面开展案例式教学,以提高学生应用数学知识解决实际问题的能力。例如在多元统计分析中介讲解聚类分析方法时,引入利用汽车的参数指标对不同品牌的汽车进行分类的案例教学,就取得了好的教学效果。另一方面引进常用数学软件的学习,使学生既掌握理论知识,又能合理利用数学软件进行实践操作。在教学过程中将MATLAB软件引入到数值分析、统计计算、偏微分方程数值解的课程中,将SPSS统计软件引入到多元统计分析课程中,结合不同课程的特点和教学目的,融合现代计算方法,通过讨论和上机操作,帮助学生掌握和巩固知识,增强学生对实际问题的处理能力。

 

3.改革教学评价方法

 

首先改革研究生数学课的考试内容,要求试题既要检测研究生对数学基本理论与基本方法掌握的情况,又要测试研究生能力和素质高低;其次改革评分方式,将学生的平时学习情况、课外上机实践、创新型小论文等纳入学业总分,实行多种考核评分方式相结合的综合评分方案,改变用单一的期末考试成绩来评价学生。

 

4.开展研究生数学建模活动

 

近年来开展的了全国研究生数学建模竞赛活动,为研究生的数学学习提供了一个很好的平台,也吸引了越来越多高校的研究生参加此项活动。我们积极组织、鼓励研究生参加全国研究生数学建模竞赛,并对学生进行专门的培训,对表现优秀的研究生给予奖励。通过参加数学建模竞赛,对于研究生提高分析问题和解决实际问题的能力、培养团队合作精神是一种历练,使学生完成从学习知识到运用知识的转变,从中找出差距与不足,提高了研究生对数学的学习的兴趣,意识到数学在实际应用中的重要性,增强了研究生应用数学方法解决实际问题的能力。

 

四、结束语

 

随着我国教育事业的发展,人才的培养从知识性教育转向创新能力培养,加强工科、经管类研究生公共数学基础课程的教学改革工作,是一项重要的任务,我们本着“淡化数学理论, 强化应用教学, 注重软件学习”的原则, 在教学中强化数学基础理论和方法的基础上,深化现代数学理念的培养,全面提升研究生教学质量,培养出社会所需要的创新型人才。

 

篇6

一、 企业财务危机和多元统计分析

企业在经营过程中由于无力按时偿还到期的债务而产生的危机和困难就是企业的财务危机。一般来说,判别企业财务危机的常用标准是企业破产和证券交易中面临的退市现象。而企业是否能够生存下去的关键性因素正是如何正确处理好企业的财务危机。

多元统计分析是属于统计学中的一个重要分支,作为一种综合分析方法,能够在多个对象和指标相互关联的条件下分析其统计规律,“内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。”

    目前,由于我国的会计制度还存在一定的缺陷,时效性和精准性都还达不到要求,因而本文主要从企业由于现金流短缺,不足以支付所欠到期的债务而产生的财务危机的角度,利用多元统计分析的方式进行统计和分析。

二、多元分析的基本思路

据有关调查显示,现代经济市场行业类别的差异性导致了财务危机预警模型及参数的不同,所以需要采取不同的模型和方法来进行研究。运用多元统计分析方法进行多种变量模式的实证分析,从而提高了模型的针对性和可操作性。针对企业的多个财务指标,可以用聚类分析法进行统计分析,然后用判别分析法进行预测判别,最后用主成分分析法进行提取分析,根据最终的综合得分对样本进行适当排序,从而发现财务危机的状况,运用数据分析软件SPSS进行数据处理分析,建立企业财务危机预警模型。

三、 利用判别分析和主成分分析建立企业财务危机预警模型

第一,选择样本和变量选取。

在企业财务危机模型的建立过程中,首先要在企业中利用抽样方法进行选择。一般来说,可以选择随机抽样和对应样本法。

在企业中,选取“销售净利率、主营业务利润率、净资产收益率、资产净利率、每股收益( EPS) 、应收账款周转率、存货周转率、总资产周转率、营运资本总资产比、资产负债率、流动比率、现金负债总额比(债务保障率) 、现金流动负债比、现金流入流出比率、销售现金比率、每股净资产来建立指标体系作为分析变量……”等28 个指标是企业盈利、偿还等能力和资本实力的展现,也是交全面的反映企业的财务状况的指标,多变量模型的财务预警分析中,变量越多选择的余地越大,模型建立就越好。

第二,判别分析

根据样本和变量的选择,利用判别分析法建立企业财务危机的预警机制;同时根据判别分析法分析统计的研究对象分类,创建一组判别函数,确定好判别的规则,分类待判别的样本。

一般来说,用的Fisher 线性判别函数是判别分析中比较常见的。函数形式为: “Yi = a1 x 1 + a2 x 2 + ?+ an x n + b ( i =1 ,2 , ?, k) 。其中, k 是判别组数, Y 是判别分数或判别值; x1 , x2 , ?, x n 是因变量或预测变量; a1 , a2 ,?, anj 是各变量的系数,即判别系数; b 是函数中的常数。”

而判别函数的方式主要是全模型法和逐步选择法。全模型法是指函数中所有的变量都作为因变量,而逐步选择法是一种能反映变量子集的差异性的判别函数,利用逐步引入变量的方式,直至所有的变量都不符合模型的既定条件。

判别分析的基本步骤体现为:一、选择函数中的因变量、组变量;二、“计算各组单变量的描述统计量,包括组内平均值、组内标准差、总平均值、总标准差、各组协方差矩阵、组间相关矩阵,并对组间平均值相等及协方差矩阵相等的零假设进行检验”;三、建立Fisher 线性判别模型并进行判别分组;四、样本判别分析和验证分类的精准率,最后再输出结果,下结论。

第三,主成分分析

在企业财务危机中,除了判别分析模型的建立之外,主成分分析也是较为普遍的方式。首先可以通过验证筛选,选择需要建立模型的初选变量,且变量间存在一定的相关性。在变量较多的情况下,高维空间的研究样本通常都比较复杂,因此需要利用主成分分析方法实施第二次筛选,使得模型精简化。

主成分分析主要是分析企业财务危机数据信息中较为主要的变量,综合变量又能尽可能多的反映原来变量的信息,并且彼此之间互不相关的一种降维的多元统计方法。在企业财务危机分析中,具体是指,对企业收集的原始数据和财务指标进行标准化的处理,取平均为零,方差取1;然后,利用标准化的数据计算财务指标间相关系数矩阵R;最后,按其相关矩阵计算求解相关系数矩阵的特征值和特征向量、贡献率及累积贡献率。

实际上,企业的财务危机预警分析总的多元统计分析还包括其他比较常见的分析方法,本论文主要讨论了主成分分析法和判别分析法,利用变量之间的关系通过函数建立企业财务危机预警模型。

结 语

随着市场经济竞争地加剧和证券流通的全球化,原有的市场机制逐步暴露出弊端,出现企业机构投资者和控股股东相互博弈的局面,而这些弊端正是企业危机的潜在表现,如不加强对企业危机的有效控制,就有可能导致企业破产。因此,利用多元统计分析,提前预测企业的财务危机,建立有效的预警机制,对企业来说具有非常重要的意义。

参考文献:

篇7

中图分类号G251 文献标识码A 文章编号 1674-6708(2014)114-0013-02

当前,世界各国的许多高等院校和科学研究机构都在加强对图书情报的研究,许多世界一流院校,比如Harvard University(哈佛大学)、Princeton University(普林斯顿大学)、Yale University(耶鲁大学)、Massachusetts Inst. of Technology(麻省理工学院)等都建立了比较完善的情报学教育体系。而比较而言,在我国高等院校与科研院所对图书情报学的相关研究,明显要相对落后,近年来随着改革开放的深入推进,有关情报学的招生和课题研究有所提升,并呈现出较为快速的增长态势,然而由于研究内容相对较为高深,而且研究的靶场显得较为前沿化与多元化。基于关键词对学位论文进行统计、研究与分析是文献计量学的范畴,是图书情报学研究的重要内容。即以学位文献或学位文献的某些特点为标的,以聚集梳理一定数量文献为基础,由此展开对某一时域某一领域科学技术基本状况与基本特征的研究,并由此论述和预测该领域科学技术在今后一段时期的研究趋势与特点规律态势。基于独特关键词进行图书情报领域的硕士学位论文进行分析,是情报学研究的一项重要方法,是一种将文献资料中的众多核心要素关联起来,进行统计分析的引证分析方法,其可以较为科学地评价文献所研究与发展的现状和趋势,揭示学科当时研究的热点,较为准确地评价文献所代表的学术水平。

1 研究对象数据来源

本文研究的对象定位于对国内图书情报领域这一总体框架,并于此基础上将“靶向”集中于硕士学位论文的统计、分析与研究,将“靶标”聚集到硕士学位论文的研究热点、趋势、重点、前沿以及其变化情况,从而更加清晰地梳理出我国情报学研究的发展脉络,从而为我国情报学教育发展提供参考。研究的主要数据来源集中于国内著名的学位论文收集库――中国知网CNKI学术文献总库、维普期刊资源整合服务平台与万方数据知识服务平台“三大论文数据库”,以及国内高等院校图书馆自建特色数据库。其中,中国知网CNKI和万方数据库是国内收录学位论文最为全面的数据库,因此,为了确保分析研究的数据具有较高可信度与代表性,分析研究检索的数据源即来自该两个数据库,着重定位于“学科专业名称”、“学科专业分类”选项进行检索,而检索的时间区域定位于近10年,对于两个数据库检索出来的文献,对于相同的通过采用SQL 语句进行筛选,剔除重复的以及不符合的。

由此,以“情报学”作为检索词,从中国知网CNKI数据库获得1640篇硕士论文,从万方数据库中获致1315篇硕士论文,通过SQL筛选剔除重复的以及不符合的795篇,总共获得有效国内图书情报领域硕士论文2160篇。

2 基于高频关键词的国内图书情报领域硕士学位论文特点

通过对获取到的2160篇国内图书情报领域硕士论文进行研究,综合统计论文的关键词,累计关键词有13976个,经过分析研究,去除不能表达论文主题概念的关键词3645个,共得10331个,平均每篇硕士文献关键词数为4.78个,由此可说明该统计是科学的,与国外科文献资料对关键词的标引规则相符(国内外科技期刊要求的每篇关键词应标出 3-8 个),接着对关键词的词频进行统计分析,将关键词的频度大于60作为标准,将其定义为“高频词”,通过对“高频词”的统计分析,可以非常清晰地看出,有关“知识管理”这一主题的频次最高,多达126次。无疑,这也证实了近些年来,学术界对知识管理这个方向的研究热点。此外,“电子商务”为121次、“信息化”为118次、“信息技术”为112次、“竞争情报”为102次、“信息服务”为98次、“信息检索”为96次、“数据挖掘”为87次、“数字图书”为84次、“信息资源”为79次、“电子政务”为75次、 “知识服务”为71次、“知识共享”为68次、“数据仓库”为63次,从中也反映了我国对信息化建设、知识服务、数字化建设等关注在日益提升,也验证了我国国务院学位委员会重新颁布的《授予博士、硕士学位和培养研究生的学科、专业目录》中“图书馆、情报与档案管理”的实效,表明了情报学与管理学之间渗透和结合日益加强,也可以折射出当前研究的重点、热点仍然集中在情报学基础领域,并预示着今后情报学研究的一个重点将是对网络信息资源的开发、整合与利用。

3 基于聚类共词的国内图书情报领域硕士学位论文特点

通常来说,仅仅通过孤独地察看论文的某一关键词,通常是难以有充足的理由说明该论文所研究的主题,然而通过关注两个或者两个以上的关键词,将可以给予人们更加充分的信息去把握论文的大致内容和论文的主题脉络。通过采取计算机数字高效处理作用,充分发挥Excel的数据透视功能,再次对出现次数高于60的高频出现的关键词进行“聚类性”分析,统计在同一论文中两两同时出现的关键词,从而构建出60 × 60的“聚类共词矩阵”,通过这一矩阵的研究,非常清晰地显示出“聚类共词矩阵”是一个对称矩阵,其中位于矩阵对角线上的数据显示的是某关键词自身一同出现的频次,这个一同出现的现象就实质来说,就是论文之间的相关度,对于非对角线上的数据,则表示不同关键词之间的共现频次。通过这个矩阵可以从另一个侧反题出,关键词分布既有交叉、相互渗透又具有群组分布的独立性。通过Excel的数据透视处理得到共现频次较高的有:“知识管理”为124次,“电子商务”为106次,“竞争情报”为101次,“高校图书馆”为98次,“信息服务”为92次,“数据挖掘”为87次,“数学图书馆”为83次,“信息资源”为81次,“电子政务”为79次,“知识共享”为72次,“数据仓库”为66次。由此可以看出,在国内图书情报领域硕士学位论文的研究主题中,当前基于数字化、信息化、电子化的知识管理与数据挖掘是个热点,同时也说明我国情报学教育研究的领域在不断拓宽。

综合以上,关注独特关键词下国内图书情报领域硕士学位论文研究的学科结构特点,获得了基于高频关键词的国内图书情报领域硕士学位论文特点,以及基于聚类共词的国内图书情报领域硕士学位论文特点,通过对研究结果的比较分析,得出了一些有较为充足理由支撑的结论,那就是从中可以较为清晰地得出,当前以及今后一段时期国内图书情报领域硕士学位论文研究的侧重点在于“数字化、信息化、电子化的知识管理与数据信息挖掘”。

参考文献

[1]曾学喜.网络舆情突发事件预警指标体系构建[J].情报理论与实践,2013(11).

篇8

前言

统计方法是科学与实践中一种很有价值的定量分析工具,在近几年的推广普及中,将其用于体育科研、教学、训练、管理等方面,取得了可喜的成果。成功应用统计方法的范例,不胜枚举。但纵观统计方法的应用,还存在不少问题,需要我们去探索研究。本文将对“硕士生论文中统计方法的不合理应用”,通过实例剖析,找出症结,以供借鉴。

1、硕士论文中统计方法面临的困难

随着体育运动不断向现代化和科学化深入发展,体育统计已日益普及,渗透到体育教学、训练、科研、管理等各个方面,并正在发挥着重要的作用。体育统计以统计理论研究体育教学,运动训练和体育管理,是现代体育的主要研究方法之一。现阶段,体育统计在方法应用上较为薄弱,难以适应和满足体育运动实践,发展和科学研究的需要。

2、统计资料的分析

2.1计量的

例如:人的身高、体重、血压、肩宽、大腿围,所有田径、游泳项目的运动成绩,等等。这一类资料的特点是:原则上它的取值可以是在某一区间内的任一实数。通常称这类资料是连续的,或考察的指标是连续的。它的统计分析是与具有密度的连续随机变量的分布有关。

2.2计数的

例如:人的每分钟脉搏跳动的次数、1分钟仰卧起坐的个数、引体向上的个数等等。这一类资料的特点是:它们取值的范围是整数,大部分还只在非负整数范围内取值。通常称这一类资料是计数的,或考察的指标是计数的。它的统计分析是与离散的随机变量的分布有关。

2.3有序的

有些资料既不能计量,也不能计数。例如《国家体育锻炼标准》中的达标等级、排球比赛中的进攻战术效果、学生体质的好坏等等。这一类资料的特点是只能评出优劣顺序,而无法量化。通常称这一类指标和资料是有序的。

2.4名义的

有些资料不是计量的、计数的,也不是有序的,它仅仅是一个名义值。例如城镇、乡村……中国队、日本队……,吸烟、不吸烟……。

3、统计方法的应用现状

3.1样本代表性不高,样本量的大小确定不当

样本是随机地从总体中抽出的,所以它对总体具有代表性。实际研究中有时根本不可能完全得到总体,所以按照随机原则抽取适当的样本来对总体进行研究,才能保证样本具有一定的代表性。而在实际应用中常常发现有的研究者不按随机原则抽取样本,而是按主观需要随意确定样本研究对象。

3.2配对比较未能坚持样本组间的条件齐同

配对比较适用的范围一是同一批实验对象前后结果的比较,即同体比较;二是将基本条件相同的实验对象配成对,然后随机地将每对中各一人分在实验组和对照组,严格地实施只有实验条件不同而其他条件均同的实验。实验后,比较两组的结果差异是否有显著意义。

3.3对比资料的可比性

统计显著性检验的基础是对比资料应具有可比性。在探索某些事物的内在规律时,经常要运用对比分析的方法,这种方法要求排除一些表面的、偶然的现象,而有的研究者却未注意到要控制其他的条件,将多因素资料进行单因素的对比。

3.4统计结论描述不确切

有些研究者在假设检验中仅凭计算结果P≤0.05或P≤0.01就轻易做出结论,且肯定结论的科学性是欠严谨的。因为影响统计结果科学性的因素很多,不是计算唯一能决定的。统计计算也是有局限性的,其结论是从概率角度描述的,不是的肯定和否定,故对计算结果一定要用专业知识加以定性分析。

3.5小样本的均值检验

在小样本(n≤30或n≤50)的均值差异显著性检验中,若方差齐性(σ12=σ22)可用“t”检验,而方差不齐性(σ12≠σ22),则要用“t”检验。不少的研究者在小样本的均值检验中基本上采用的是“t”检验,但文中又未作说明方差是否齐性。这种错误源于对抽样分布理论上的认识不足。

4、正确选择统计学方法

4.1对统计资料进行分类

研究中的统计资料大体可分为计数资料、计量资料、有序资料和名义资料4大类。计数资料指的是可以命名而不可能作顺序大小来排列的资料,如性别、专项、职业等;计量资料指的是资料具有连续定量分布性质,例如身高、年龄、心率、血压、肩宽、大腿围,所有田径、游泳项目的运动成绩等;有序资料是指资料既不能计数也不能计量,其特点是只能评出优劣、好坏顺序等,而无法量化;名义资料是指资料既不是计数的、计量的,也不是有序的,它仅仅是一个名义值,只起着一个名义的作用。

4.2资料的组间比较

研究资料中经常遇到实验组和对照组的问题,例如体育训练过程中对运动员进行心理暗示和不进行心理暗示是否有显著意义,这时的比较只进行两组间比较。如果资料中有两组以上,比较量就会随组数的增加而增加,在做多组间统计学分析时,一定先做整体的显著性检验 。

4.3单侧或双侧检验的选用

如果根据专业知识和经验可以判断检验结果只有一种可能性,那么就选用单侧检验。如果结果不能确定,就选用双侧检验。尤其在一些运动中生理指标的明显提高,可以肯定和根据常识确定需要运用单侧检验。

4.4显著性检验

(1)计数资料采用卡方检验,可以检验两组或两组以上的统计学显著性差异。

(2)有序资料中的等级资料唯一的显著性检验方法是非参数检验。

(3)计量资料如果只有两组资料,可采用t检验,两组以上的资料则选择方差分析。

4.5多元统计分析

多元分析在体育研究中被广泛用于,对运动员选材、体质因素分析、不同手段对训练方法的有效性,以及对体育成绩的预测分析等方面,与单因素分析比较,分析更为全面深入。多因素分析的变量很多,计算复杂、工作量大,用手工计算是不可想象的,目前的SPSS统计软件可以减少它的运算量。

5、选用统计方法应注意的问题

(1)课题设计应与研究的目的、统计分析方法结合起来考虑。

(2)要熟悉被选用方法的统计分析思想,明确数学模型中各参数的统计意义。这样,可结合专业知识给分析结果一个合理的解释。

(3)研究样本应具有一定的代表性。一个基本概念就是随机性,就是总体中每一成员都平等地包括在入选范围中。样本的大小也是一个重要因素。在多元分析中,一般认为适宜的样本至少是指标个数的5~10倍,指标越少其倍数越多。取样时间也是不可忽视的因素。

参考文献:

篇9

2介绍并提供材料

为了增强学生学习兴趣,随着课程的进行,陆续介绍相关的资料。以2010年度授课提供的资料为例。①人大经济论坛,此论坛资料丰富,有很多案例分析的数据资源。②《女士品茶》统计科普书籍,该书生动有趣,可作案头书。③《北美一流统计学专业课程设置》,了解到很多同学想出国深造,所以提供该研究报告。④2010国内统计学热点研究问题,以此了解统计研究热点问题。⑤《离散多元分析-理论与实践》,主要介绍定性数据分析的理论,以此做相关课程介绍。⑥中国人民大学统计学院2010境外讲学课表,从中可以了解统计学热门研究领域。⑦西南财经大学博士论文《个人住房抵押贷款提前还款风险实证研究》,培养统计方法的综合运用和资料查询。该论文里面用到了因子分析、判别分析、聚类分析、逻辑斯蒂回归等统计方法。

3作业的布置及相关培养

在大学数学课程学习过程中,培养学生应用数学的意识和兴趣,提高学生的应用能力是大学数学课程教学改革的重要方向。根据选课人数分成兴趣小组,以小组为单位留大作业,鼓励大家查找资料、编程、实证分析,处理实际数据,分析解决实际问题的能力,侧重于数学知识的综合应用(见表1)。

篇10

一、经管类专业统计学实践教学的目标及重要性

统计学实践教学是指学生在学习期间不间断地进行的一个完整的教学过程,体现在案例教学、课程实验、模拟实验、社会调查、校外实习、毕业论文等环节中。通过实践活动让学生学会信息搜集、整理及加工分析统计数本文由收集整理据,培养以定量分析和定性分析相结合的统计思维,提高分析和解决实际经济问题的综合能力。因此,对于经管类专业的学生来说,统计学教学应该更多地考虑如何与经济、管理类知识紧密结合,重视统计方法在经济与管理领域的实践与应用。

二、经管类专业统计学实践教学存在的主要问题

多年来,从学生的课程论文、分析一些统计问题以及毕业论文的撰写过程中发现,统计学实践教学主要存在以下问题:

(一)部分教师教学时重理论轻实践

部分教师传统教育和封闭型的教育理念比较重,在教学中忽略实践教学环节,重视统计分析方法的介绍,轻视统计分析方法的应用。一般体现在以下现象中:学生在实践时经常把统计指标弄混淆。学生在课程学习的时候清楚知道各个统计指标的含义及用途,但是在实验或实践时,系统性较差,胡乱运用统计指标。比如,一条手工生产线5个工人的产量和一条半自动生产线5个工人的产量(水平差异很大),要比较这两条生产线上平均工人日产量的代表性。考虑到代表性的大小,那么就选择变异指标(极差、平均差、方差和变异系数),有些同学往往随机选取一种指标进行比较,但他们往往忽略了只能运用变异系数进行分析判断。

(二)实践教学手段单一

部分教师在教学时,幻灯片运用的频率较高,但是网络的教学手段很少运用。这导致学生的电算化能力有限、分析方法和表达形式单一。在学生撰写的研究报告中从始至终都是文字表达,其实有时候图或表更能说明问题;也有的学生进行图或表的绘制后,不做任何的文字说明。读者要一一对比图或表中数据,这样读者就会受限。

(三)部分教师在教学中对实践教学的理解狭隘及片面化

很多经管类专业的统计学实践教学往往在实验室里面进行,主要是给定的案例进行按部就班式的分析操作,这样会导致学生没有兴趣,从而事倍功半,同时也是曲解了“实践”内容的含义。最突出的表现就是学生做毕业论文或分析社会经济问题时,统计分析方法乱用或运用不完整,导致错误的结论。

比如,分析某一地区旅游收入受哪些主要因素影响时,首先把能考虑到的因素旅游人数、城镇居民人均旅游费用、农村居民人均旅游费用、公路里程以及铁路里程等罗列出来后;其次设定并估计多元线性回归模型;第三,识别多重共线性模型;第四,修正多重共线性模型并进行结果分析。但是有的同学单单运用相关系数来分析判断各因素与该地区旅游收入的关系。我个人认为这部分内容应该当作理论内容在课堂上演示操作,而不是当作全部实践内容完成。如果这样做,学生无法体会“将统计分析方法运用于实际生活或工作中”的统计学精髓。

(四)集中的实践教学时间有限,效果不明显

很多高校统计学的总学时60个,实践教学课时10个,甚至有的为了方便考核,还把10个学时全部放在实验室一次性进行。这样没法形成系统性的实践,效果也是大打折扣的。

三、经管类专业统计学实践教学过程完整化体系的选择

基于以上问题,所以文章研究的最大目的就是让学生将统计理论与实际社会经济现象和生活结合在一起,即在各个环节增加实践部分或采用不同的手段和方法,多元化的实践教学体系让学生掌握统计分析方法的同时,运用现代统计分析软件系统分析社会经济现象,并能进行适当的总结归纳,甚至撰写系统性的研究报告。该部分主要从教材选择、教学过程和考核三方面加以论述。

(一)教材选择

作为本科生或专科生的教学,教材的选择尤为重要,主要考虑以下两个方面。

1.案例

授课教师选择教材时,要看其案例是否结合社会经济现象尤其是经济热点或与学生生活密切相关。

举一个简单的实例,中位数的概念是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数。学生看着这一串文字就理不清头绪了,如果附上与学生生活密切相关的案例。如,随机抽取9个学生,那么这9个学生的身高的中位数是多少呢?授课老师可以故意不将9个同学按照身高顺序排列后得出一个中位数值,接下来授课老师又将9个同学按照身高顺序进行排列后得出另一个中位数值,最后让学生自己来判断哪个数值对。至于统计总体为偶数时要判断中位数大小,授课老师可以再抽取1位同学加入9位同学的行列,问题迎刃而解。这样一来可以让学生更容易理解其含义,二来加深学生对授课内容和难点内容的印象。

2.实用性更强

传统教材重理论轻实践,在选择教材时最好是各部分内容对应相关软件的操作方法。这可以提高学生的学习兴趣,同时可以提高学生的自学能力。

现今很多本科生适用的教材,只有各种统计指标的介绍和案例,没有介绍使用各种软件如何计算和操作。现今是科技时代,计算器或笔算已经不能跟上时代的步骤和效率,再说也不能综合解释问题的关联或依存。很多适用技校生的教材,只重视操作而忽视理论,学生知道软件如何操作,但是不知道指标的含义和用途,甚至不知道为什么要这样做。那么,学生进入社会后,没有自己的思想,只是单一的服从。所以,对于经管类专业统计学课程的教材应该选择既重视理论又重视实践的教材。

3.教材中数据要紧跟时代以及结合地域特色

选择教材时要注意教材中的数据不陈旧,而且数据应该具有当地地域性,这样学生在学习理论知识的同时,可以积累其社会知识。比如,数据尽可能从当地统计年鉴中获得。当然,这就对教材有更高的要求,有实力的学校尽可能让自己的老师编写教材供学生使用。

(二)教学全过程

1.理论教学中强化实践内容

在理论教学时,从教学内容、教学方式、方法及手段上强化实践内容,让学生真正理解并做到学并运用于实践。

(1)教学内容

教师教学过程尤其是理论推导的同时结合案例,案例要富有区域特色或与学生密切相关。即要注重理论的实际运用。案例可以来源于周边的典型经济案例,也可以来源于教师课题和教师或学生已经完成的论文。这种通过学生自我分析与老师讲解相结合的方法,使学生被动学习转为主动,利于培养学生自我学习、判断、分析和总结的能力。

(2)教学方式及手段

1)课堂体验方式。即在课堂进行现场实验演示教学。这种方式, 使同学身临其境, 既激发了学生的学习兴趣, 又让他们直接感受到了抽样调查和估计的整个过程, 从而很快就能理解和掌握这种信息搜集和处理方法。

2)直接参与方式。即让学生利用课余时间去亲身完成某项工作。比如,设计统计调查方案的内容时,可以让学生自己确定一个调查目的而展开方案的撰写,而后还可以利用业余时间去实地进行调查,让学生从实际操作中发现方案的不足之处,进而加以修改和完善。

3)运用多媒体教学手段。运用多媒体教学可以使教学更方便,而且运用多媒体教学不仅可以使学生获得更多的知识,而且更形象直观,激发学生的学习兴趣。同时,可以当场演示软件的操作步骤和过程。

统计调查中,很多要依靠小组作业才能完成,所以小组作业法(讨论法)与其他教学方法结合运用的效果会更佳。

2、社会实践教学

在进行实践教学时,要遵循社会实践教学与实验室教学相结合的原则。

(1)选题

在进行社会实践教学时,必须先确定一个明确地目的,那么在选择实践目的时可以遵循的原则是与专业相符或与学生生活密切相关和学生自我确定。这样可以使学生学有所用,而且激发他们的动手能力。

(2)系统性操作

经管类专业统计学实践教学要讲究系统性,让学生了解在面对以后的学习和工作时,应该如何着手。那么统计学实践教学的系统性主要包括调查方案设计、资料搜集、资料的加工整理和运用软件分析资料这几个方面。也就是说,学生在统计学实践时,这几个方面必须一一涉足。在设计调查方案时,特别注意调查项目,考虑问题的连贯性及必要性;在资料的加工整理往往是最容易忽略的环节,很多人认为这个环节就是机械式的录入。所以,很多在这环节只挑选自己认为重要的加以录入,而其他的问题就忽略了,这样往往片面。

(3)撰写研究报告

这部分内容主要培养学生的系统性、总结归纳能力和统计分析的能力(描述统计能力和抽样推断统计能力)。授课老师可以规定研究报告的提纲,一般而言研究报告包括三部分内容:一是调查总体的情况说明;二是样本的描述和分析;三是结论的说明。如果学生对该问题有自己的想法还可以增加一部分内容即,问题的解决方案。

(三)考核

这部分主要从考核形式及考核标准两方面加强提升实践教学内容的重要性,从而使学生自主的重视实践教学。

1.考核形式