时间:2023-07-24 16:14:56
导言:作为写作爱好者,不可错过为您精心挑选的10篇统计学变量的分类,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
关键词:变量标志统计指标统计数据
Key words: Variable Symbol Statistical target Statistical data
作者简介:鲁瑜,女,1963年9月出生,讲师。籍贯:安徽省桐城县,出生地:河南省洛阳市。1986年洛阳大学计划统计专业专科毕业,1997年中南财经政法大学财务会计学本科毕业,2007年西安建筑科技大学工业工程硕士毕业。研究方向为统计核算、企业会计。
那么统计学中讲的“变量”该如何理解呢?变量的概念是发展变化的,按发展变化的时序有以下几种理解:第一、统计中的变量是指可变的数量标志;第二、变量是指可变的数量标志和全部统计指标;第三、变量是指可变的数量标志和可变的统计指标;第四、变量是说明现象某种可变特征的概念,更明确一点,即:变量包括可变的品质标志和可变的数量标志和可变的统计指标。普遍的认为第四种理解更符合客观实际,笔者也赞同第四种理解。
一、统计中的变量是指可变的数量标志这种理解较狭隘,通过讲解引入可变的品质标志也是变量,即“可变的标志”都应作变量看待。
一般变量的讲解是这样进行下去的:首先明确统计学中的几个基本概念,三对六个:第一对是统计总体和总体单位,简称总体和单位;第二对是统计标志和统计指标,简称标志和指标;第三对是变异和变量。总体是所研究对象的全体,是由具有某种共同性质的许多个体所构成的整体,构成总体的各个个别单位,简称单位,也称个体,总体和单位的概念是随着研究目的的不同而发生变化的;标志是说明单位特征的名称,强调单位是标志的承担着,指标是反映现象总体数量特征的概念或名称和具体数值(指标名称+指标数值构成完整的统计指标,但只有概念或名称的指标是统计设计和统计理论中使用的指标概念),是综合各单位的某一标志而得到的,通过对指标概念的理解,首先明确指标是说明总体的,其次明确指标都是用数值表示的,没有不用数值表现的统计指标,这是指标和标志的区别之一,由于总体和单位之间存在着变换关系,标志和指标之间也会发生变换;变异和变量,我多年的教学经验通常是通过对标志的分类讲下去的,标志按在总体单位上的表现是否稳定可分为不变标志和可变标志,一个总体中,各个单位的某一标志的具体表现都相同的标志为不变标志(强调同质性),一个总体中,各个单位的某一标志的具体表现不都(尽)相同的标志为可变标志(强调变异性),如人口总体性别是可变标志,男性人口总体性别就是不变标志;可变标志在总体各个单位上具体表现上的差别就是变异,变异有品质变异和数量变异,如人口总体性别就是品质变异,年龄就是数量变异,数量变异也称变量,即可变的数量标志称为变量,变量的具体取值为变量值。很显然,通过以上的讲解,通常认为变量是指可变的数量标志,即第一种变量的概念。
这种理解,未免太过于狭隘。教师若以此思想去指导教学,难免会陷入不能自圆其说的境地。我们知道,一切总体单位都具有属性特征和数量特征,统计学中将其称为品质标志和数量标志。例如人口总体,这些特征可能是性别、民族、籍贯、文化程度,也可能是身高、体重、年龄、工龄等。对统计研究对象而言,无论其属性特征还是数量特征,往往均具有可变性。并且一个具体的特征可能在一种场合是可变的,而在另一场合是不变的。例如,上述所说人口总体性别是可变标志,男性人口总体性别就是不变标志了。可见性别这个品质标志有时也是可变的。推而广之,品质标志也具有可变性。这样,凡是“可变的标志”都应作变量看待。
然而,这只是对总体内部各单位的差异作静态考察时的变量。如果仅仅把变量定义为“可变的标志”,那么可变的统计指标怎么解释?它是否属变量范畴呢?所以,还得对统计总体作考察。
二、变量是指可变的数量标志和全部统计指标这种理解也不准确,不是所有的统计指标都是变量,通过讲解引入可变的统计指标才是变量,即只有“可变的统计指标”才应作变量看待。
统计有数量性、总体性、具体性和社会性的特点(《基础统计》,梁前德主编,高等教育出版社,2000年8月第1版),由统计的具体性可知,统计所研究的社会经济现象的数量方面是具体的量,是具体的社会经济现象在具体时间、地点、条件下的数量表现、数量关系和数量界限。例如,甲公司2005年的销售收入60亿元就是一个统计指标,而且是具体的、唯一的数值。对于2005年的来讲,销售收入这个指标只有一个数字。因而并非所有的统计指标都是变量。但是若把甲公司2005年至2008年的销售收入60万元、69万元、80万元、84万元依次排列,这时销售收入就是一个变量。可见,只有当同一统计总体的同一指标在不同时间的指标数值形成数列时,统计指标才可能成为变量。
因此,从静态上看,某总体的某一统计指标是常量,但把若干总体的同一指标放在一起,指标就变成变量了。例如,以洛阳市为总体时,2005年各公司销售收入指标是各不相同的,它是一变量。从动态上看,我们常常使用时间数列来处理统计数据,时间数列中的指标数值往往随时间变化而变化。如上,这种不断变化的指标也是变量,前后不同的指标数值就是变量值。可见,统计指标也有可变与不变之分,因而,“可变的统计指标”才应看作变量。
上述第二种观点是把全部统计指标视为变量了,但不是所有的统计指标都是变量,只有可变的统计指标才是变量,因而我认为是不妥的。第三种观点倒是把可变的统计指标视为变量了,但未包括可变的品质标志因而我认为也是不妥的。第四种观点我认为比较可取,但在文字表述上还可进一步具体化,由于说明现象某种特征的概念可以是标志(说明总体单位的),也可以是指标(说明总体的),因而我们不妨对变量作如下明确的定义:所有可变标志和可变的统计指标都是变量,即变量是说明现象某种可变特征的概念。
三、变量的分类:
(一)变量按具体表现不同分为分类变量(品质变量)和数值变量(数量变量)。
分类变量是用于说明事物所属类别方面的可变特征的变量,分类变量具体表现为分类数据,它又可以分为定类变量和定序变量。定类变量是用于区分现象不同类别的变量,它的取值表现为定类数据(如产业部门)。定序变量是说明现象的有序类型的变量,它的取值表现为定序数据(如产品的质量等级)。数值变量是用于说明事物数值方面的可变特征的变量,数值变量具体表现为数值数据,按数值数据的性质不同它可以分为定距变量和定比变量。定距变量是用于测度事物次序之间的距离的变量,它的取值表现为定距数据(如考试分数)。定比变量是说明现象的比例数据的变量,它的取值表现为定比数据(如体重)。
(二)变量按所使用的测量尺度不同分为定类变量、定序变量、定距变量和定比变量。
四种变量的概念已如上所述。四种变量对事物的反映是由低级到高级,由粗略到精确逐步递进的,高级变量能转化为低级变量,但不能反过来。如可将考试成绩百分制转化为五分制,但不能反过来。另外,四种变量适合于不同的统计计算方法。定类变量适合计算频数、频率、x2检验、列联相关系数等;定序变量适合计算中位数、四分位差、等级相关、非参数检验等;定距变量适合计算算术平均数、方差、积差相关、复相关、参数检验等;定比变量适合所有的统计计算方法。几乎所有的物理量和绝大多数经济量都属于定比变量。因此,不仅可以计算总量指标反映它们的总规模、总水平,还可以计算相对指标和平均指标反映它们的相对水平和一般水平。
(三)数值变量按变量取值是否连续分为连续型变量和离散型变量。
连续型变量是指可取无穷多个值,其取值是连续不断的,不能一一列举。它是用测量或计算的方法取得的数据,如温度、身高等。离散型变量是指只能取有限个值,而且其取值都是从整数位数断开,可一一列举。它只能用计数的方法取得的数据,如企业数、人数等。
(四)数值变量按性质不同分为确定性变量和随机变量。
确定性变量是具有某种或某些起决定性作用的因素致使其沿着一定的方向呈上升、下降或水平变动的变量,如我国国民经济总是不断发展的,具体表现为各种经济指标数值上升或下降(如人均收入和单位能耗),虽然也有些波动,但变化的方向和趋势是不可改变的,这些经济指标就是确定性变量。随机变量是指受多种方向和作用大小都不相同的随机因素影响,致使其变动无确定方向即呈随机变动的变量,如,在正常情况下某种机械产品的零件尺寸就是一个随机变量。
总之,统计学是一门逻辑严密的传统学科体系,作为统计学中几个基本概念之一的变量应有一个公认的正确的解释。这对今后统计学理论的研究发展都是很重要的。
参考文献:
[1]王军虎主编.统计学基础[M].武汉:武汉理工大学出版社,2007年7月:10
[2]梁前德主编.基础统计[M].北京:高等教育出版社,2000年8月:6~9
【关键词】 多重对应分析; 相关性分析; 大样本; 分类变量
长期以来,中医的辨证分型纷繁多样,难以统一,同时病理组织检查是许多疾病诊断及治疗的重要依据。如何理清中医证型和病理诊断之间关系是许多临床和基础科研工作者遇到的难题。本研究介绍应用多重对应分析方法实现对中医大样本证型与病理诊断的相关性分析,以期为疾病的临床诊断和治疗提供参考依据和帮助,为中医证候的规范化研究提供一定的思路,为大样本疾病信息资料的临床和基础科研工作者提供可借鉴的统计学分析方法。
1 资料及方法
1.1 资料来源
本研究资料来源于上海市重点学科(第三期) 中医诊断学建设项目(编号:S30302)。为2001年3月~2008年3月上海中医药大学附属龙华医院、曙光医院、岳阳医院及上海市第八人民医院消化科门诊且经内窥镜及病理组织学检查确诊为慢性胃炎的患者1068例。以调查表的形式获得包括基本情况、胃镜及病理组织学诊断、中医主症、食欲食量、全身情况、舌脉象、其他情况等7个部分的内容,共80个变量。所有变量经过命名及量化处理,有程度差异的变量分别赋值1、2、3、4,以示轻重程度从无到重度。对于难以分清程度差异的变量根据有无分别赋值1、0。本研究借用其中病理诊断与中医主要证型的部分实验数据。
1.2 统计学方法
调查表所得数据采用EipData3.1软件进行数据管理,双遍录入和核对,建立相关数据库。应用SPSS11.5统计分析软件中Data Reduction菜单的Optimal Scaling过程对中医主要证型与病理诊断结果进行多重对应分析,以研究它们之间的联系。
2 分析步骤及结果
其分析步骤如下:
Analyze"Data Reduction"Optimal Scaling
Define
Variables框:HP、肠化生、病理萎缩、慢性炎症
选中以上4个变量:Define Range
Maximum框:4 Continue 取值范围在1~4之间
Variables框:主证
选中以上变量:Define Range
Maximum框:8 Continue 取值范围在1~8之间
OK
结果见图1。
HP感染慢性胃炎患者中医证型以脾胃湿热证多见,依次可见肝胃郁热、脾胃气虚等证,与脾胃虚寒证无明显关联。慢性炎症类胃炎患者中医证型以湿浊中阻证多见,次之可见脾虚湿阻证、脾胃气虚证、肝气郁结证,较少出现脾胃虚寒证。萎缩性胃炎患者中医证型以虚证为主,以脾胃气虚证多见,次见脾胃虚寒证,较少出现湿浊中阻、脾胃湿热等实证。肠化生类胃炎患者中医证型以肝胃郁热、湿浊中阻证多见,次之见肝气郁结、脾胃气虚等证。
图1 分析结果
3 讨论
本研究采用大样本的临床病例资料,经统计学多重对应分析方法分析显示,中医证型与西医病理组织诊断间有一定的相关性,这有助于了解疾病不同病情阶段的中西医诊断之间的内在相关性,有利于用辨证与辨病相结合的方式为疾病的临床诊断和治疗提供依据和帮助。如对于无明显临床症状的患者,可以以病理组织的不同特点及舌脉象特征作为中医辨证论治的依据;对于病理组织检查尚未明确的患者,可以结合中医的辨证结果及其他检查初步制定诊疗方案。也可为中西医结合探讨该疾病的病因病机及证治规律寻求理论及临床实践中的结合点,同时为疾病的中医证候客观化研究提供一定的思路和方法。
中医领域的研究很多变量多为无序多分类或二分类变量,同时研究它们之间的联系可用的方法有对数线性模型和多重对应分析两种,从结果的直观性和可解释性上讲,多重对应分析要更好些。多重对应分析是多维图示分析技术的一种,是了解多维数据间联系的一种强有力的方法,该分析方法既有频数的分析,也有各变量间的关系图示。其分析结果主要采用反映变量间相互关系的对应分析图来表示。该图形中的每个散点代表了某个变量的一个水平,有较紧密关系的水平其散点将紧密地靠近一起,从而在结果的解释上非常的直观。在解释该图形时遵从的原则是:落在由原点(0,0)出发接近相同方位及图形相同区域的同一变量的不同类别具有类似的性质;落在原点出发接近相同方向及图形相同区域的不同变量的类别间可能有联系。SPSS11.5统计分析软件易于实现多个变量间的多重对应分析。但在变量较多时可能会掩盖真实联系,同时使得图形一片混乱,难以看清(根据此次实际操作经验,每次最多选入的变量不能超过13个,否则真的是一片混乱,无法处理了)。此时需要用户根据经验和分析结果进行耐心的筛选,以得到最优结果。这对使用者的分析水平和职业道德都是一个严峻的考验。
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2017)03-0066-03
统计学是生物学领域进行科学研究不可或缺的工具,目前大多数高校已把生物统计学列为生物学相关专业的必修课。通过该课程的学习,有利于培养学生正确分析试验数据的能力,对于进一步学习专业课程和日后进行科研也有着非常重要的作用。近年来,统计分析软件的应用越来越普及,应用统计软件来辅助生物统计学的理论教学变得尤为重要。[1][2]
Excel作为常用办公软件,除具备较强的图表和计算功能外,还提供了大量的统计函数和数据分析工具。利用Excel的统计功能,可快速、简便地进行描述性统计、t检验、方差分析、回归、相关等多种统计分析,从而为生物统计学的教学提供了极大便利,强化了教学效果。Excel的统计功能虽不如SPSS、SAS等专业统计软件强大,但具有易学易用的优势,适用于统计学的初学者,可基本满足本科生的教学需要。[3][4]
一、Excel统计函数简介
(一)统计函数的插入
Excel软件提供了丰富的数学和统计函数,将这些函数结合起来应用,可显示出Excel的统计分析功能。[3][4]在Excel 2003菜单中的“插入”项,选择“函数”。或在2007及以上版本中,在“公式”菜单项选“插入函数”命令,之后在“选择类别”栏选择“统计”,即显示大量统计函数。
(二)常用统计函数介绍
1.统计学参数或特征数的计算
数据的标准差、平均数等特征数均可由统计函数计算得到。反映集中性的函数包括AVERAGE(均值)、GEOMEAN(几何平均数)、HARMEAN(调和平均数)、MEDIAN(中位数)等;反映离散性的函数有:DEVSQ(离差平方和)、STDEV(样本标准差)、VAR(样本方差)、KURT(峰度系担┑取
2.数据分类
FREQUENCY函数可对大量数据进行分类和统计,表达式为:FREQUENCY(Data array,Bins array)。该函数为数组公式形式,运行显示出一个分组的频数后,还需选中所有结果的显示区域,按F2键,再按“Ctrl+Shift+En?鄄ter”组合键,方可求出所有分组的频数。[5]FREQUENCY的操作步骤因分类资料的性状而有所差异。A. 质量性状资料:在函数对话框中,“Data array”一栏输入分类数据所在的单元格地址,“Bins array”一栏输入分类标志值所在单元格。B. 数量性状资料:确定好分类的组数、组距和组限后,将各组的上限按升序输入工作表,在“Data array”和“Bins array”分别输入相应的单元格地址。
例:现有350名学生的英语成绩,需按优秀、良好、一般和不及格进行分类,并统计各等级人数。考试成绩为数量性状资料,首先按升序将各组上限按升序输入工作表(60、74、90)形成一列,插入FREQUENCY函数,在“Data array”输入成绩所在单元格区域,在“Bins array”输入各上限所在的单元格区域,确认后即可计算出不及格的人数(
3.概率函数
概率函数可直接计算出给定参数条件下各理论分布的概率值(P)。[6]常用函数有BINOMDIST(二项分布)、POISSON(泊松分布)、NORMDIST(正态分布)、NORMSDIST(标准正态分布)、TDIST(t分布),FDIST(F分布)等。
例如,BINOMDIST函数的功能为计算给定参数条件下二项分布的概率值。函数表达式:BINOMDIST(number_s,trials,probability_s,cumulative),其中num?鄄ber_s为试验成功的次数,trials为独立试验的次数,prob?鄄ability_s为试验成功的概率;cumulative为一逻辑值,用于确定函数的形式,取值为1和0。Cumulative如果取1,结果显示至多n次成功的概率;如为0,则返回恰好为n次成功的概率。
4.t 检验
TTEST函数功能为返回t检验的概率,以此来判断假设检验的显著性。函数表达式:TTEST(array1,array2,tails,type),其中array1为第一组数据所在的单元格区域,array2为第二组数据的区域,tails为分布曲线的尾数(双尾或单尾),type表示t检验的类型。函数运行后得到t检验的概率值(P),如P
5.相关和回归系数计算
CORREL函数功能为计算两变量间的相关系数,以此来判断两变量间的相关程度和性质,表达式为COR?鄄REL(array1,array2),array1和array2代表进行相关分析的两组数据。利用INTERCEPT和SLOPE两函数可计算线性回归系数,函数表达式分别为INTERCEPT(known_x′?鄄s,known_y′s),SLOPE(known_x′s,known_y′s),其中known_x′s、known_y′s为自变量和因变量的数据集合。INTERCEPT函数可计算线性回归的截距(a),SLOPE函数可计算线性回归的斜率(b),从而得到线性回归方程:=a+bx。
二、数据分析工具的应用
(一)分析工具库加载
Excel的分析工具库具有较强的统计分析功能,但此功能通常未默认安装,需加载后使用。
1.在Excel 2003中,在“工具”菜单中单击“加载宏”,在弹出对话框中选中“分析工具库”即可,之后“工具”菜单中即出现“数据分析”条目。
2.在Excel 2007或更高版本中,单击左上角的“Office按钮”,选择“Excel 选项”,在弹出对话框中单击“加载项”,然后在“管理”栏中选择“Excel加载项”,单击“转到”,最后在“加载宏”窗口中选中“分析工具库”,之后在“数据”菜单中即出现“数据分析”条目。
(二)常用统计方法介绍
分析工具库包括描述性统计、t检验、方差分析、回归、相关、F检验等多种统计方法。[3][5]每次使用时,按照各统计方法的格式要求输入原始数据,单击“数据分析”选项,在弹出对话框中选择所需统计方法即可。
1.数据分类
将各组的分类标志值(质量性状资料)或上限值(数量性状资料)输入工作表,在“数据分析”中选择“直方图”;弹出对话框后,在“输入区域”选择分类数据的单元格地址,“接收区域”选择分类标志所在的单元格,运行即可。
2.描述统计
输入数据资料,在“数据分析”中选择“描述统计”,运行后即可得到最小值、最大值、平均数、标准差、方差、峰度、偏度等常用统计量。
3.t检验
t检验包括平均值的成对二样本分析,双样本等方差假设,双样本异方差假设检验。如进行平均值的成对二样本分析,弹出对话框后,分别在“变量1区域”、“变量2区域”输入两组数据所在的单元格地址,之后在“输出区域”选择某空白区域,确定即可。运行结果包括平均数、t值、df、单尾和双尾概率(P)、临界t值等信息。若P
如进行成组设计的两样本均值检验,需先进行F检验:双样本等方差假设,判断两样本所在总体方差是否同质。步骤:分别在变量1、变量2输出区域选择相应单元格区域,运行结果包括方差、F值、单尾概率(P)、临界F值等。如P
4.方差分析
方差分析包括单因素、无重复双因素、有重复双因素三种类型。如进行单因素方差分析,弹出对话框中,在输入区域、分组方式、输出区域分别输入相应信息后,单击“确定”即可。输出结果包括平方和(SS)、df(自由度)、MS(均方)、F值、F crit(F临界值)、P值等信息(表1)。如P>0.05(或F
5.回归与相关分析
线性回归分析:在“数据分析” 菜单选择“回归”, 在弹出对话框中输入Y值、X值、置信度、输出区域等信息后,运行即可得到回归截距(Intercept,a)和回归系数(b)(表2),从而写出回归方程。根据回归系数的t检验结果或方差分析的F检验结果,可判断两个变量间的线性回归关系是否有效。[7]由表2可知,a(Intercept)=-1.382,b=5.503,回归方程为:=5.503x-1.382。由回归系数的t检验可知,P=0.00004
三、结语
Excel软件提供的统计功能基本涵盖了统计学的教学内容,且对于生物统计学的初学者而言,具有易学易用的优势,可作为本科教学的有效辅助工具。在每章理论知识讲解完毕,应紧接着介绍Excel的统计功能、操作步骤和结果解释,把课程理论教学、实际案例分析和软件应用有机结合,可取得较好的教学效果。教学实践表明,运用Excel的统计功能来辅助理论教学,不仅能够加深学生对统计学原理的理解,还可以提高学生运用理论知识来分析数据的能力,从而使得生物统计学的学习变得轻松。在今后的生物统计学教学实践中,应紧密加强Excel软件应用与理论教学的融合,并考虑将 SPSS等专业软件逐步引入教学中,以期进一步提升学生分析处理复杂数据、解决实际问题的能力。
[ 参 考 文 献 ]
[1] 张丹,吕海燕,张幸果,等.应用Excel软件有效提高《生物统计学》课程的教学效果[J].河北农业科学,2012(8):93-95,99.
[2] 魏兴民,任真,代婷.Excel在中医药统计学教学中的应用[J].高等数学研究,2013(1):93-95.
[3] 张联锋,蒋敏杰,张鹏龙,等.Excel统计分析与应用[M].北京:电子工业出版社,2011.
[4] 杨景峰.EXCEL的计算功能在生物统计学教学中的应用[J].内蒙古民族大学学报(自然科学),2012(6):738-741.
【关键词】 胃癌癌前病变; 幽门螺杆菌; 累积比数Logit模型; 单独的二分类Logit模型
有序分类资料最常用的分析方法是累积比数Logit模型[1],对多分类有序反应资料,如果采用一般的二分类Logit模型,而不是累积比数Logit模型,只能获得50%~70%的检验效能[2],说明在处理有序分类数据方面,累积比数Logit模型要优于二分类Logit模型。近几年累积比数Logit模型在国内应用领域有所增多,但不少忽略了模型的使用条件,盲目套用,以致影响所得结论的可靠性。本研究通过累积比数Logit模型在实际数据分析中的应用,说明了忽视模型应用条件所产生的后果,并介绍了如何选择恰当的分析方法。
1 资料与方法
1.1 资料来源
资料来源于1项茂名市某医院的队列研究数据,该研究选择了360名轻度慢性萎缩性胃炎(CAG)患者,根据他们的幽门螺杆菌(Hp)感染情况分为阴性组和阳性组两组人群,随访3年后重新进行病理学诊断,观察他们的病变情况。
1.2 胃黏膜病理诊断
用胃内窥镜观察胃黏膜病变,并在胃体大小弯、胃角、胃窦大小弯、前后壁各取胃黏膜活检组织1块。病理切片照全国胃、十二指肠活检、病理诊断标准进行诊断。每个受检对象以最严重病变为第一诊断。
1.2 统计分析方法
累积比数Logit模型的形式为[3]:Logit(P(Y≤k|X))=ln(P(Y≤k|x)1-P(Y≤k|x))=ak-pi=1βixi ,k=1,2,…,K-1。 (1)反应变量Y为K个等级的有序变量,第k(k=1,2,…,K)类的概率分别为{π1,π2,…,πk},且Kk=1πk=1 。影响因素xT=(x1,x2,…,xP)为解释变量,xi(i=1,2,…,p)可以是连续变量、无序或有序分类变量。则该模型实际上是将K个等级人为地分成{1,…,k }和{k+1,…,K}两类,在这两类基础上定义的Logit P表示属于前k个等级的累积概率(P(Y≤k|x))与后K-k个等级的累积概率(1-P(Y≤k|x))的比数之对数。故该模型称为累积比数模型,其应用有一个基本的假定条件,即比例优势假定(proportional odds assumption)。这一条件要求自变量的回归系数应与分割点k无关,换句话说,无论从哪一点分类,对所有的累积logit,变量xk都有一个相同的βk估计。
单独的二分类logit模型(separate binary logistic modes)主要是把反应变量按照不同分割点合并为不同的二类,然后分别进行二分类的Logistic回归分析[4]。本研究中的反应变量为随访5年后的病变,分为轻度CAG、重度CAG、肠上皮化生(IM)、不典型增生(DYS)共4类,有3个分割点,故定义为3个二分类Logit:一是将IM、重度CAG和轻度CAG合并,即{DYS}VS{IM,重度CAG,轻度CAG},表示至少进展到DYS;二是将DYS和IM合并,重度CAG和轻度CAG合并,即{DYS,IM}VS{重度CAG,轻度CAG},表示至少进展到IM;三是将DYS、IM和重度CAG合并,即{DYS,IM,重度CAG}VS{轻度CAG},表示至少进展到重度CAG。然后以上述分类分别作3次二分类的logistic回归分析。整个分析过程均由SAS 8.2(SAS Institute, Cary,N.C.)来完成[5]。
2 结果
经3年随访后,共67人因各种原因失访,293人具有可供分析的完整资料。其中,118人病变仍为轻度CAG,91人进展为重度CAG,49人进展为IM,35人进展为DYS。具体进展情况见表1。
累积比数Logit模型分析结果表明(表2),除性别因素外,其他因素对胃癌癌前病变的影响均无统计学意义。但从得分检验(score test)结果来看(表3),Hp不满足比例优势假定条件(χ2=24.100,P
为了核实结果的正确性,并充分利用该资料有序的特点,故采用单独的二分类Logit模型进一步分析(表4),可以看出,年龄、性别、吸烟、饮酒这四个变量在不同分割点的OR值相差不大,而Hp的OR值则差别很大。把DYS、IM和重度CAG合并为一类(即“至少进展为重度CAG”)时,Hp的影响有统计学意义(OR=2.334,95%CI:1.402~3.885)。而对“至少进展到DYS”和“至少进展到IM”的影响则无统计学意义。表4 单独二分类Logit模型分析结果
3 讨论
本次研究结果显示,年龄、性别、吸烟、饮酒对胃癌癌前病变的进展无影响。在校正上述因素的影响后,Hp感染主要作用于胃癌癌前病变的早期阶段,Hp阳性者至少进展到重度CAG的可能性是Hp阴性者的2.334倍(OR=2.334,95%CI:1.402~3.885),而对进展到更高级的病变如IM、DYS,则Hp阳性与阴性并无差别。这与有学者提出的Hp主要作用于胃癌癌前病变的早期阶段的结论是一致的[6,7]。
累积比数Logit模型是分析有序分类资料最常用的方法,但其应用需要满足一定的条件,其中一个基本条件就是比例优势假定条件,即自变量的回归系数应与分割点k无关。对于一个自变量xk而言,不同累积比数发生比的回归线相互平行,只是截距参数有所差别。以往有人认为,累积比数Logit模型对这一条件并不敏感,但在实际中,这一条件不满足往往容易导致错误的结论,本研究即证明了这一点。Ralf也曾对这一问题进行了探讨[8],并指出,如果不满足比例优势假定条件,最好采用单独的二分类Logit模型进行分析,否则做出的结论往往给人以误导甚至是毫无意义的。本研究发现资料不满足比例优势假定条件,因此采用了简单且易于理解的单独的二分类Logit模型进一步分析。结果表明,尽管Hp对进展到更高级的病变(IM、DYS)无影响,但对至少进展到重度CAG的影响有统计学意义,即Hp主要作用于胃癌癌前病变的早期阶段。如果忽略比例优势假定条件的检验,接受累积比数Logit模型的分析结果,便会得出相反的结论。
当有序分类资料不满足比例优势假定条件时,还有其它一些方法可供选择[9],如stereotype模型、偏比例优势模型(partial proportional odds models)等[10]。这些方法都是基于累积Logits计算的,因而可与单独的二分类Logit模型直接比较,但其计算过程繁琐,且结果的解释不如单独的二分类Logit模型易于理解。多项Logit模型(polytomous logits models)是基于广义Logits计算的,其计算过程和结果解释均与单独的二分类Logit模型不同,因而二者不可直接比较,一般也不作为比例优势假定条件不满足时的首选方法。
总之,对于有序分类资料的分析,应先看其是否满足模型的使用条件,如不满足,最好换用其它更为合适的方法。本次研究一开始采用累积比数Logit模型分析,结果显示Hp对胃癌癌前病变的影响无统计学意义,这实际上是由于Hp不满足比例优势假定条件所致。在利用单独的二分类Logit模型作进一步详细分析后,则可以发现,Hp阳性者至少进展到重度CAG的危险显著高于Hp阴性者。
【参考文献】
1 McCullagh P.Regression Models for Ordinal Data (with Discussion). J.R.Stat Soc,1980,42:109.
2 BG Amstrong,M Sloan.Ordinal Regression Models for Epidemiologic Data.Am J of Epidemiology,1989,129:191~204.
3 Ludwig Fahrmeir,Gerhard Tutz.Multivariate Statistical Modeling Based on Generalized Linear Models.Beijing:World Publishing Cooperation,1998,75~79.
4 Ralf Bender,Ulrich Grouven.Using Binary Logistic Regression Models for Ordinal Data with Non-proportional Odds.Journal of Clinical Epidemiol,1998,51:809~816.
5 Ralf Bender,Axel Bender.Calculating Ordinal Regression Models in SAS and SPlus.Biometrical Journal,2000,42:677~699.
6 Kunio Takeuchi, Yoshihiro Ohno, Yasushi Tsuzuki, etc. Helicobacter pylori Infection and Early Gastric Cancer.J Clin Gastroenterol, 2003,36:321~324.
7 夏志伟,林三仁.幽门螺杆菌与胃癌.幽门螺杆菌感染的基础与临床(修订版).北京:中国科学技术出版社, 2002, 172~178.
目的:提出一种基于改良马氏深度函数的多变量参考值范围统计学建立方法,并以此为基础探讨统计深度函数在解决多变量参考值范围问题方面的实际应用价值. 方法:采用计算机模拟试验和实际数据分析相结合的方式,从参考值范围几何特征、参考值范围合法性与有效性等方面对新的和现有的几种多变量参考值范围建立方法进行比较分析. 结果:改良马氏深度法建立的二元参考值范围具有典型的中心椭圆特征,对于多元正态分布资料,改良马氏深度法与正态分布法一致性在98.5%以上,实例数据分析结果显示改良马氏深度法建立的参考值范围大小比多元正态分布法更接近理论水平. 结论:改良马氏深度法在参考值范围几何特征方面符合要求,在合法性及有效性方面优于现有的成熟方法,可以作为多变量参考值范围的有效统计学建立方法.
【关键词】 参考值 计算机模拟试验 深度函数 统计学方法
0引言
医学多变量参考值范围统计学建立方法是困扰医学统计工作者的重要问题之一. 目前的多变量参考值范围多采用多次重复使用单变量参考区间的方法,但此方法的主要问题之一是无法处理变量间相关性的影响. 针对多元正态分布资料,多元正态分布法仍是最有效的方法[1],而近年来有关学者提出的多指标百分位数法[2]和全息元法[3]等在探索针对其它类型资料的多变量参考值范围建立方法方面做出了有益的尝试.
统计深度函数是针对多元数据的基于空间排列的一种顺序统计量,具有明显的非参数特性,可作为医学多变量参考值范围统计学方法的一种选择. 为探讨统计深度函数在多变量参考值范围统计学方法上的应用价值,本研究提出一种基于改良马氏深度函数的多变量参考值范围统计学建立方法,并通过模拟试验和实例数据分析探讨该方法的实际应用价值.
1材料和方法
1.1材料本研究实例数据资料来源于2001年某省健康青年体检数据. 其中包含3453例受测者,全部为男性,年龄14.5~29.5平均(18.41±1.01)岁. 数据包括血压、体型和体能等三类多元指标. 其中血压指标包括收缩压和舒张压2个变量;体型指标包括身高、坐高、肩宽、体质量、胸围、腰围、臀围等7个变量;体能指标包括肺活量、立定跳远距离、俯卧撑次数以及仰卧起坐次数等4个变量.
1.2方法
1.2.1改良马氏深度函数方法设计统计深度函数用以计算多元数据基于空间排列的秩次以及各种顺序统计量[4]. 本研究以马氏深度函数[4]为基础,经过适当的改良后,将其应用于多变量参考值范围统计学建立方法. 其改良方法如下.
从提高马氏深度函数稳健性考虑,对其进行以下操作:在进行空间排列顺序计算前,先对原始变量进行标准化,使各变量具有相同的变异程度;以中位数向量为位置参数;以Spearman秩相关矩阵为变异矩阵. 改良马氏深度函数可表达为式(1)的形式.
MDS(x,F)=[1+(xs-Mds)′R-1s(xs-Mds)]-1(1)
其中,xs表示各分量经标准化后的数据向量,Mds表示各分量经标准化后的中位数向量,Rs表示原始样本数据的Spearman秩相关矩阵.
改良马氏深度法建立多变量参考值范围的主要操作步骤如下: ①应用改良马氏深度函数将多元数据类型的参考样本转化为统计深度指标,实现多元数据向单变量数据的转换;
②采用百分位数法建立统计深度指标的指定容量的单侧参考值区间(右侧区间,包括中心点对应的统计深度最大值);
③对于新样品,先依据参考样本的中位数向量和秩相关矩阵计算其对应的统计深度,并依据上述统计深度单侧参考值区间判断其正、异常分类.
1.2.2运算环境与分析方法本研究的全部分析计算过程均在SAS 9.1软件环境下通过编程方法完成. 将从参考值范围空间几何特征、参考值范围一致性以及实例分析等方面对改良马氏深度法和现有的几种方法(多元正态分布法、多指标百分位数法、全息元法)进行对比分析,以考察改良马氏深度法的优缺点及其实际应用价值.
参考值范围空间几何特征分析以计算机模拟数据为基础,为简便操作仅从二元正态分布资料参考值范围的几何分布形态入手进行探讨. 具体操作为:针对二元正态分布的模拟数据建立多变量参考值范围,并直接对参考样本进行分类并绘制散点图,观察其空间几何特征,从而考察各种方法所建参考值范围的合理性.
由于多元正态分布法是针对多元正态分布资料的最可靠的多变量参考值范围统计学方法,此处我们通过考察多元正态分布情形下改良马氏深度法和多元正态分布法所建立参考值范围的一致性(针对参考样本的分类结果一致性),来验证该方法的可靠性.
实例分析将采用随机抽样方法(采用SAS的surveyselect过程实现)从实例数据抽取800人作为参考样本,应用改良马氏深度法和多元正态分布法建立其50%,75%,95%的参考值范围,并将此参考值范围应用于全部受检者,判断其“正、异常”分类,计算“正常”者的百分比并与理论水平比较,从而评价两种方法所建立参考值范围的可靠性. 2结果
2.1参考值范围几何特征一般来讲,理想的多变量参考值范围应当表现为样本数据点分布中心区域上椭圆或近似椭圆的几何形态. 本研究的分析结果显示,现有三种方法中多元正态分布法的参考值范围呈中心区域的椭圆型,多指标百分位数法为矩形,而全息元法则为带状,后两者的结果不符合中心椭圆区域的基本要求. 改良马氏深度法建立的参考值范围与多元正态分布法一致,呈中心区域的椭圆形. 对于三维或更高维度的数据样本,不难推断上述结果应当同样适用,此处不再列出.
2.2参考值范围一致性分析结果显示,改良马氏深度法建立的参考值范围与多元正态分布法具有很高的一致性,一致率均在98.5%以上.
2.3实例分析对于全部三类多元指标,改良马氏深度法建立的参考值范围大小均比多元正态分布法更接近理论水平,表现出更高的可靠性(表1).表1三类多元指标参考值范围可靠性对比情况
3讨论
多变量参考值范围是医疗卫生领域常见的数据处理问题之一. 多元正态分布法的应用条件较为严格,要求样本服从多元正态分布的假设. 虽然某些资料可通过变量变换的方式转换为多元正态分布,但实际工作中多数数据资料仍无法满足此条件[1],因此多元正态分布法的适用范围有限. 目前常用的替代方法多次重复应用单变量参考区间的方法仍然无法解决,所进行的有关此类问题的研究也未能完全解决多元数据各分量间相关性所带来的问题.
统计深度函数作为一种描述多元数据空间分布相对位置的非参数统计量,为多变量参考值范围统计学建立方法的降维操作提供了新的选择[5-8]. 马氏深度函数考虑了多元数据的内部相关性,更符合医学多变量参考值范围中的实际应用需要[9]. 然而其定义中的位置参数和变异矩阵以参数法为基础,影响了其稳健性. 本研究以马氏深度函数为基础,提出一种改良的马氏深度函数,并尝试了该深度函数在解决多变量参考值范围问题方面的应用效果. 改良马氏深度改变了原有函数定义中的位置参数和变异矩阵,提高了深度函数的稳健性. 从本研究的分析结果来看,改良马氏深度法能够建立合法有效的多变量参考值范围,具有更高的稳健性,在医学多变量资料参考值范围统计学建立方法方面值得进一步的探讨和研究.
【参考文献】
[1] Hekking M, Lindemans J, Gelsema ES. A computer program for constructing multivariate reference models[J]. Comput Methods Programs Biomed, 1997, 53(3): 191-200.
[2] 陈彬, 李克, 林昆, 等. 用多指标百分位数法确定医学参考值[J]. 西部医学, 2003, 1(2): 185-186.
[3] 王润华, 田小兵. 全息元法制定多指标参考值范围研究[J]. 重庆医科大学学报, 2001, 26(2): 171-174.
[4] Zuo YJ, Robert S. General notions of statistical depth function[J]. Anal Stat, 2000, 28(2): 461-482.
[5] Gerhard JW. A note on the depth function of combinatorial optimization problems[J]. Dis Appl Math, 2001, 108: 325-328.
[6] Anja S, Peter JR. Halfspace depth and regression depth characterize the empirical distribution[J]. J Multivariate Anal, 1999, 69: 135-153.
【关键词】 类风湿,关节炎;游走痛;中医病因;风邪;风湿痹阻证;HFRA数据库;临床研究
Clinical Research on Whether Wandering Pain Being the Key Indicator to Rheumatoid Arthritis Caused by Wind Evil
LI Yuan-wei,ZHANG Zi-yang,LOU Yu-qian
【ABSTRACT】Objective:To investigate whether wandering pain is the key indicator to rheumatoid arthritis caused by wind evil,and to explore the related syndrome.Methods:Four hundred and nine cases with rheumatoid arthritis recorded in the HFRA database(database of Henan Rheumatism Hospital)were divided into the wandering pain group and non-wandering pain group.Software SPSS 19.0 was used to analyze the difference and relationship of articular manifestation and extra-articular manifestation of the two groups.Results:Because there were weak correlations between the original variables in the wandering pain group,it was not suitable for cluster analysis.The clustering results of the non-wandering pain group showed that body numbness and the whole body’s aversion to cold and wind were caused by wind evil or other evils,which couldn’t be the only judging index for wind evil.At the same time,the difference between the two groups was statistically significant(P < 0.05).
The 16 variables with statistical significance were as follows:heat pain,gas pain,hair loss,dark red lip and nails,relief of pain after activity,excessive phlegm,
fatigue,asthma,local dark skin,tastelessness in mouth without thirst,recovering from
fatigue after rest,cold pain,dizziness,aggravation
during rainy days,night sweat and dry nose.These manifestations in the wandering pain group were less serious than those in the non-wandering group.There was no significant difference between the other 66 variables,and the symptoms were not related to the clinical manifestations caused by wind evil.Among 409 patients,there were 102 cases(25%)with wandering pain.The 102 patients met the criteria for the diagnosis of rheumatoid arthritis,that is,there were at least 3 joints in the area that lasted for more than 6 weeks.Swelling belongs to TCM dampness.Conclusion:Wandering pain can be used as the key index to judge the wind evil causing rheumatoid arthritis.Rheumatoid arthritis has the syndrome of rheumatic arthralgia,the number of patients caused by which is less than 25% of the total number.
【Keywords】 rheumatoid,arthritis;wandering pain;origin of diseases in TCM;wind evil;rheumatic arthralgia syndrome;HFRA database;clinical research
风湿关节炎(rheumatoid arthritis,RA)患者有很多重要的关节表现,最常见的有关节肿胀、晨僵[1],
除此之外,游走痛、阴雨天加重等[2]在临床中也经常见到。这些关节表现影响临床辨治,在中医传统辨治过程中有着重要的地位[3],如文献《李中梓治疗痹证学术思想浅析》中就将游走痛作为行痹辨证的关键[4]。查找文献发现,游走痛作为RA风邪的主症是经验性的,未见到证据级别较高的研究,本文就此进行了深入的研究,以探讨游走痛是否为RA风邪的关键指标,并探讨其相关证候。
1 病例来源及诊断标准
本研究的病例来源于河南风湿病医院RA数据库(HFRA数据库)[5],该数据库收录了自2013年
4月至2016年7月在本院就诊的符合纳入标准的409例RA患者的一般资料、关节表现、关节外表现等病证信息。该数据库所纳入的RA患者均采用美国风湿病学会(ACR)1987年颁布的RA分类标准[6]。
2 方 法
2.1 分组与研究方法 将409例RA患者按有无游走痛分为游走痛组和无游走痛组。将2组所涉及的关节表现及关节外表现的频数及构成比分组列表进行比较,并做聚类分析。
2.2 统计学方法 采用SPSS 19.0软件进行统计分析。计量资料符合正态分布以表示,不符合正态分布以中位数与全距表示;计数资料计算构成比,组间比较采用χ2检验;证候分析采用主成分分析、因子分析、聚类分析。以P < 0.05为差异有统计学意义。
3 结 果
3.1 一般资料 游走痛组共102例,男11例,女91例;年龄20~76岁,平均(49.32±10.95)岁;
病程最短2个月,最长32年,中位数3年。无游走痛组共307例,男42例,女265例;年龄17~79岁,平均(49.10±11.71)岁;病程最短
2个月,最长44年,中位数5年。2组患者在性别、年龄、病程等方面比较,差异无统计学意义(P > 0.05),
具有可比性。
3.2 关节表现及关节外表现 HFRA数据库中的409例RA患者,涉及关节表现及关节外表现共88个变量,依统计学要求,样本量为变量的5~10倍,删除频数 < 20的变量,剩余变量为82个,符合要求。2组变量的频数及构成比见表1、表2、表3。
3.3 主成分分析、因子分析、聚类分析 游走痛组KMO和Bartlett的检验可得取样足够的Kaiser-Meyer-Olkin度量值为0.316 < 0.5,Sig值为0.000 < 0.005,表明原始变量之间相关性弱,不适合因子分析的统计学方法,无法进行下一步聚类分析。无游走痛组KMO和Bartlett的检验可得取样足够的Kaiser-Meyer-Olkin度量值为0.602 > 0.5,Sig值为0.000 < 0.005,表明原始变量之间存在相关性,适合主成分分析及因子分析的统计学方法,可进行下一步聚类分析。无游走痛组变量经过相关矩阵分析及最大四次方值法旋转后,选取值 > 0.3的变量,得出31个公因子,将该组得出的公因子采用Ward法 + Euclidean矩阵 + Z得分进行聚类分析。
与临床相结合,无游走痛组以聚7类较为合适,具体聚类结果如下:①F20渴喜冷饮,F28五心烦热、盗汗,F26肌肤局部发暗,F15渴喜热饮、渴不欲饮,F11失眠、多梦,F16凉痛;②F4活动后乏力、月经量少、月经色暗、月经有块,F7头重如裹、发热时间不定;③F10少气懒言、声低,F14僵痛、动则汗出、肢体麻木,F2口干、咽干、口苦、口黏腻,F6活动后加重、活动后减轻、口淡不渴,F9遇冷痛增遇热痛减、阴雨天加重;④F27昼轻夜重、大便稀溏,F30头晕、月经先期,F12眼干、鼻干,F19热痛、动则气喘,F13心慌、胆怯、心神不宁;⑤F29痰多、唇甲暗红,F31沉痛,F18胀痛、酸痛、口唇淡白,F17食后腹胀、肢体浮肿、颧红,F22食冷腹泻、耳鸣,F21劳累后加重、脱发、夜尿频多;⑥F1全身乏力、活动后乏力加重、休息后乏力减轻、神倦懒动、患病后体质量减轻、纳少,F5全身怕风怕冷、畏寒肢冷、四肢不温,F23低热、咽痛;⑦F3生气后加重、心烦、易怒、抑郁,F25闭经、易感冒,F8健忘、视力减退、视物模糊、听力下降、面色萎黄,F24大便黄、小便干。其中刺痛、腰膝酸软、自汗共计3个变量在取消γ系数绝对值 < 0.3后进行旋转成分矩阵后,无相关数据对应,故在此不再对刺痛、腰膝酸软、自汗3个变量进行系统聚类分析后的展示。
3.4 χ2检验 通过对表1、表2、表3中2组相同变量制定四格表资料,并运用SPSS 19.0软件进行数据分析整理,将2组间差异有统计学意义(P < 0.05)
的临床表现汇总,结果见表4。
通过对表1、表2、表3中2组间差异有统计学意义(P < 0.05)的临床表现对比可知,热痛、胀痛、脱发、唇甲暗红、活动减轻、痰多、头晕、阴雨天加重、活动后乏力、动则气喘、肌肤局部发暗、口淡不渴、休息后乏力减轻、凉痛、盗汗、鼻干均为游走痛组 < 无游走痛组。
4 讨 论
游走痛组的原始变量之间相关性弱,不适合因子分析的统计学方法,无法进行聚类分析。从无游走痛组聚类分析结果可看出,②中出现了肢体麻木,⑥中出现了全身怕风怕冷等看似“风邪”的临床表现。临床上,单纯属虚证的肢体麻木有之,但夹风夹寒夹湿夹痰夹瘀者,同样常见。故这里的肢体麻木应该是一个风邪与他邪相兼的症状。全身怕风怕冷不仅有风的表现,同时兼有寒的表现,是一个风寒兼有的症状。由此可以看出,无游走痛组的聚类结果中出现的肢体麻木、全身怕风怕冷均为风邪与他邪相合而致,不能单独作为风邪的判断指标。同时对表1、表2、表3中2组间差异有统计学意义
(P < 0.05)的临床表现对比可知,有统计学意义的16个变量均为游走痛组 < 无游走痛组。剩余66个
变量之间差无统计学意义,且其与风邪所致临床表现无关。综上所述,游走痛可以作为RA风邪判断的关键指标。
从西医角度讲,RA的基本病理为关节滑膜炎,在RA的诊断标准中[6],对称性手关节(近端指间关节、掌指关节、腕关节)至少3个关节区的关节炎且持续6周以上是特征性表现,占权重近1/2。所以,多数学者都将RA关节疼痛描述为持续性疼痛[7-8]。笔者在临床中观察,患者若没有持续6周以上不缓解的滑膜炎(关节肿痛、压痛)存在,很难确诊为RA,即RA患者的某些关节一定是持续性疼痛的;但也发现被确诊为RA的一部分患者,既存在某些关节持续肿痛,又同时存在另外某些关节数日内就能消失的游走性、反复发作性肿痛,暂且将这类患者称为“伴游走肿痛的RA”,这类患者并不少见,本研究显示其占RA患者的25%(102/409)。这类“伴游走肿痛的RA”是RA的一个亚型吗?与回文性风湿病(palindromic rheumatism)有无关联?有待进一步研究。
从中医角度讲,本研究显示关节游走痛是RA风邪的关键指标,这类伴有风邪患者占RA总数的25%,所以,在临证时不能忽视风邪的存在。但一些权威文献如《中药新药临床研究指导原则》等中却完全忽视了风邪的存在[9],这与临床实际不符,建议在今后修订时予以补充。然而,滑膜炎的特征性表现是关节肿胀,肿胀(下转第38页)
(上接第17页)属中医湿邪,笔者前期的研究也表明,RA患者普遍存在“湿”重于“风”的现象[10]。
结果中显示,游走痛组102例患者原始变量间相关性弱,不适合再进行聚类分析,换句话说,这类患者没有必要再进行分类,他们原本就是一类,一类具有游走痛这一共同特征的患者,因此就没有必要将其再分类了。所以,“伴游走肿痛的RA”患者,若将其中的虚象明显者、瘀象明显者、他邪(如寒邪[11]、热邪[12]等)明显者都剥离出来,剩下的则为“风湿痹阻”证。即RA患者应有“风湿痹阻”这一临床证候,这与姜泉、冯兴华的认识一致[13],
然这一证候的数量定少于RA患者的25%。还需要注意的是,风湿病的基本病因病机是“虚邪
瘀”[14],RA也不例外。RA风湿痹阻证只是说这类患者风邪、湿邪较重较多,是患者的主症,其必然还同时存在一些虚象、瘀象和其他邪气,只是这些虚象、瘀象和其他邪气较轻较少,不是主症而已,这些从本文的表1、表2、表3中也可以看出。可将RA风湿痹阻证候定义为:符合RA诊断,伴某些关节游走性疼痛,无明显寒象、热象、瘀象、虚象者。RA的证候极其复杂,除了风湿痹阻证外,还有75%以上的患者,分别属于什么证候?需今后深入探索。
5 参考文献
[1] 娄玉钤.中国风湿病学[M].北京:人民卫生出版社,2010:45-48.
[2] 王钧琴,李国春,周学平,等.类风湿关节炎中医证候量表条目筛选[J].辽宁中医药大学学报,2014,16(3):80-82.
[3] 孙琳,张杰.类风湿关节炎中西医治疗研究进展[J].辽宁中医药大学学报,2013,15(4):129-132.
[4] 雷艳,王新昌.李中梓治疗痹证学术思想浅析[J].黑龙江中医药,2014,44(5):11-12.
[5] 娄玉钤,张子扬,许平英,等.基于病证结合的类风湿关节炎数据库建立及其409例基线资料报告[J].风湿病与关节炎,2016,5(8):5-9.
[6] 中华医学会.临床诊疗指南・风湿病分册[M].北京:人民卫生出版社,2010:3.
[7] 蒋明,张奉春.风湿病诊断与诊断评析[M].上海:上海科学技术出版社,2004:80.
[8] 栗占国.类风湿关节炎[M]//王吉耀.内科学.北京:人民卫生出版社,2005:1054.
[9] 国家食品药品监督管理局.中药新药临床研究指导原则[M].北京:中国医药科技出版社,2002:115-119.
[10] 张子扬,娄玉钤.中医“上肢多风下肢多湿”是否适应于类风湿关节炎辨证的临床研究[J].风湿病与关节炎,2016,5(9):16-19.
[11] 张子扬,娄玉钤.关节遇冷痛增是否类风湿关节炎中医证候寒痹关键指标的临床研究[J].风湿病与关节炎,2016,5(11):25-28,40.
[12] 张子扬,许平英,娄玉钤.关节热痹是否类风湿关节炎中医证候热痹关键指标的临床研究[J].风湿病与关节炎,2016,5(10):16-19,26.
1资料与方法
1.1临床资料
收集自2006年2月至2010年9月入住我院ICU缺氧性脑病患者17例,包括一氧化碳中毒4例,麻醉意外3例,感染性休克7例,慢性阻塞性肺疾病呼吸衰竭3例,所有患者均行心肺复苏术,其中男性10例,年龄12~78岁,平均48.3岁,女性7例,年龄25~75岁,平均38.5岁。所有患者均行颅脑CT检查,排除其他原因引起的脑组织损害。入院时死亡8例,GCS评分平均值7.22;存活9例,GCS评分平均值7.36,两组之间差异无统计学意义(P=0.775)。
1.2统计学方法
收集纳入患者住院期间前10d的重要指标,取平均值,住院不足10d患者按实际住院天数计算平均值,包括:年龄、体温、心率、呼吸、平均动脉压(MAP)、白细胞、血红蛋白、谷丙转氨酶、白蛋白、肌酐、钠离子等指标作为自变量,患者结局以存活与否作为因变量,使用SPSS13.0软件对数据进行二分类Logistic回归分析。并以上述指标为自变量,以APACHEⅡ为因变量,进行单因素线性回归分析与多因素分析。
2结果
2.1危险因素与生存率的关系
以年龄、体温、心率、呼吸、动脉血氧饱合度、MAP、白细胞、血红蛋白、谷丙转氨酶、白蛋白、肌酐、钠离子作为自变量,以存活与否为因变量,使用SPSS13.0行二分类Logistic回归分析,单因素分析结果提示:体温、MAP、白蛋白与患者存活之间的联系差异有统计学意义(P<0.05),见表1。将所有自变量放入模型进行多因素分析,相应P=0.170,说明模型全局性检验差异无统计学意义。
2.2危险因素与APACHEⅡ评分的关系
以年龄、体温、心率、呼吸、动脉血氧饱合度、MAP、白细胞、血红蛋白、谷丙转氨酶、白蛋白、肌酐、钠离子作为自变量,以APACHEⅡ为因变量,使用SPSS13.0进行单因素线性回归分析,检验各自变量与应变量的关系。单因素分析结果提示:心率、动脉血氧饱合度、平均动脉压、白细胞、白蛋白、肌酐对APACHEⅡ改变差异有统计学意义(P<0.05),见表2。多重线性回归分析:仅MAP进入最终模型,最终等式为APACHEⅡ=42.058-0.382MAP,P<0.05,MAP改变对于APACHEⅡ评分差异有统计学意义(散点图见图1)。
3讨论
脑灌注压等于平均动脉压与颅内压之差(CPP=MAP-ICP)。脑组织缺氧损害后往往脑组织水肿较重,颅内压升高,在给予利尿、脱水等措施后很可能导致循环容量不足,使脑灌注压下降,加重脑组织缺血缺氧。
(Chang'an University School of Economics and Management,Xi'an 710061,China)
摘要: 随着科技日益发展,地质统计学在地质工程中也发挥着重要的作用,这就对地质统计提出了更高的要求。本文从地质统计方法入手,简要阐述了地质统计学发展的现状,并分析了统计方法在地质工程中的重要作用及其应用。
Abstract: With the development of science and technology, geostatistics plays an important role in geological engineering, which puts forward higher demand for geostatistics. Starting from geostatistics, this article illustrates the status quo of geostatistics development, and analyzes the important role of statistical methods and its applications in the geological engineering.
关键词: 地质统计学 地质工程 变差函数 应用分析
Key words: geostatistics;geological engineering;variation function;application analysis
中图分类号:P628+.2 文献标识码:A文章编号:1006-4311(2011)29-0081-01
1地质统计方法简述
地质统计学是在矿山储量计算工作中慢慢发展起来的,是上个世纪六七十年代法国统计学家马特隆教授(G.Matheron)大量的理论研究基础上形成的数学地质学科的一个分支,他的专著《应用地质统计学》的问世标志着地质统计学作为一门新兴学科的诞生①。地质统计学是和采矿业发展同步兴起的学科,它是以变差函数为主要工具,以区域化变量理论为基础,研究在空间分布上既有结构性又有随机性(或有空间相关性和依赖性)的自然现象(包括地质现象)的一门科学。
2地质统计方法发展现状
地质统计学作为一个年轻的边缘学科,正处在蓬勃向前发展的阶段,目前地质统计方法的发展主要有以下几个方面:
2.1 两大学派地质统计学发展至今,出现了两个学派。一个是以A.G儒尔奈耳(A.G Journal)为首的“斯坦福地质统计学派(非参数地质统计学派)”。这一学派研究了不需要对数据的分布做假设的快速条件模拟、概率克立格法和指示克立格法等方法,并且研究了软数据的使用问题。另一个学派以马特隆教授为首,他们开展了以正态的假设为基础的析取克立格法和条件模拟研究,把协同克立格法和主成分分析进行有效结合,形成简单克立格法、析取克立格法、泛克立格法和普通克立格法等一系列的方法和理论,这些方法都要用实际的样品数据为基础,所以也称“参数地质统计学”②。
2.2 多学科的渗透形成新克立格法目前,对于含有一些特异值,接近了高斯分布的具体数据,就要把稳健统计学思想应用到求变差函数当中,继而提出了稳健克立格法;把多元区域化的变量引到克立格法中,运用两个或两个以上有相关性的变量对某一个变量估值,继而产生了协同克立格法;把多元区域化的变量引到指示克立格法中,继而得到了协同指示克立格法。
2.3 多领域应用地质统计学目前不断扩展其应用领域,深入到生活的各个方面。
3地质统计方法在地质工程中的重要作用
随着市场飞速发展,统计方法运用在地质工程是时代潮流发展的必然。以前我们在计算矿产资源的储量时,常用不同级别储量的工程密度,用稀密法得到相对误差来论证矿产资源储量的可靠程度,并将相对误差值作为衡量矿产资源储量精度的标准。然而,这种方法缺乏科学根据,被许多人置疑,地质统计方法的出现很好地解决了这类问题。地质统计工作是深化我国经济体制改革和加强经济发展的必然要求。地质统计不但可以整体估计,还能对局部进行估计,对原有的数学方法和理论进行选择创新,把更好地解决面临的地质问题作为目标。地质统计估计的克立格方差是一个很好的估计精度,其估计精度高较高。地质统计的随机模拟能很好的再现出地质变量变化,从而为定量研究地质体提供一个有利的基础和可靠的保障。
4一维变差函数
可以假设空间中一点只在一维数轴x上变化,把区域化变量Z(x)在x,x+l两点处的数值的差的方差的一半定义成区域化变量Z(x)在x方向上的变差函数,记为:?渍(x)=■V[Z(x)-Z(x+l)]=■E[Z(x)-Z(x+l)]2-{E[Z(x)]-E[Z(x+l)]}2公式中,?渍(x)表示变差函数;E表示期望值,V表示方差。变差函数的函数值仅依赖于x和l两个自变量。在本假设条件下,变差函数仅依赖于分割它们的距离l和方向,因而变差函数可定义成:变差函数是在任一方向,相距l的两个区域化变量[Z(x)和[Z(x+l)的增量的方差的一半。变差函数是一个有关距离的函数,描述不同位置变量的相似性,?渍值越大,变量的相关性越差。通常情况下,?渍值随着距离矢量l的增大而增大,直到到达一定值时?渍达到极大值,之后保持不变。
5统计方法在地质工程中的应用
1977年地质统计学正式引入我国,经过我国对地质统计方法的努力学习,地质统计方法在我国得到了飞快的发展,目前广泛应用于以下几个方面:
5.1 用于储层的预测石油地质学研究中的一个重要的难点和热点,就是对储层的参数进行一个有效的科学的预测。我国原先利用的是传统数理统计的方法,这种方法是纯数学的方法,没有充分考虑到储层参数间相关性和空间连续性的问题,也不附带任何的地质意义,因此,对储层的参数预测有较大局限性。使用地质统计方法就可以有效解决这一问题,它以区域化的变量理论作为基础,对地质参数的空间变化方向性和趋势都有了充分的全面的考虑,再克里金方法的外推和插值的功能,算出了与地质规律吻合的统计方法和模型,继而表征储层参数的规律变化,利用这规律,针对渗透率和孔隙度等参数的空间展布开展有效又合理的预测。
5.2 用于不确定性描述油藏的复杂变化,很难通过动态或静态的确定性模型来反映。只有运用地质统计方法,用不确定性的描述,才能反映出真实的复杂油藏模型。地质统计方法最大的一个优点就是可以很方便地把不同的资料有效整合应用,如生产、测井、地震、地质等方面信息,这些对于油藏准确的描述是非常关键的。这种不确定性的描述可以给油藏工程师一个可选择的参考,帮助他们全面分析,制定一个合理的科学的开发方案。
5.3 用于数据整合地质统计方法通过随机模拟方法和油藏数值模拟相结合,继而预测出油藏动态的特征,为调整和制定开发决策和提高最终的采收率提供一个合理的依据。
6结语
统计学在地质工程应用中经过多年发展,已初显成效。而且其应用范围正在逐渐扩大。我们有理由相信,随着地质统计学方法的不断完善,其必将发展成为一个通用性工具性的科学。
注释:
①孙洪泉.地质统计学及其应用[M].徐州.中国矿业大学出版社,1990.
②李黎,王永刚.地质统计学应用综述[J].勘探地球物理进展,2006,(03).
关键词:冠心病心绞痛 蒙医证型 诊断标准 临床研究
心血管疾病已成为影响人类健康的头号杀手,其中绝大多数是由冠状动脉粥样硬化所致。随着人们生活水平的迅速提高,本病近年来呈增长趋势。冠心病心绞痛属于蒙医学“心刺痛”范畴,目前对冠心病心绞痛蒙医证型的诊断尚未完全一致。本研究收集100例包含蒙医信息的冠心病心绞痛患者的临床资料进行统计学分析,并结合专家意见,初步建立了冠心病心绞痛蒙医证型的诊断标准。
一、临床资料
1.病例入选标准
冠心病心绞痛入选标准依据1979年中西医结合冠心病心绞痛会议制定的诊断标准[1]。
2.病例来源
本研究对象为209年10月-2013年6月期间在本院蒙医心病科、中医心病科及CCU住院诊治的100例患者。
二、研究方法
1.制定病例观察表
通过回顾文献,确定本研究的病例入选标准和观察指标(包括西医和蒙医内容),并据此制定统一的病例观察表。病例观察表包括与冠心病心绞痛患者蒙医诊断相关信息的指标。
2.总体方法
按照西医冠心病心绞痛诊断标准确定入选病例并进行临床观察,填写病例观察表,请蒙西医结合专家对每份观察表信息进行辨证并做出相应的证型诊断;根据证型分组,进行统计学分析,筛选对证型诊断有意义的指标;再请蒙西医结合专家对指标进行讨论,最后制定冠心病心绞痛蒙医证型的诊断标准。
3.观察项目及方法
按照入选标准入选冠心病心绞痛病例,应用统一的病例观察表前瞻性地收集临床资料。主要观察指标包括:性别、年龄、住院转归、冠心病心绞痛发病诱因、既往健康状况、发生冠心病心绞痛的持续时间及发作次数、住院天数,入组72 h内每12 h及心绞痛发作时的心电图、心肌酶[肌酸激酶同工酶(CK-MB)、肌红蛋白(Mb)、肌钙蛋白(cTnT)]、血常规、血生化及血脂[总胆固醇(TC)、三酰甘油(TG)、高密度脂蛋白胆固醇(HDL-C)、低密度脂蛋白胆固醇(LDL-C)]。记录72 h内各指标的值。蒙医指标包括症状、舌象、脉象、体态、根源及因素、疼痛、累及部位等。研究终点为患者在住院期间死亡或放弃治疗。
4.统计学分析
所有观察资料应用SPSS13.0统计软件进行统计分析。对计量资料进行两独立样本t检验,结果以x±s表示;对分类变量资料采用卡方检验。
5.质控措施
采取参研人员培训;研究过程中抽查一定数量(观察病例总例数的10%)病例观察表与原始住院病历进行核对,复印一定数量(观察病例总例数的5%)的原始病历予以存档等方法控制研究质量。
6.数据分析方法
进行统计分析后,找出各证型中对证型诊断有意义的指标。请蒙西医结合专家进行讨论,确定诊断指标。
三、结果
冠心病心绞痛蒙医证型分布经专家对100例包含蒙医信息的冠心病心绞痛患者资料进行分析,其中楚斯型58例,粘邪型23例,胃痧型19例。
1.粘邪型的指标筛选
分析比较粘邪型和非粘邪型的计量资料及两证型间的分类变量资料,结果见表1、表2。表1 粘邪型与非粘邪型血脂比较(略) 表2 粘邪型与非粘邪型分类变量资料统计结果(略)注:症状:1=无,2=有;持续时间:1≥5 min,2≥10 min,3≥15 min,4≥30 min;郝衣希拉体态:1=无,2=有;疼痛程度:1=轻度,2=中度,3=重度; CK-MB、Mb、cTnT:1=正常,2=升高。
2.楚斯型的指标筛选
分析比较楚斯型和非楚斯型的计量资料及两证型间的分类变量指标,结果见表3、表4。表3 楚斯型与非楚斯型血脂比较(略)表4 楚斯型与非楚斯型分类变量资料统计结果(略)注:症状:1=无,2=有;持续时间:1≥5 min,2≥10 min,3≥15 min,4≥30 min;CK-MB、Mb、cTnT:1=正常,2=升高;单纯T波改变:1=正常, 2=单纯T波改变。
3.胃痧型的指标筛选
分析比较胃痧型组和非胃痧型组的计量资料及两证型间的分类变量资料,结果见表5、表6。表5 胃痧型与非胃痧型分类变量资料统计结果(略)注:症状:1=无,2=有;CK-MB、Mb、cTnT:1=正常,2=升高;心电图下壁ST-T改变:1=无,2=有;体态:1=巴达干赫依,2=非巴达干赫依表6 胃痧型与非胃痧型血脂比较(略)。
四、讨论
到目前为止,治疗冠心病心绞痛的药物,如血管紧张素酶抑制剂(ACEI)、β受体阻滞剂、Ca拮抗剂以及阿司匹林等虽然有确切的疗效,但均有不同程度的、较明显的禁忌症,而蒙医药在冠心病心绞痛患者的治疗中却已显示出一定的优势。蒙医药治疗冠心病心绞痛的关键是辨证论治,如何进行辨证是取效的核心内容。本课题就是以冠心病心绞痛的临床证侯信息资料为主,结合现代医学的认识,对其证型赋予新的诊断指标。根据我们研究的结果,冠心病心绞痛患者常见的证型为粘邪型、楚斯型、胃痧型,基本体现了冠心病心绞痛之蒙医心刺痛由于致病四因素(气候变化、饮食、起居和突发因素)的影响所致三根、七素功能失调,赫依血不通,特别是普行赫依受损,精华与糟粕之分解紊乱,导致心脉内淤积浑浊之血液,且由轻到重的病理过程[2-3]。本研究运用现代统计学的方法筛选出每个证型的有意义的临床指标,经专家讨论制定出诊断标准,为寻找对冠心病心绞痛患者有效的治疗提供了理论基础。蒙医证候客观化、标准化及证候本质的研究是实现蒙医药科学化、现代化的必由之路。本研究通过病证结合临床研究模式,总结了冠心病心绞痛的蒙医证型诊断标准,分析结果显示:粘邪型和不稳定性心绞痛有很大程度上的相似性;楚斯型和稳定性心绞痛是一致的;胃痧型主要为下壁心肌缺血引起的心绞痛。蒙医证型诊断为蒙药的合理应用提供了理论基础,拓宽了蒙医药的应用范围,为冠心病心绞痛的治疗提供了新的有效的途径。
参考文献:
doi:10.3969/j.issn.1673 - 0194.2017.02.054
[中图分类号]C931.2 [文献标识码]A [文章编号]1673-0194(2017)02-00-02
0 引 言
组织公平感一直被认为是影响员工工作卷入的主要因素之一。Masterson和Lewis(2000)提出了组织公平感的三维度结构。Colquitt 等人(2002)验证了组织公平感的四个维度是相互独立的。我国的学者,刘亚、龙立荣、李晔(2003)结合我国国情,提出了四维度结构,即分配公平、程序公平、领导公平和信息公平。工作卷入起源于Allport(1943)对自我卷入和Dubin(1956)对生活兴趣重心的研究。Kanungo(1979)指出工作卷入是指工作能满足个体的强烈需求和期望,是个体对工作的认同。多数研究指出人口统计学变量对组织公平感或工作卷入无显著影响。Brown 等人的元分析结果表明,工作卷入与人口统计变量之间无实际上关系。
虽然研究已比较成熟,但由于以具有时代特性的“90后”员工为研究对象,仍需要实证分析这一群体的人口统计学变量对组织公平感和员工工作卷入的影响,而不能仅凭以往的研究结论做出判定。因此,本文采用问卷调查法,利用SPSS 21.0软件对问卷调查结果进行统计分析,着重探讨了“90后”员工人口统计学变量对组织公平感和工作卷入的影响。
1 组织公平感与员工工作卷入的研究方法
1.1 样本
《2015互联网+时代,就业主力军现状调查报告》指出,互联网行业是“90后”求职的热门选择,2015年“90后”在实际签约行业中占近30%。故选取某互联网公司“90后”员工作为研究对象,共发放问卷200份,回收的有效问卷为171份,问卷的有效回收率为85.5%。
1.2 变量与量表
1.2.1 人口统计学变量
基于文献综述,分别选取性别、年龄、学历、工作年限与职务五方面作为人口统计学的变量,并进行研究。其基本特征如表1所示。
1.2.2 组织公平感与员工工作卷入
组织公平感由分配公平、程序公平、领导公平和信息公平四维度构成。采用刘亚 等人(2003)编制的四维度量表,并对其进行了合理的修缮,构成了组织公平感问卷,共有22个正向题。采用周文霞和李博(2006)修订的9项工作卷入量表,并对其个别表述进行完善,形成了员工工作卷入问卷。二者均通过了信效度检验,能够做进一步的统计分析。
2 组织公平感与员工工作卷入的实证研究
2.1 人口统计学变量对研究变量的影响
根据各人口统计学变量的特征,运用独立样本T检验、方差分析法(ANOVA)及事后检验两种方法,研究样本基本信息的差异对组织公平感与员工工作卷入是否有影响以及影响的程度。
2.1.1 性别差异对研究变量的影响
通过SPSS 21.0独立样本T检验,考察不同性别的员工在组织公平感和员工工作卷入上是否存在显著差异,结果如表2所示。
独立样本T检验结果显示,不同性别对组织公平感各维度、员工工作卷入的概率P值均大于0.05,故接受原假设。这也说明不同性别的“90后”员工在组织公平感和员工工作卷入上不存在显著差异,即性别差异对组织公平感各维度、员工工作卷入无显著影响。
2.1.2 年龄、学历、工作年限、职务差异对研究变量的影响
由于本文中的年龄、学历、工作年限、职务具有多个分组(大于两个),故使用方差法研究其在组织公平感和工作卷入上是否存在显著差异。由SPSS 21.0分析结果得知,仅有“工作年限”变量对组织公平感和工作卷入有影响,具体结如下。
①不同工作年限的分配公平、程序公平和信息公平及工作卷入的概率P均小于0.05,说明工作年限差异对分配公平、程序公平、信息公平和工作卷入均有影响。②基于进一步的方差分析法及事后检验,并结合平均值综合分析得出,工作年限越长则对分配公平、程序公平、信息公平及工作卷入的影响越大。具体的影响方向与影响程度需要做进一步的相关分析。
2.2 人口统计学变量与研究变量的相关分析
采用Pearson相关系数对人口统计学变量与组织公平感、员工工作卷入之间的关系进行分析,结果如表3所示。
相关分析结果显示,人口统计学变量中工作年限与程序公平和信息公平的相关系数分别为-0.157和-0.154,在0.05的显著性水平下相关,且是负相关,这与以往的研究结果有所不同。而其他人口统计学变量的概率P均大于0.05,说明人口统计学变量总体上对组织公平感和员工工作卷入的影响是不显著的。即企业的“90后”员工对企业给予的分配、程序、领导和信息方面的感知是公平的,也认为个人与他人具有相似的工作卷入度。
此外,组织公平感分配公平、程序公平、领导公平和信息公平与员工工作卷入的相关系数分别为0.370、0.329、0.352、0.392,说明组织公平感四维度与员工工作卷入之间具有显著正相关性,其中相关性最大的是信息公平,最小的是程序公平。
4 结 语
“90后”员工人口统计变量对组织公平感和工作卷入影响的实证研究结果表明,人口统计学变量整体上对组织公平感无显著影响,但工作年限对其的程序公平和信息公平维度有较大的影响;人口统计学变量对员工工作卷入也无显著影响,这符合Brown 等人的元分析结论。此外,相关分析结果表明组织公平感及其四维度与员工工作卷入之间存在显著的正相关性。本文为进一步研究组织公平感与员工工作卷入之间的线性回归关系奠定了基础。总之,“90后”员工终将成为就业的主力军,关注其组织公平感与工作卷入的关系,提高其工作卷入度,对构建和谐、稳定的就业关系是至关重要的。
主要参考文献