文件管理 · 2022年7月25日

sas软件与统计应用教程主成分因子分析|SAS中的主成分分析和因子分析有什么区别

⑴ 我听说SAS是最权威的统计软件,是不是学好SAS在统计界就足够了呢谢谢

统计的工作是什么?定义:收集、整理、分析和表述数据。统计软件在收集数据中一般用处不大(只有试验设计可能需要计算机生成试验表),而后三部分则处处需要软件的帮助。sas你能用好就很牛了。一般工作确实只需要excel,它的功能已经足够强大了,特别是2007版。但是还有很多功能是excel不能提供的,作为专业人士,还是要精通sas吧。 下面是我对各个统计软件的看法,需不需要多学就看楼主自己啦Stata软件Stata统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。特点是采用命令操作,也可以菜单操作,程序容量较小,统计分析方法较齐全,计算结果的输出形式简洁,绘出的图形精美。不足之处是数据的兼容性差,占内存空间较大,数据管理功能需要加强。网址: http://www.stata.com 。Stata是各种商业统计软件中我最喜欢的一款(先声明我没有收取广告费),当然不管什么统计软件在我眼中都离R差远了,但是Stata确实做得还不错,虽然它的名声远不如SAS和SPSS,但其统计模块非常齐全,打开看看菜单就知道了。尤其是计量经济学和医学统计的人,如果惧怕写代码,不妨试试Stata。它分析小型数据应该是非常顺手,但能读取的数据种类有限,据我所知基本上仅仅是纯文本数据和Stata本身的数据(*.dta),而且计算受内存大小和程序版本种类限制,所以无法处理特大型的数据。在用Stata菜单操作的时候它同时会在屏幕上输出与菜单对应的程序代码,因此若不熟悉Stata编程,可以通过这样的过程逐步学习,而且有些操作用菜单不方便实现,此时就可以结合不同的程序命令来完成。(例如指定模型中的分类变量要用xi:命令,但它在模型的菜单中无法直接指定,所以可以直接把xi:加到模型命令的前面)另外需要提及的是,Stata自身有一本刊物Stata Journal,里面的内容比较学术,都是结合Stata命令讲一些统计方法如何实现,不过这本刊物要收费,这点对于学生来说是个比较大的障碍。所以话说回来,要看这类文章还是看R News吧,它不但不收费,而且文章质量也都比较高,明年就要更名为The R Journal了。SAS软件SAS是英文Statistical Analysis System的缩写,即统计分析系统,最初由美国北卡罗来纳州立大学两名研究生开始研制,1976年创立SAS公司,2003年全球员工总数近万人,统计软件采用按年租用制。SAS系统具有十分完备的数据访问、数据管理、数据分析功能。SAS系统是一个模块组合式结构的软件系统,共有三十多个功能模块。SAS是用汇编语言编写而成的,通常使用SAS需要编写程序。网址: http://www.sas.com 。我在COS论坛( http://cos.name/bbs )上对SAS的介绍是“庞大的统计分析系统”,并没有强调它在统计分析方面的所谓优势。论坛上有几位朋友认为SAS编写代码的方式已经非常“恐龙级”了,对此我基本认同,不过鉴于我对SAS了解并不深入,所以不敢大放厥词。总之,“大”未必好,甚至以小人之心去揣测一下,也许“大”意味着代码臃肿。总之我们也看不到源代码,不知道它的统计分析代码怎么能写到七张光盘那么大。R的Windows安装文件30M,源文件16M左右。别的不多说了,据我了解,我周围上下的同学在SAS上面花时间最多的是学习怎么把这个大家伙装进自己的电脑,然后道听途说一个proc名称,就开始把数据导进来写上几个变量名,然后提交run,直到有一天终于有了长达30页的报表了,就高兴了。大家不妨对照看看自己是不是这么做的。SPSS软件SPSS是Statistical Package for Social Science的缩写(后来改成什么服务Service了),即社会科学统计程序包,20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年在芝加哥组建SPSS总部。SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形、表格较有方便,输出结果比较直观。网址: http://www.spss.com 。算了,SPSS没什么好写的,自己打开看就是了。懂统计的不用学,不懂统计的学了也白学。反正要是不懂统计你总懂点右上角那个OK按钮吧。SPSS是傻瓜软件,所以有时候开玩笑戏称之为Stupid Package for Social Science。

⑵ 请问运用SAS软件进行主成分分析,怎么样才能得到各个变量在各个主成分中的得分

data ex;input x1-x13;cards;数据;proc princomp out=prin;var x1-x13;run;proc print data=prin;var prin1-prin13;run;你将抄各个主袭成分得分输出来就可以了

⑶ 如何用SPSS或SAS做主成分分析

首先确抄定你的数据之间有一定袭的相关性,其次编程,程序如下:data;input BH $ ……;cards; ;proc princomp out=crimcomp;proc sport;by prin1;proc print;ID BH;var prin1 prin2 prin3 ……;proc plot;plot prin2*prin1=BH;plot prin1*prin3=BH;plot prin3*prin2=BH;run;然后把自己的数据导入到……中。就出来结果了。我不要钱,给高分吧!呵呵

⑷ SAS软件因子分析是怎么回事包括因变量和自变量以及模型吗其中F值和P值是表达什么意思的谢谢

:模型 财务正常公司: Y=-504.89552-11.21762X1+7.83665X2+0.21150X3+0.77499X4+0.36059X5-5.85931X6-1.72308X7+7.58422X8+12.21601X9 财务困境公司: Y=-619.35520-11.35101X1+5.60132X2+0.22330X3+0.79989X4+0.27322X5-5.99456X6-1.70626X7+8.85152X8+13.63997X9 2:检验 y=3.67805*prin1+2.21392*prin2+1.12608*prin3+ 0.78198*prin4+0.52051*prin5 在进行观测归类时,结果很好,分类错误的比率为0。因为哪个公司到底有困境,哪个正常我都是事先知道的,可是在进行主成分分析时,陷入财务困境危险的公司其得分值较高,而财务健康的公司其得分值较低或者不明显,下面是指标得分值。 问题大概就是这样了,如果你还没看明白,请说明,毕竟自己花了不少时间写的文章,不想轻易粘上去(而且文章也太长了估计复制不上去)。 模型和检验都在上面,至于程序由于分析指标太多,因此滤去了观测数据,下面。 1:一般判别分析模型 data solvency; input type x1 x2 x3 x4 x5 x6 x7 x8 [email protected]@; cards; XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX class type; var x1 x2 x3 x4 x5 x6 x7 x8 x9;run; proc discrim pool=test slpool=0.05 list; class type; priors'1'=0.6 '0'=0.4;run; proc discrim method=npar k=2 list; class type; run; 2:主成分分析模型 data solvency; input type x1 x2 x3 x4 x5 x6 x7 x8 [email protected]@; cards; XXXXXXX XXXXXX XXXXXXXX ; proc princomp out=out1; var x1-x9;run; data a; set out1; y=3.67805*prin1+2.21392*prin2+1.12608*prin3+ 0.78198*prin4+0.52051*prin5; run; proc sort; by y;run; proc print; var type y; run; 中间打XXXXXX的是观测数据

⑸ 用SAS进行主成分分析完后,在此基础上如何进行logistic回归分析

提取主成分之后要计算标化因子得分,既用各因子的标化分来代替原先所内有的研究变量的观容察值,最后将各因子的得分分别从低到高排序并划分为3~4等分(视样本量而定),以4等分(Q1~Q4)为例,Q4包含的人群属于对应因子的最佳拟合人群,Q3其次,Q2较弱,Q1既为该因子的对照人群,将Q1~Q4作为自变量引入Logistic回归后,主要观察OR值(Q4/Q1)是否有统计学意义,有的话既表示该因子对应变量有贡献。因子分析及其意义请你自己参考教材。

⑹ spss主成分分析

用 KMO and bartlette’s test检验你的数据是不是能使用主成分分析,KMO值越接近1越好,你现在都没这个值,说明是不可以用主成分分析的 。因此,这个结果是不能使用的

⑺ SAS软件进行相关性分析,结果怎么分析

(1)从输出结果的标题可以知道,下面表格的每一格的上一行表示Pearson相关系数,下一行表示对应的p值。从p值的大小可以判断出:(i)变量ru和变量gan、zong、ke都线性无关。变量ke和变量zong也是线性无关的。p值>0.05(ii)变量ke和变量gan线性相关性显著。0.01<p值<0.05(iii)变量ke和变量zong线性相关性极显著。p值<0.01(2)不过从输出结果看,用来计算相关系数的样本只有4个,结果显然很不可靠。而且进行Pearson相关性检验的前提之一是总体来自二元正态分布(很重要的),以上样本似乎很难通过检验?

⑻ SAS中的主成分分析和因子分析有什么区别

主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构。综合指标即为主成分。所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程。其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。三种分析方法既有区别也有联系,本文力图将三者的异同进行比较,并举例说明三者在实际应用中的联系,以期为更好地利用这些高级统计方法为研究所用有所裨益。二、基本思想的异同(一) 共同点主成分分析法和因子分析法都是用少数的几个变量(因子) 来综合反映原始变量(因子) 的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85 %以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。并且新的变量彼此间互不相关,消除了多重共线性。这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量。在主成分分析中,最终确定的新变量是原始变量的线性组合,如原始变量为x1 ,x2 ,. . . ,x3 ,经过坐标变换,将原有的p个相关变量xi 作线性变换,每个主成分都是由原有p 个变量线性组合得到。在诸多主成分Zi 中,Z1 在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子。对新产生的主成分变量及因子变量计算其得分,就可以将主成分得分或因子得分代替原始变量进行进一步的分析,因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的作用,为我们处理数据降低了难度。聚类分析的基本思想是: 采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系[3 ]。聚类分析是通过一个大的对称矩阵来探索相关关系的一种数学分析方法,是多元统计分析方法,分析的结果为群集。对向量聚类后,我们对数据的处理难度也自然降低,所以从某种意义上说,聚类分析也起到了降维的作用。(二) 不同之处主成分分析是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,也就是求出少数几个主成分(变量) ,使它们尽可能多地保留原始变量的信息,且彼此不相关。它是一种数学变换方法,即把给定的一组变量通过线性变换,转换为一组不相关的变量(两两相关系数为0 ,或样本向量彼此相互垂直的随机变量) ,在这种变换中,保持变量的总方差(方差之和) 不变,同时具有最大方差,称为第一主成分;具有次大方差,称为第二主成分。依次类推。若共有p 个变量,实际应用中一般不是找p 个主成分,而是找出m (m < p) 个主成分就够了,只要这m 个主成分能反映原来所有变量的绝大部分的方差。主成分分析可以作为因子分析的一种方法出现。因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。因子分析只能解释部分变异,主成分分析能解释所有变异。 聚类分析算法是给定m 维空间R 中的n 个向量,把每个向量归属到k 个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为: 类内的相关性尽量大,类间相关性尽量小。聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数

⑼ 高分!!!求用SAS做主成分分析的方法

用PRINCOMP过程。procprincompdata=SAS数据集out=SAS数据集standard;var变量表;(如果省略则对其他语句中没有出现的所有数值型变量进行分析)weight权重变量;freq频数变量;partial变量表;(制定用于分析偏相关或协方差矩阵的数值变量)by变量;run;

⑽ SAS统计软件因子分析如何计算,公式是什么

sas会给出你因子分析的结果的我替别人做这类的数据分析蛮多的