中易网

高分!! 帮忙做一个二元线性logistic回归模型的数据计算,有具体的表格数据

答案:3  悬赏:20  
解决时间 2021-04-08 05:23
数据入图所示

帮忙把公式中的过程写出来,这里不能写公式,截图也行的





最佳答案
额,本来看到这个问题很久,不想冒泡,因为做这种东西没有技术含量。
但是出来冒泡的原因是:楼上的不要误导人,这么多变量还是线性回归??你是学统计的吗?何况不可能没有多重共线问题的。
自己的建议:使用因子分析或者主成分分析,找出影响Y的关键因素,建立由主成分因分子构成的多元回归模型。想分别求出每种变量对Y的影响那是不可能也不现实的。除非你13种变量完全不存在共性,异方差,或者滞后问题。
不管做的,这种东西死麻烦还没技术含量。thank
全部回答
建议你去一些专业的环保网站查询,或者去一些具体部门咨询。这些问题一般资料都比较难收集。只有专业性的部门和机构才有~~
logistic回归主要分为三类,一种是因变量为二分类得logistic回归,这种回归叫做二项logistic回归,一种是因变量为无序多分类得logistic回归,比如倾向于选择哪种产品,这种回归叫做多项logistic回归。还有一种是因变量为有序多分类的logistic回归,比如病重的程度是高,中,低呀等等,这种回归也叫累积logistic回归,或者序次logistic回归。 二值logistic回归: 选择分析——回归——二元logistic,打开主面板,因变量勾选你的二分类变量,这个没有什么疑问,然后看下边写着一个协变量。有没有很奇怪什么叫做协变量?在二元logistic回归里边可以认为协变量类似于自变量,或者就是自变量。把你的自变量选到协变量的框框里边。 细心的朋友会发现,在指向协变量的那个箭头下边,还有一个小小的按钮,标着a*b,这个按钮的作用是用来选择交互项的。我们知道,有时候两个变量合在一起会产生新的效应,比如年龄和结婚次数综合在一起,会对健康程度有一个新的影响,这时候,我们就认为两者有交互效应。那么我们为了模型的准确,就把这个交互效应也选到模型里去。我们在右边的那个框框里选择变量a,按住ctrl,在选择变量b,那么我们就同时选住这两个变量了,然后点那个a*b的按钮,这样,一个新的名字很长的变量就出现在协变量的框框里了,就是我们的交互作用的变量。 然后在下边有一个方法的下拉菜单。默认的是进入,就是强迫所有选择的变量都进入到模型里边。除去进入法以外,还有三种向前法,三种向后法。一般默认进入就可以了,如果做出来的模型有变量的p值不合格,就用其他方法在做。再下边的选择变量则是用来选择你的个案的。一般也不用管它。 选好主面板以后,单击分类(右上角),打开分类对话框。在这个对话框里边,左边的协变量的框框里边有你选好的自变量,右边写着分类协变量的框框则是空白的。你要把协变量里边的字符型变量和分类变量选到分类协变量里边去(系统会自动生成哑变量来方便分析,什么事哑变量具体参照前文)。这里的字符型变量指的是用值标签标注过得变量,不然光文字,系统也没法给你分析啊。选好以后,分类协变量下边还有一个更改对比的框框,我们知道,对于分类变量,spss需要有一个参照,每个分类都通过和这个参照进行比较来得到结果,更改对比这个框框就是用来选择参照的。默认的对比是指示符,也就是每个分类都和总体进行比较,除了指示符以外还有简单,差值等。这个框框不是很重要,默认就可以了。 点击继续。然后打开保存对话框,勾选概率,组成员,包含协方差矩阵。点击继续,打开选项对话框,勾选分类图,估计值的相关性,迭代历史,exp(b)的ci,在模型中包含常数,输出——在每个步骤中。如果你的协变量有连续型的,或者小样本,那还要勾选hosmer-lemeshow拟合度,这个拟合度表现的会较好一些。 继续,确定。 然后,就会输出结果了。主要会输出六个表。 第一个表是模型系数综合检验表,要看他模型的p值是不是小于0.05,判断我们这个logistic回归方程有没有意义。 第二个表示模型汇总表。这个表里有两个r^2,叫做广义决定系数,也叫伪r^2,作用类似于线性回归里的决定系数,也是表示这个方程能够解释模型的百分之多少。由于计算方法不同,这两个广义决定系数的值往往不一样,但是出入并不会很大。 在下边的分类表则表述了模型的稳定性。这个表最后一行百分比校正下边的三个数据列出来在实际值为0或者1时,模型预测正确的百分比,以及模型总的预测正确率。一般认为预测正确概率达到百分之五十就是良好(标准真够低的),当然正确率越高越好。 在然后就是最重要的表了,方程中的变量表。第一行那个b下边是每个变量的系数。第五行的p值会告诉你每个变量是否适合留在方程里。如果有某个变量不适合,那就要从新去掉这个变量做回归。根据这个表就可以写出logistic方程了:p=exp(常量+a1*变量1+a2*变量2.。。。)/(1+exp(常量+a1*变量1+a2*变量2.。。。))。如果大家学过一点统计,那就应该对这个形式的方程不陌生。提供变量,它最后算出来会是一个介于0和1的数,也就是你的模型里设定的值比较大的情况发生的概率,比如你想推算会不会治愈,你设0治愈,1为没有治愈。那你的模型算出来就是没有治愈的概率。如果你想直接计算治愈的概率,那就需要更改一下设定,用1去代表治愈。 此外倒数后两列有一个exp(b),也就是or值,哦,这个可不是或者的意思,or值是优势比。在线性回归里边我们用标准化系数来对比两个自变量对于因变量的影响力的强弱,在logistic回归里边我们用优势比来比较不同的情况对于因变量的影响。举个例子。比如我想看性别对于某种病是否好转的影响,假设0代表女,1代表男,0代表不好转,1代表好转。发现这个变量的or值为2.9,那么也就是说男人的好转的可能是女人好转的2.9倍。注意,这里都是以数值较大的那个情况为基准的。而且or值可以直接给出这个倍数。如果是0,1,2各代表一类情况的时候,那就是2是1的2.9倍,1是0的2.9倍,以此类推。or值对于方程没什么贡献,但是有助于直观的理解模型。在使用or值得时候一定要结合它95%的置信区间来进行判断。
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
联通2g卡升级3g卡后月租是19块吗?
中型客车多少座?
船员被拖欠工资怎么办?
when i say it, i mean it
美元上写的“in God We Trust”是什么意思
雨林木风和过期的罐头哪个系统好
南京到六安的火车票多少钱
信贷资金的第二重归流是指什么?
佳能相机电池仓盖坏了能否配新的?
可口可乐公司为何实施本土化策略?
鲜母乳和冷藏母乳混在一起可以吗
半边天美容美体中心我想知道这个在什么地方
胡子拔下来的末梢粘有黑色的东西
塑料壳时间长了外面摸起来有些粘粘的,咋办呢
2016年旺苍职业中学单招走的有哪些学校
推荐资讯
RC正弦波振荡电路的输出幅度由什么决定
为什么有人喜欢在晚上工作与学习
柳梢青·送卢梅坡 作者在表达时运用了什么手
苹果4s的手机内存有多少G左右啊
电脑的麦克(耳机插头)能通过转换插头插在电
马犬总咬自己后屁股咋回事
关羽投降曹操后,知道刘备还活着,又是如何去
有人吃过右玉羊肉吗,我觉得味道很不错,网上
擦肩而过第一句是谁唱的那女的叫什么谢谢
女朋友删我在她空间的留言是什么心态?
宽带10兆配合路由器是多少m的
六盘水圆通出租汽车有限公司这个地址在什么地
手机登qq时,显示手机磁盘不足,清理后重新登
刺客的套装怎么选啊?