文献分享会
相比NHANES,UKBIOBANK,MIMIC等一些国外大型公开数据库,国内的CHARLS和CLHLS相对于刚接触数据挖掘的朋友可能更容易入手,每周都有很多文章刊发,笔者前一段时间刚接触CHARLS,遇到很友好的审稿人,收获了accept,打开了新的视野
浅谈几点经验就是:
1)CHARLS和CLHLS只需注册申请,就可以获得下载数据的权限,最好是edu邮箱;
2)数据清洗会比较繁琐,CHARLS和CLHLS的数据质量略差于上述三位大哥,要有一点耐心,这时候要是有点R和Stata的高手帮忙,会事半功倍,笔者是看了很多教程,步履蹒跚地学习;
3)不要想着花里胡哨的统计学,建模的过程很简单,公众号前期已经介绍过如何用SPSS完成回归分析的若干模型、Per SD increase以及P for trend;记住,很多文章的套路就是做这几个步骤;
4)数据挖掘不同于系统回顾和meta分析,时间性没那么强,一本期刊拒稿了可以再转投。
今天先看一篇5.25发表在BMC Geriatrics(2022影响因子: 4.07;中科院大类: 医学 1区)的文章,这本期刊发表了很多CHARLS和CLHLS的文章
Constructing the concept of healthy ageing and examining its association with loneliness in older adults
构建健康老龄化的概念并研究其与老年人孤独感的关系
数据来源:中国健康与养老追踪调查(CHARLS)
X:健康老龄指数(healthy ageing index)
WHO健康老龄化框架概述了老年人功能能力的五个领域,在此基础上,研究人员选择了17个组成部分的清单,涵盖了老年人满足基本需求、移动、做决策、建立和维持关系以及对社会做出贡献的能力。所有组成部分也由研究小组在已发表的研究中进行评估,并在至少三项研究中保持一致。为了准确地进行多变量统计分析,避免各组成部分之间的共线性,采用了创建健康老龄化指数的方法。我们的方法是基于之前发表的健康老龄化和虚弱领域的工作以及相关指数的构建。具体来说,在17个组成部分中,每个组成部分的个人评分(从0到1)都是根据其对健康老龄化的积极或消极影响来确定的。具体来说,对于4个等级的成分(即不能做/有困难并需要帮助/有困难但仍能做/没有困难),如果个人能力处于最低水平,则采用0分,每高一个反应水平则采用0.33、0.66和1的分数(表1)。生成的健康老龄化指数显示为17个组成部分的累积得分(理论范围0-17)。分数越高表示健康老龄化的表现越好。
Y:孤独感(loneliness)
孤独感是由流行病学研究中心抑郁量表(CES-D)中的一个问题“你在上周是否感到孤独?”来测量的,该量表已被普遍用于测量抑郁症状。测量孤独感的单一问题已被证明是有效的,并且适合在老龄人口中使用。有四个答案选项:“很少或没有时间(<1天)”,“一些或少量时间(1-2天)”,“偶尔或适量时间(3-4天)”,或“大部分或所有时间(5-7天)”。在本研究中,研究者将“很少或没有时间”重新编码为0(不孤独),其他选项为1(孤独)。创建了一个二元变量来对比有孤独感和无孤独感的老年人。
Z(协变量)
包括年龄、性别、居住状况、是否居住在农村地区以及婚姻状况在内的人口统计学信息被纳入分析。年龄被编码为连续变量,其余的人口学数据被分析为分类变量。在本研究中,那些居住在城市/镇中心和城乡结合部的参与者被编码为居住在非农村地区。
统计学分析
1)利用描述性分析,包括平均值、标准差(SD)、频率和百分比来描述人口信息和五个领域的功能能力的分布。
2)采用主成分法进行因子分析,以确定组成的指数在多大程度上正确反映了健康老龄化的多维度。特征值高于1.0的主成分被保留,这是一个通常被用作识别有意义模式的临界值。研究结果中产生的成分是根据负载率高于0.3的变量来解释的。
3)利用单变量和多变量的Logistic回归分析来研究孤独感和健康老龄化指数的每个组成部分之间的关联。
4)所有的数据分析都由SPSS 26.0进行,P < 0.05被认为是显著的。
结果
就参与者的五个领域的功能能力而言,所报告的满足其基本需求以及学习、成长和决策的能力比移动能力的得分要高(表3)。其中,与朋友互动是建立和维持与他人关系的最常见方式(n = 4,510, 42.2%),而加入社区相关组织或团体以及在上个月使用互联网的比例分别只有7.5%和0.6%。参与者中受雇从事非农工作(n = 1,388,13%)和农场工作(n = 333,3.1%)的比例很小(表3)。
表4列出了因子分析的成分负荷和特征值。特征值的大小强烈表明,健康老龄化具有五维结构,解释了信息总方差的52%。每个领域的累计方差解释率(%)分别为25%、33%、40%、46%和52%。特别是,第一部分的主导变量是满足其日常生活活动的能力。第二部分的主导变量是自我报告的健康状况、从事身体活动和身体疼痛问题。第三部分的主导变量是与朋友互动、加入团体和通过互联网与他人联系。第四部分的主导变量是受雇从事非农工作或农场工作。最后,第五部分中的主导变量是决定管理金钱或服用药物的能力。
为了研究孤独感与健康老龄化之间的关系,通过单变量和多变量Logistic回归分析对健康老龄化指数的五个组成部分进行了检验。在调整了年龄、性别和婚姻状况等因素后,多变量Logistic回归模型的结果(表5)显示,移动(调整后的OR=0.567,95% CI,0.529-0.608,P<0. 001),建立和维持关系(调整后OR=0.906,95% CI,0.846-0.971,P=0.005),以及学习、成长和做决策(调整后OR=0.657,95% CI,0.575-0.751,P<0.001)与老年人的孤独感显著相关。
转自:“一起学科研”微信公众号
如有侵权,请联系本站删除!