不用收数据就能迅速做成的研究? (二)
2022/3/24 16:49:04 阅读:255 发布者:chichi77
对于资源有限的新研究者而言,创造性地使用既有数据和标本不失为一种快速有效的方法在研究领域内积累宝贵经验,并在有限的时间范围内获得可发表的结果。
上期给大家讲了使用既有数据的常见方法及其优缺点,还有常见的数据库,指路不用收数据就能迅速做成的研究?竟然比汪峰老师上不了热搜还稳!,这期来填坑啦,给大家讲讲在评价治疗的使用模式和临床结局时如何使用二次数据。
01
评价治疗和临床结局
二次数据在评价治疗的使用模式和临床结局时特别有用。如,使用国家心肌梗死登记数据探索重组组织型纤溶酶原激活剂(tPA)治疗急性心梗后发生脑出血的危险因素。71073位接受tPA治疗的患者中,有673位经CT或MR确认发生了脑出血。多变量分析显示与低剂量相比,tPA剂量超过1.5mg/kg与脑出血发生率增加存在有意义的关联[1]。鉴于脑出血发生的总体风险不足1%,那么收集原始数据的临床试验就过于庞大和昂贵了。
02
更好理解效力和效果的差异
二次数据分析的另一个突出贡献是让人们更好地理解效力和效果的差异。随机对照试验是在高度控制的有限临床背景下,针对选择人群确定治疗效力的金标准。然而,在“真实世界”中,由于不同医生对药物和剂量的选择及患者的服药依从性等因素,可导致治疗在一般人群中应用的效果不如试验中观察到的效果,有时可用二次数据研究真实实践中的治疗效果。如,临床试验证明初期血管形成术治疗急性心梗的效果优于溶栓治疗[2],但这一结论只有在实际的血管成形术成功率可以达到临床试验所在医疗环境下的成功率时才成立。基于社区数据集的二次分析尚未发现初期血管成形术的获益优于溶栓治疗[3-4]。
03
用于描述临床实践
二次数据分析是用于描述某种治疗在临床实践中如何应用的最好方法。尽管临床试验可以证实新治疗的效力,但只有临床医生采用此治疗时,获益才能得以体现。理解利用率、关注区域差异及治疗应用的特定人群(如老年人、少数民族、经济弱势群体,以及女性),有公共卫生方面的意义。如,使用5%的医疗保险受益人的随机样本的公开数据,研究者表明在调整混杂因素后,青光眼患病率存在明显的地区差异,提示在该国某些地区存在过度诊断或诊断不足[5]。
04
可连接多个既有数据
可以将两个或多个既有数据集连接起来以回答一个研究问题。对服兵役会如何影响健康感兴趣的研究者利用1970—1972年的征兵抽选制,按出生时间随机抽样选定了520万名20岁具有服兵役资格的男性(第一个数据来源),并根据死亡证明登记(第二个数据来源)系统得到后续的死亡情况。预测变量(出生日期)为在越战时期随机指定服兵役的代码。那些随机指定的需要服兵役的男性在随后十年间死于自杀或机动车事故的风险显著增加[6]。
05
数据集汇总
汇总数据包括只针对群体的信息(如每个省的宫颈癌死亡率),而不是针对个体。用此类数据,只能通过比较群组间的危险因素的信息(如区域烟草销售量)与结局发生率(区域肺癌发病率)来测量这些组间的关联。基于汇总数据的关联研究称为生态学研究(ecologic studies)。
汇总数据的优点在于其可利用性,主要缺点是关联特别容易受到混杂的影响,因此,基于总体观察到的关联不一定在个体中也存在。如,在高自杀率的地区烟草销售可能会更多,但自杀的个体不一定是吸烟最多的人。这种情况被称为生态学谬误(ecologic fallacy)。汇总数据最适用于检验新假设的合理性或产生新的假设,然后在其他使用个体数据的研究中对有趣的结果开展深入研究。
关于二次数据的内容就到这里啦,如果有什么问题欢迎后台留言哦。明天就是五一劳动节啦,小舟祝各位劳动人民所有的期待都有结果,所有的耕耘都有收获。劳动节快乐!
如有侵权,请联系本站删除!