临床研究的中的统计分析思路可以归纳为描述基线信息、估计效应大小以及敏感性分析三部分。
一篇临床研究在报告完基线信息和效应估计后,基本已是完整的分析结果。
但临床研究统计分析结果的可靠性取绝于所用分析方法是否正确及方法背后的假定是否成立。
因此,研究者通常会改用其它分析方法、改变假定条件再次分析数据,以考察结果是否改变及改变的程度,此即敏感性分析。
敏感性分析结果是临床研究结果的重要部分。

当一个变量或多个变量发生改变而其他因素保持不变的情况下,观察研究方案的结论是否跟着变量的改变而改变。
具体又可分成单因素法和多因素法,前者只选择二个参数变化,后者则选择两个或多个参数同时变化。
阈值即临界值,当某方案的各种投入参数发生变化,从有益最大到利弊平衡点时,每个参数的最大和最小临界值之间就是阈度,在阈度内根据阈值的变化幅度可以判断每个因素的敏感程度。
在药物经济学研究中,由于各个变量的数据可能都存在着不确定性,因此,用数理统计学和概率论的可信区间方法来表示变动范围,获得每个变量的全距范围。
1. 离群值(outlier):
离群值的检测,有两类方 法:
一是假设检验,二是标签法。
标签法通过数据是否超过某区间或违背某准则来判定是否为离群值,是最常用的方法。
标准差法是最简单直白的标签法。
当数据超过3倍标准差即为离群值。
假设检验法因数据分布假定的限制,应用范围较小。
2. 缺失值:
缺失值是临床研究中不可回避的问题。
缺失值的处理策略,分为三大类:
完全数据法、缺失数据标记法及缺失值插补法。
①完全数据法:
即剔除含有缺失值的观测,仅用完全数据分析。
完全数据法建议在样本量较大,缺失值比例较少(<5%)时使用。
②缺失数据标记法:
将分类变量值缺失的观测归为单独的一类,连续变量缺失值用固定数值(通常为0)插补,并额外增加一个变量标记是否缺失。
缺失值插补法分为单 值插补和多重插补(Multiple imputation)。
常见的单值插补法包括均值(用于正态连续变量),中位数(偏态连续变量),众数(分类变量)插补,以及末次数据截转法、最佳数据截转法以及最差数据截转法。
单值插补简单易操作,但会低估数据的变异,需谨慎应用。
多重插补是依据数据集中其它变量的分布对缺失数据进行多次插补形成多个完整的数据集,而后采用标准的统计方法分析每个完整数据集,最后再汇总多个数据集的分析结果。
多重插补时依据缺失的模式(单调或任意)以及所填补变量的类型(连续变量、二分类或有序变量及无序多分类变量),可采用不 同插补方法,包括线性回归、预测均数匹配、倾向性评分、Logistic回归、判别函数、马尔科夫链蒙特卡洛以及全条件定义等。
3. 群组效应:
常规的统计模型均要求观测间互相独立,若观测间不独立,则需处理其相关性。
同一医生的患者、同一家医院的患者或同一社区的患者相比不同医生、不同医院或不同社区的患者有更多相似性,因此在统计模型中,常将其归为一个群组,以控制群组效应。
同一个患者不同时点的重复测量数据也属此类。
控制群组效应,常用广义估计方程(GEE)或混合效应模型。
4. 竞争风险对于生存数据,当有多个结局事件,且某结局事件的发生会影响甚至阻止其它结 局事件的发生,就会存在竞争风险。
如研究者关注卒中复发,一旦死亡提前发生,则无法观察到卒中复发结局。
对于竞争风险,常见的处理策略有:
(1)将多个事件打包整合成一个联合事件,采用Kaplan-Meier估计生存率,Log-rank检验比较组间差别,Cox比例风险模型估计风险比;
(2)将其它事件视为删失,分别对每个事件估计累积发生率(CIF),并采用原因别风险函数估计风险比];
(3)将发生其它事件的研究对象仍纳入风险集,估计关注事件的CIF,并采用次分布风险函数估计风险比,此即Fine-Gray模型。
参考文献
[1]闫世艳,郭中宁,何丽云,刘保延.临床研究缺失数据多重填补敏感性分析方法[J].世界科学技术-中医药现代化,2020,22(03):823-828.
[2]谷鸿秋.临床研究中敏感性分析的统计思路与统计图表[J].中国循证心血管医学杂志,2018,10(10):1166-1169+1178.
发表评论 取消回复