临床试验设计中统计学是非常重要的,不可马虎。但是往往在我们临床实验设计中总会犯错,导致一个项目出现错误结果,今天小编整理了一些关于临床试验中常出现的统计学错误,供大家参考学习,看自己有没有犯过这类的错误。
1. 对象合格标准不明确
只报告来源和时间段,总体不清晰:大杂烩 ,得不到科学结论; 事前未规定合格标准和排除标准,事后排除;不报告按照合格标准和排除标准筛选对象的过程。
2. 结局指标多而杂 --是事先规定的最重要的结局指标,通常以此为准来计算样本量。常见错误:终点指标过多 , 大海捞针。
临床试验时,不知道哪个指标在组与组间有差异; “确定某个指标后,万一组间没有差异,岂不被动 ?! ”
生理、生化、组织学、基因,都做; “内容丰富,显得水平高 ?! ”
许多仪器一下子可以做许多项目; “许多项目一一分析, 哪个有意义, 就报告哪个指标 ?!”哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论 —— 假说是科研的灵魂心中无数,不要 “先上马再说 ” 指标多,实验工作量大。大海捞针 —— 碰运气,不是科研!
指标多,翻来覆去分析,制造假阳性!
Nature 杂志统计学指南:
常见错误之一。仅分析 1 个指标时, P(假阳性 )=0.05, P(1 次分析不犯错误 )=0.95 , 同时分析 2 个指标时, P(2次分析均不犯错误 ) = [P(1 次分析不犯错误 )] 2 P(假阳性 )=1
- 0.952 ≈ 0.,1同0时分析 3 个指标时, P(假阳性 )=1 - 0.953 ≈ 0.14同时分析 10 个指
标时, P(假阳性 )=1 - 0.9510 ≈ 0. 40
常见错误之一 (Nature) 多重比较不校正
多重比较 : 对一组数据作多项比较时, 必须说明如何校正 α水平, 以避免增大第一类错误的机会 ---- Bonfferoni 校正( α/k 来校正, k 为两两比较次数)
3 不重视对照
为何必需对照?
消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。
鉴别研究因素的效应和自然发展结果。 例如,研究某药物对口腔溃疡模型兔的疗效, 口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。
常见错误
没有对照!千方百计省去对照组,以减少一半工作量 ! 自身前后对照 / 历史对照 /文献对照 / “标准 ”对照。
对照不当,对照太弱:安慰剂对照 / 对照过强: 西药+加中药 ~西药 / 对照剂量有争议: 试验药,大剂量 ~对照药,中小剂量 / 对照基线不可比:试验组年轻、病轻 ~ 对照组年老、病重。
应当如何?
事先明确研究假说,例如,新药比常规药好:以常规药为对照设计:研究组新药 ~ 对照组常规药可比性:基线可比、过程可比、终点可比。保证可比性措施:干预性研究 : 随机化观察性研究:匹配
4 样本量无根据
干预性研究: “ 500例患者随机分成两组 ”为什麽 500 例?不多不少? 500 例从天而降?现成送上门来?
观察性研究: “ 10年期间 A 组 3000 例, B 组 258 例 ”---- 有多少用多少 !?
应当如何? 报告最小样本量估算及其依据
1. 比较两组测定值的均数依据:
(1)预计欲比较的两总体参数的差值
(2)预计总体标准差
(3)允许出现假阳性结果的机会
(4)允许出现假阴性结果的机会 :
例:格列美脲、格列苯脲对比研究以 HbA1c 为主要终点报告依据欲检出 HbA1c 临床差异 ≥ 0.65%
假定标准差为 1.3%
双侧检验水平 0.05
功效 80%
退出率 20% 计算: 157 例
2. 比较两组达标率依据:
(1)预计一组发生某结局的百分比为1
(2)预计另一组发生某结局的百分比为
(3)允许犯假阳性错误的机会
(4)允许犯假阴性错误的机会 2
例:格列美脲、格列苯脲对比研究以HbA1c 达标为主要终点
(1)预计一组发生某结局的百分比为45%
(2)预计另一组发生某结局的百分比为25%
(3)允许犯假阳性错误的机会5%
(4)允许犯假阴性错误的机会20%计算 : 176 例
5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要 ?
(1) 消除分配处理有意或无意的偏倚。
(2) 为实施盲法创造条件。
(3) 使得有可能利用概率论来说明:各干预组之间的差异不大可能是偶然性造成的。
略去实施过程中丢失对象,将最后两组人数说成是随机分组人数应当如何?
成功的随机化取决于:
(1) 产生一个不可预见的分配序列 ;
(2) 隐“蔽 ”( allocation concealment )这个序列,直到分配完毕 (必须建立一个分配处理的系统 ) 。 报告如何随机分组, 如何 “隐蔽 ”:谁做随机序列, 谁收病人, 谁分药和发药; 分组方案如何保管随机化类型 Simple randomisation ( 简单随机化 ) Blocked randomisation ( 区组随机化 ) Stratified randomisation ( 分层随机化 ) Minimisation ( 不均衡最小化 )
6. 避而不谈盲法
常见错误
如何 “盲”?轻描淡写
为何没有 “盲 ”?不加说明
普遍忽视盲法判定终点没有独立的终点判定委员会:专人、专职;盲法措施盲法实施效果如何?缺乏评价
7. 量表的滥用
医学研究中, 量表的应用日益广泛: 生存质量 (quality of life, QOL) 患者报告结局 (patient report outcome, PRO) 美国 FDA 规定药品说明书必须有 PRO内容。
国外已经研制了许多量表,可以借鉴;有些课题国外还没有适宜的量表 ,有待研制国内许多医学研究也开始采用量表测量临床疗效。
常见错误
1. “引进国外量表 ”
未经作者同意,声称是 “ xx量表的中文版 ”妄称文化调试,随意修改
未曾考察中文版量表的信度、效度和反应度
2. “自制量表 ”
未经查阅文献和专家咨询,匆忙起草 没有概念框架和基于概念框架的条目池
没有试用和现场调查,没有心理测量学评价应当如何引进国外量表?
联系原作者,征得同意;
翻译-逆翻译,文化调试,与原作者共同修改、定稿; 收集现场数据,评价信度、效度和反应度
应当如何研制新量表?
查阅文献、专家咨询
确定概念框架,领域、方面根据概念框架建立条目池 量表初稿
小规模试用、修改收集现场调查数据
评价量表,信度、效度、反应度修改、定稿
8. 不考虑基线均衡与否
不首先考察基线是否均衡
不论基线均衡与否,一概使用单变量分析方法:比较百分比或均数:
检验;比较均数: t 检验、非参数检验
比较发生某事件的时间: Kaplan-Meier 方法 2
应当如何?
不论干预性研究还是观察性研究,数据分析的第一步总是考察基线是否均衡,列表报告若干预性研究许多变量基线不均衡 随机化失败!
若观察性研究多个变量基线不均衡,很自然 从设计入手,认真解决!
对付基线不均衡的统计学方法: (1) 分层 (2) 匹配 (3) 回归
9. 缺失值处理不当三类缺失机制:
完全随机缺失 (missing completely at random, MCAR), 缺失完全由随机因素造成随机缺失 (missing at random, MAR), 缺失与已有的观察结果有关
非随机缺失 (missing not at random ,NAR), 缺失与当前观察到和尚未观察到的结果有关 常见错误 : 丢弃具有缺失值的个体?
仅完全随机缺失才可丢弃有缺失值的个体
临床试验中,若仅采用完整病例进行分析,违背 Intention-To-Treat 原则 (ITT 原则 )
仅在以下情况下考虑使用完整病例进行分析
① 在探索性研究中,药物研发的初期阶段;
② 在确证性试验中,作为次要结果的处理方法常见错误 : 数据填补( data imputation ) ?
仅在以下情况下方可填补
① 相对小的缺失率(例如 10%~ 15%)
② 含有缺失值的变量对于所要研究的问题具有非常重要的意义;
③ 有合理的假设和结转技术 , 一般宜遵循保守原则
不同填补方式产生的结论需进行敏感性分析
10 统计检验结论不当
差异性检验
零假设:两组(或多组)总体均数间没有差别对立假设:两组(或多组)总体均数间有差别
检验水准 :
若 p “两组样本均数间的差异具有统计学意义 (statistically significant) ”--- “可以认为总体均数间有差别 ”
若 p “两组样本均数间的差异不具有统计学意义 ”---- “尚不能认为总体均数间有差别 ”
常见错误
若 “两组样本均数间的差异显著 ”---- “总体均数不等 ”(忘记有假阳性可能)
若“两组样本均数间的差异不显著 ”---- “总体均数相等 ”