诊断实验(Diagnosis Test)研究概述二——盲法

医学研究中,常使用盲法(Blinding)以降低信息偏倚,更好地保障结果的真实性。在随机对照试验(Randomized controlled trial, RCT)中最常用,依据设盲程度不同分为开放试验、单盲设计、双盲设计和三盲设计。与RCT不同的是,诊断试验研究中常分为使用盲法和不使用盲法,本文举例概述了诊断试验研究实施过程中盲法的应用。
关键词:诊断试验; 诊断试验评价; 盲法; 信息偏倚
一、诊断试验研究中的盲法设计
诊断试验研究中一般要求试验操作者、结果判断者、报告填写者均不知道受试者的临床资料、其他检查结果及接受的处理措施等,否则容易受主观因素影响,导致结果发生偏倚。如评价肺部超声对早期肺癌的诊断效果研究中,将胸部CT设为诊断金标准,研究时若超声医师已知患者胸部CT中有肺结节(未采用盲法独立地测定),则超声医师在检查过程中很可能更倾向发现肺部有异常回声,造成偏倚。
评价诊断试验研究中盲法主要体现在三个方面:
待评价诊断试验的结果判断者不应知道金标准结果,即不应知道研究对象是“有病”还是“无病”
金标准结果判断者不应知道待评价诊断试验的结果
诊断试验与金标准的判断者均应对其他临床信息或检测结果不知情
诊断试验研究中如何实施盲法与研究设计有关。病例对照研究中,由于已知研究对象的患病状态,一般较难实施高质量的盲法,很可能高估诊断试验的准确性。横断面研究与队列研究中,受试者短时间内被“同步”或连续纳入,且真实患病状态未知,则更容易实施盲法进行同步评价。值得注意的是,无论何种研究设计,待评价试验和金标准评价间隔时间应尽可能缩短,以免受试者的疾病状态发生改变,造成偏倚。
二、诊断试验中盲法的要求与应用
国家药监局在2021年9月发布的《体外诊断试剂临床试验技术指导原则》中对盲法的要求描述为“体外诊断试剂的比较研究试验中应对试验体外诊断试剂和对比方法(如有)的试验操作者和结果评价者设盲,使其在试验过程中不知晓受试者的疾病诊断或其他相关检测结果等信息,从而避免引入偏倚”(图1)。
图1
诊断准确性研究报告规范(Standards for Reporting Diagnostic Accuracy Studies, STARD) 2015版中,条目13a、13b均建议诊断试验需要报告盲法的实施情况。
条目13a (Whether clinical information and reference standard results were available to the performers or readers of the index test)建议报告待评价诊断方法的检测人员或读取结果人员是否知晓研究对象的临床资料和参考标准结果
条目13b (Whether clinical information and index test results were available to the assessors of the reference standard)建议报告参考标准的评估者是否知晓研究对象的临床资料和待评价诊断方法结果
STARD清单建议报告这两个条目,主要目的并不是评价盲法在该试验中是否可行,而是使读者能够更加科学地判断诊断试验的结果。
图2
目前公开发表的学术论文中,绝大多数诊断试验均未报告是否采用了盲法进行诊断评价,少部分文献尽管提到了使用盲法,但也未详细报告具体的执行过程。敦王青等[实用放射学杂志, 2019, 35(5): 815-845.]评价了2014年1月1日至2016年4月8日发表在中文期刊上的152篇影像诊断准确性试验报告,发现只有24篇(15.79%)规范地报告了13a条目,只有3篇(1.97%)规范地报告了13b条目。吕敏之等[中国临床医学, 2020, 27(3): 345-348.]评价了在中国临床试验注册中心网站注册的29项关于新型冠状病毒肺炎的诊断试验研究,结果发现均未报告是否使用盲法及试验实施的细节。
三、诊断试验研究的盲法应用案例
(一) 案例一
题目:ICG快速诊断重症患者呼吸困难原因的临床研究(图3)
来源:中华肺部疾病杂志(电子版),2017,10(3):277-280.
目的:探讨阻抗心动描记图(ICG)在快速诊断ICU重症患者呼吸困难原因中的应用价值
意义:呼吸困难是ICU重症患者常见的原因,可分为心源性以及非心源性两种,早期明确呼吸困难的性质,对及时采取适当的干预措施至关重要。临床上往往较难快速判断呼吸困难的性质,两种呼吸困难互为误诊的情况十分常见,血流动力学参数可以辅助评估患者的呼吸困难性质,尤其是对具有心脏或肺部病史的患者。阻抗心动描记图(impedance cardiography,ICG)可获得无创血流动力学参数从而鉴别呼吸困难为心源性或非心源性。本研究旨在评估ICG法用于快速诊断重症患者呼吸困难性质的价值。
盲法过程:作者根据统一的纳入排除标准选取了80例急诊因呼吸困难入ICU的患者,通过盲法诊断,比较ICG法与ICU医师对心源性及非心源性呼吸困难的判断能力的一致性。本研究设计的盲法过程体现在:(1) 数据采集:专人负责所有患者ICG监测和记录所有数据,ICG监测的血流动力学结果ICU医师均不知晓;(2) 结果评价:由没有参与治疗且不知道ICG结果的专家团队评价每一个患者的医疗数据,得出患者是心源性或者非心源性呼吸困难的最终诊断。
图3
(二) 案例二
题目:Can Quantitative CT Texture Analysis be Used to Differentiate Fat-poor Renal Angiomyolipoma from Renal Cell Carcinoma on Unenhanced CT Images?[基于非增强CT图像的定量纹理分析是否可用于区分贫脂性肾血管平滑肌脂肪瘤和肾细胞癌(图4)]
来源:Radiology, 2015, 276(3):787-796.
目的:评价定量纹理分析在非增强CT图像上区分贫脂性血管平滑肌脂肪瘤(fp-AML)和肾细胞癌(RCC)的准确性。
意义: fp-AML由于脂肪含量不足,无法通过传统CT和磁共振(MR)成像技术与RCC准确区分。定量纹理分析通过客观的计算机辅助测量,独立于放射科医师的主观视觉解释,在既往研究中显示有助于区分乳腺、肺和脑部的良、恶性病变,但尚未评估该技术对区分肾脏肿块性质的价值。
盲法过程:每位患者的影像学资料均由两名分别具有8~12年工作经验的且受过正规专业培训的泌尿生殖专业放射科医师进行阅读评估。医生不知道患者包括最终组织病理学结果在内的任何信息。评价医生使用Horizon Medical Imaging软件独立地阅读、评价非增强CT图像上100个肾脏病变肿块的异质性分数。
图4
四、诊断试验研究的盲法实施案例
由于诊断试验的盲法与一般药物性研究盲法在实施技术与操作方法上有较大差别,此处以《睡眠质量评估系统临床试验的盲法实施技术介绍》一文为例,介绍诊断试验的编盲设计与实施操作方法,其大致过程如图5所示。
图5
题目:睡眠质量评估系统临床试验的盲法实施技术介绍(图6)
来源:中国临床药理学杂志, 2015, 31(20): 2062-2064.
背景:目前对于睡眠呼吸暂停综合征(sleep apnea syndrome, SAS)诊断的国际金标准是通过多导睡眠监测仪(pulse signal generator, PSG)来进行的,但操作复杂,后期结果分析工作量大,且检测费用昂贵。睡眠质量评估系统相比PSG诊断SAS更加操作简便、低成本。
目的:通过对PSG中提取的历史数据采用睡眠专家人工分析判读结果(金标准)及睡眠质量评估系统判读结果的对比,评价睡眠质量评估系统诊断SAS的有效性和准确性。为避免操作技师采集数据时及研究者进行人工读片时产生偏倚,特对本试验过程予以设盲。
编盲准备:(1)数据调阅:由不参与试验评价的操作技师从多导睡眠仪中以时间倒序依次提取可供人工读图分析结果的数据240 笔,并为每笔(每位受试者)数据分别建立一个单独的文件夹,每个文件夹均编有一个唯一编号。(2) 原始编码:由不参与任何评价过程的研究人员对操作技师提取的原始数据重新进行编号。先将240个独立的文件夹按一定的顺序增加原始编码001—240后(该原始编码不同于操作技师所提供的文件夹编号),删除操作技师所提供的文件夹编号,从而形成以原始编码命名的用于编盲的240个数据文件夹。
编盲过程:(1) 随机编码:以SAS 8.2统计软件编写随机程序,依据编好的原始编码进行2次随机,分别加以前缀A、B,形成的随机结果为A001—A240及B001—B240。指定A001—A240为人工判断随机编码,B001—B240为系统判读随机编码。两次随机的结果作为盲底保存。(2) 随机编码标注:将随机编码依据随机输出结果中的序号对文件夹进行标注,随机编码标注结果形式为“原始编码—人工判读随机编码—系统判读随机编码”,如“001—A111 —B005”。标注过程由不参与任何评价过程的研究人员双人核对确认。(3) 编码隐藏:随机编码标注后,经复制形成三个同样的数据文件。其中,一个数据文件将原始编码及人工判读随机编码予以隐藏(删除),另一个数据文件将原始编码及系统判读随机编码予以隐藏(删除)。隐藏后按编号大小依次排序,将第三个数据文件原封保存。该过程的操作由不参与任何评价过程的研究人员双人核对确认。(4) 编码后数据文件的使用:编盲后,标注为“原始编码—人工判读随机编码—系统判读随机编码”的数据文件存档。标注为“人工判读随机编码”的数据文件,用于诊断睡眠呼吸暂停综合征的人工判读。标注为“系统判读随机编码”的数据文件,用于睡眠质量评估系统判读。(5) 编盲过程文件的生成:详细记录随机编码标注、编码隐藏的过程、编盲后数据文件的使用规定、操作者签名及注明日期,所有资料均形成书面文件作为编盲过程文件保存。
揭盲:人工判读结果、系统判读结果分别按“人工判读随机编码”“系统判读随机编码”的标识录入数据库,形成独立的两个数据库文件。数据库确认无误锁定后,在统计专业人员、研究者、申办者均在场的情况下,将盲底揭开,以原始编码为数据文件唯一标识,将人工判读结果与系统判读结果一一对应。
图6 我要纠错
End