作者:姜慧勇1,2,婁冬華1*(1南京醫科大學公共衛生學院,江蘇南京211166;2科文斯醫藥研發(北京)有限公司,北京100015)
來源:南京醫科大學學報(自然科學版) 第38卷第10期 2018年10月
關鍵詞:CDISC;既往病史;不良事件;合并用藥;邏輯核查;數據清理
臨床試驗數據管理中,病例報告表(case report form,CRF)中的既往病史(medical history,MH)、不良事件(adverse event,AE)和合并用藥(concomitant medication,CM)的數據沒有普遍規律可循,大量文本型數據需要研究者填寫,數據量較大,一般需要有相關醫學背景知識人員才能完全清理等特點,是數據清理的難點和重點。這部分臨床試驗數據的清理是衡量一個臨床試驗項目數據質量的關鍵點,也是監管機構評價臨床試驗真實、可靠、完整的切入點?;诋斍皹I內臨床試驗數據管理趨勢,本文欲以臨床數據交換標準協會(clinical data interchange standards consortium,CDISC)?臨床數據采集整合標準(clinical data acquisition standards harmonization,CDASH)為基礎,探索目前臨床試驗MH、AE和CM的CRF表設計的成熟性和規范化程度。建立一套通用、廣覆蓋的MH、AE和CM數據邏輯核查方案(EDC自動核查、SAS程序核查),用以清理MH、AE和CM三者普通邏輯錯誤和數據彼此矛盾的情況。從而標準化、模塊化臨床試驗前期數據管理的準備工作,降低試驗成本,提高效率及數據質量。
1 基于CDISC?CDASH標準的MH、AE和CM的CRF表設計
1.1 CRF設計流程
CDISC建立了涵蓋研究方案設計、數據采集、分析、交換、遞交等環節的一系列標準。其中CDASH描述了基礎數據采集域和CRF標準問題文字描述的變量、實施指南和最佳操作方案的融匯。盡管CDASH涵蓋了MH、AE和CM 3個表格最通用的數據采集要求,可以應用于絕大多數臨床試驗,但是由于每個臨床項目方案不同,所有CRF表格還是需要進行獨立的設計評估流程(圖1)。
1.2 MH、AE和CM的CRF表
CDASH將所有需要采集的變量分為3類(表1),強烈推薦:一般情況下CRF都要包含這些變量;推薦:特定條件下需要包含這些變量;可選:根據方案或申辦者實際需求選擇性包含這些變量。除此之外,也可根據方案的實際情況,添加其他變量。
1.3 CRF表設計的注意點
除了事件名稱外,盡量避免開放性的文本框。目前絕大多數臨床研究都會使用MedDRA和WHO Drug分別對AE、MH和CM的名稱進行編碼,從而使后期數據統計分析變得更加便捷。減少開放性文本框,意味著研究者填寫更加便利清晰,數據質疑的數量將會大大減少。
使用通用術語來定義CRF采集變量的回答選項。不同研究的數據采用相同變量名、回答選項術語代碼、結構或格式,有助于數據分析和交流,也方便了向藥政管理部門提交。
具體化想要得到的答案,充分考慮可能存在的回答。比如合并用藥開始日期可能存在不完全的情況,在設計階段中,“日”需要增加“UN”選項,“月”需要增加“UNK”選項,整體日期需要增加“Unknown”選項。
2 邏輯核查
邏輯核查是指通過計算機編程,利用計算機軟件的功能,對已錄入CRF的數據進行驗證,以發現存在問題的數據。CDISC中對邏輯核查的定義:對預期的內容邏輯、數據字段格式、范圍或其他屬性進行一個可追溯的、自動化的評估過程。邏輯核查的優點:可以對錄入CRF的數據進行實時反饋;及早發現前后數據矛盾點;提高數據質量,使監查員和數據管理員有更多精力放在更為復雜的數據清理上。
2.1 邏輯核查的分類
根據目前普遍的數據管理流程,邏輯核查可分為系統實時邏輯核查和SAS程序邏輯核查兩類。同時按照核查數據點的不同,又可分為單一變量邏輯核查和多變量交互邏輯核查。
2.2 邏輯核查的流程
按照計算機程序的開發過程,邏輯核查的步驟包括:邏輯核查需求定義(edit check specification,ECS)、開發、測試、應用及變更控制。其中尤以ESC的設定最為重要,決定了數據清理的質量和效率。
2.3 MH、AE和CM的CRF表的系統實時邏輯核查
在設計ESC時需要包含以下內容(以AE表舉例):邏輯核查的訪視名、系統質疑觸發的變量、相關的變量、邏輯、質疑內容和邏輯核查類型(表2)。
2.4 MH、AE和CM的CRF表的SAS邏輯核查
通常來說SAS邏輯核查相對系統實時邏輯核查要復雜許多,往往是幾個表中的多個變量交互核查,有的甚至需要借助其他相關資料。比如表3是一條核查抗糖尿病用藥與MH和AE邏輯關系的ECS,該條邏輯核查借助了糖尿病相關藥品的whoDD編碼列表(526條,由醫學專家和編碼人員共同提供)和糖尿病相關事件MedDRA編碼列表(80條,由醫學專家和編碼人員共同提供)。SAS程序員在獲取MH、AE和CM數據庫后,結合上述編碼列表,通過SAS編程將不符合邏輯的合并用藥全部列出,由數據管理員進行核查并發出質疑。
3 結束語
盡管我國臨床試驗數據管理起步相較于歐美等發達國家較晚,但隨著我國國家食品藥品監督管理總局對數據質量的日益重視,數據標準化是大勢所趨。MH、AE和CM的數據清理只是臨床試驗數據管理的一部分,更多其他類型的病理報告表有待統一完善,從而幫助我們更高效、高質地開展試驗。