作者:周蓓,于浩(南京醫科大學公共衛生學院,南京 211166,江蘇)
來源 :中國臨床藥理學與治療學 ?2019-06-27
摘要:臨床試驗數據的清理是臨床試驗過程中非常重要的環節,完整、清潔的數據才能用于統計分析。本文旨在討論臨床試驗數據清理過程中數據核查計劃的撰寫及邏輯核查的分類等,并進一步討論近年來臨床試驗數字化趨勢對數據的采集及清理可能帶來的影響。
關鍵詞:臨床試驗;數據清理;病例報告表設計;數據核查計劃
臨床試驗數據是藥物研發過程中最重要、最有價值的產出之一,是整個臨床試驗過程中的核心,最終作為統計分析的基礎用以論證藥物的安全性及有效性。保證數據的完整及清潔有助于得到可靠、可信的結論。而臨床試驗數據的采集、報告與處理的每一步驟都可能伴隨錯誤。國內外法規均明確要求,在數據收集錄入完畢后對數據進行審查、核對、清理,及時發現并解決問題以獲取完整、清潔、真實可信的臨床數據。本文對臨床試驗數據管理中數據清理的各類核查類型及數據核查計劃的制定進行了總結,以期對后續臨床試驗的數據清理提供一定的參考。
1 數據核查計劃的建立
《藥物臨床試驗數據管理和統計分析的計劃和報告指導原則》中提到,規范的數據管理計劃有助于獲得真實完整、準確可靠的高質量數據。為保證臨床試驗數據的質量和科學評價藥物的有效性與安全性,須事先對數據管理工作和統計學分析原則制定詳細的計劃書。在進行數據核查前,應制定詳細的數據核查計劃(data validation plan,DVP),以明確數據核查內容、方式與核查要求。相關人員根據數據核查計劃進行編程或人工核查,之后發出質疑(query)確認數據。
數據核查計劃的制定非常關鍵,應至少包括如下內容,如Tab.1所示。
無論是紙質或者電子數據采集系統,均應在試驗開始初期撰寫完備、清晰的數據核查計劃,以便能高效、準確地對數據進行清理。獲得高質量的臨床研究數據是臨床數據管理的最終目的。同時數據核查計劃還應由臨床試驗其他參與人員,如申辦方、統計分析人員進行審核,以防止漏查、錯查、重復查的情況出現。
2 臨床試驗中收集的數據模塊概述
一個臨床試驗數據中通常包括受試者人口學基本信息、病史、實驗室檢查、體格檢查、生命體征、不良事件、合并用藥、研究完成情況等信息。
研究目的、適應癥及分期的不同會導致臨床數據的收集有一定的差異。不同數據模塊的核查與清理有一定的共同性,同時不同模塊之間也有一定的交叉性,整個臨床試驗收集的數據即是各個單獨的模塊構成的一個整體,模板之間獨立又互相關聯。除了單個數據點的核查外,通常還涉及模塊與模塊之間的交叉核查、數據庫中收集的數據與外部數據的核查等。
3 邏輯核查的分類總結
臨床試驗數據核查中的邏輯核查涉及缺失值、極端值、異常值等。根據質疑產生方式的不同分為系統核查、人工核查等,系統內核查撰寫方式的不同又分為系統內置核查、人工撰寫的邏輯核查等。為闡述方便,我們將其大致歸為幾類:
窗口/范圍的核查:臨床試驗中涉及的日期通常具有一定的前后邏輯關系并且大部分日期需要在一定的訪視窗范圍內,如訪視日期。
交叉邏輯關系的核查:臨床試驗中各個數據點并不是獨立存在的,其通常與其他數據點具有一定的邏輯關系,需在某一數據點的條件下考慮另一數據點的數據情況,如受試者性別與妊娠試驗的關系。
缺失/不完整:臨床試驗中一些數據點的缺失及日期數據不完整的情況。如人口學資料、知情同意日期等。
其他核查:不同的臨床試驗項目可能具有一些不同的數據核查要點,大部分不具有共通性。
同時臨床試驗中還有一部分外源性數據,如中心實驗室檢查、第三方PK/PD數據、嚴重不良事件等,需要臨床數據庫中的數據進行人工的一致性核對。大致情況如Fig.1所示。
3.1 范圍及窗口的邏輯核查
臨床試驗方案通常對試驗期間的各個時間點有若嚴格的規定,各日期之間有一定的前后關系且有固定的窗口期。病例報告表(CRF)中對這些日期進行收集,而數據管理員需要對這些日期、時間點進行一定的核查,以確認各訪視、檢查等確實按照方案進行執行,而違反方案的日期確實是操作中的實際情況而非填寫錯誤等。通常情況下,各個訪視內的各檢查日期均應在本次訪視及下次訪視之間。
另外知情同意書的填寫需要為臨床試驗中最早的一個日期(既往史除外),所有臨床操作都應該在受試者簽署知情同意書之后進行。
而在腫瘤項目中,由于無進展生存期(progression free survival)、總生存期(overall survival)等作為主要或次要指標,對進展日期、死亡日期等尤為敏感,需要對其進行細致的確認及核對,如進展日期與死亡日期的一致性核對。
3.2 模塊間的交叉邏輯核查
模塊間最常見的交叉核查主要為病史、不良事件、合并用藥及實驗室檢查之間的關系核查。
病史通常記錄的是受試者在進入試驗前存在過或仍存在的疾病,通常與試驗目的、適應癥及藥物特點有關。當病史中存在一些慢性病時,如高血壓、糖尿病時,這類疾病通常是難以治愈且需要持續用藥控制的,這時注意核查合并用藥中是否記錄了相應的藥物。不良事件作為藥物安全性的重要佐證,是臨床試驗數據極為重要的一部分,不良事件的出現意味著可能出現的實驗室檢查異常及相應的合并用藥及治療。
合并用藥中記錄包括針對既往病史及不良事件的藥物情況,可能還會存在一些預防用藥。需要與病史及不良事件進行核查,以防漏記或錯記等情況發生。同時合并用藥對后續方案中違禁用藥的判斷、分析集的劃分而言是非常重要的。
實驗室檢查(生命體征、體格檢查)通常與不良事件相對應,兩者之間互為因果關系,需要對其進行一致性的核對。
這幾塊數據的清理通常需要耗費大星時間來進行人工核查?;谀壳皹I內臨床試驗數據管理的趨勢,可考慮通過CDISC標準標準化、模塊化CRF及前期數據管理的準備工作以減輕核查工作量,進而提高工作效率及數據質量。
3.3 缺失或不完整的核查
數據缺失及不完整的核查在數據清理過程中占很大一部分。在臨床試驗數據收集中,有些數據點是必須收集的,如知情同意書簽署日期、性別、年齡等。在數據采集過程中,需要注意區別數據確實未采集與數據漏填的情況,較好的方法是規定單個獨立的數據點都需要填寫數據,如數據未知或不適用,則相應的填寫UK(unknown)或NA(not available),以便于清晰明確的進行區分。
除單個數據點外,臨床試驗中收集的數據通常具有一定的前后關聯,病例報告表中一般會收集一些提示性變量,這些變量并非均為關鍵性數據點,其主要作用在于:(1)提示研究者注意此處是否進行了檢查以及是否檢查了但未譽寫至CRF;(2)用于數據管理核查,如無此變量,數據核查無法確認此數據點是否確實未做或是漏填寫。此類邏輯核查在臨床試驗項目中非常常見,并且也涵蓋了臨床試驗邏輯核查的大部分內容。此類邏輯核查通常較為簡單,但需要注意在撰寫數據核查計劃時需要考慮周到全面,防止遺漏。
3.4 人工核查
人工核查是指數據管理員通過CRF所收集的數據獲取核查所需的受試者相關數據信息,整理成數據清單或列表(data lists)的形式,根據醫學相關的專業知識對數據之間的邏輯關系通過人工的方式進行核查,找出有邏輯錯誤之處,而后通過質疑進行確認。
需要人工核查的數據,通常其數據形式為開放填寫內容(free text),數據雜亂無序,無法通過程序來進行統一的判斷。如同一個不良事件-谷丙轉氨酶升高,在不同中心、不同研究者,甚至同一個受試者的不同訪視階段名稱各不相同,如描述為“谷丙轉氨酶升高”、"AST升高”、"肝功能異?!?、"丙氨酸氨基轉移酶升高”等等。
3.5 外部數據的一致性核對
臨床試驗過程中,有時會出現一部分外部數據需要與臨床數據庫中的數據進行比對,如中心實驗室、第三方PK/PD、嚴重不良事件等外部數據基本信息的一致性核對。其中嚴重不良事件(SAE)是藥物安全性的重要組成部分,在臨床試驗過程中,目前國內SAE需要在獲知后24h內上報,通常臨床運營團隊會進行采集整理,而另一方面SAE作為不良事件的一部分,在CRF中也進行了收集。這兩部分數據的一致性核對是非常重要的。SAE的數據點較多,人工核查費時費力,可以通過SAS DDE語言來實現不一致數據點的定位標記,使一致性核對更加的精準直觀。也可以通過EXCEL的VB語言,在數據導出到EXCEL之后,進行數據的處理及核對標記。兩者雖然途徑不同,但主要目的還是通過計算機語言對不一致處進行標記以提高一致性核對的效率。
在數據最終鎖定之前,數據管理人員、統計師、監查員等各方需要進行一次數據核查會,對數據進行評估和檢查,以確定分析集的劃分,并對仍然存在的難以解決的數據疑問進行討論確定。
4 討論
數據即事實,各個階段的臨床數據的收集組成了整個臨床研究,我們可從臨床數據中窺見各階段操作、執行、記錄的過程。數據的質量直接影響到最終數據遞交,數據清理的過程是遞交高質量數據以供統計分析及報告的必經的一步。而近年來,臨床試驗行業的快速發展及新興技術的出現,也為臨床試驗數據管理與數據清理帶來了新氣象。
從早期的紙質系統到目前盛行的EDC(electronic data capture system)系統,臨床試驗逐漸向電子化轉換。數字化趨勢下,除了國際廣泛認可的RAVE、RDC、InForm等系統,目前國內也出現了各類EDC系統。各類系統的出現給臨床試驗數據的清理提供了一些新的方法和思路。傳統紙質系統的數據清理有一定的滯后性,而EDC系統自動通過內嵌的程序自動產生質疑,使臨床試驗的數據清理呈動態進行,前期的數據核查計劃撰寫及系統的配置、測試是非常重要的,動態清理在一定程度上減輕了后期數據清理的工作量,保證了質疑的時效性。目前部分EDC系統除有CRF構建、邏輯核查、實驗室管理等基本功能外,還可通過OCR(optical character recognition)技術識別化驗單進行自動讀人,通過系統內嵌程序智能提醒AE與CM的關聯度,通過語音進行質疑答復等,使傳統的數據采集、清理變得更加的高效簡捷,臨床研究數據庫與藥物安全瞥戒等數據庫的宜接對接,也一定程度地減輕了數據庫間的不一致性。減輕工作量的同時更能一定程度上提高臨床試驗的質量。
另一方面,FDA于2013年8月頒布了一項臨床試驗新的監查指導原則《基于風險的檢查方法(A Risk-Based Approach to Monitoring)》,其中強調了中心監查(centralized monitoring)的概念。同時在ICH E6(R2)中也對中心化監查進行了定義:中心化監查是由合格的、接受過培訓的人員(例如數據經理、統計師)對收集的數據進行遠程的評估,對數據進行集中的審閱,包括中心內與中心間的數據趨勢、異常值、方案違背等。對于數據管理人員而言,數據的清理與評估不再是基于單個受試者或單本CRF,而需要站在各個中心的高度俯瞰中心間的異同及趨勢。
在未來臨床試驗的發展進程中,數據管理人員不僅在數據的管理方面,同時還可能越來越多地參與臨床試驗的監查過程中。行業的革新與新技術的發展為數據清理帶來了新的發展和方向,也給數據管理人員帶來了更多的挑戰和機遇。
參考文獻(略)