[摘要] 人用經(jīng)驗是中醫(yī)藥臨床實踐的總結(jié),也是中藥新藥研發(fā)中評價中藥安全性、有效性和臨床價值的重要數(shù)據(jù)來源。 收集和總結(jié)中藥人用經(jīng)驗數(shù)據(jù),應(yīng)用相關(guān)統(tǒng)計分析,形成可用于評價的證據(jù)是中藥人用經(jīng)驗研究關(guān)鍵一環(huán)。該文嘗試歸納并 探討目前中藥人用經(jīng)驗的臨床數(shù)據(jù)特點和統(tǒng)計分析方法,對數(shù)據(jù)類型、結(jié)局評價、偏倚評估、混雜因素及缺失值的處理逐一進 行總結(jié)。該文強調(diào)中藥人用經(jīng)驗的數(shù)據(jù)分析對于中醫(yī)藥證據(jù)形成的重要性,同時提出了目前的難點,如數(shù)據(jù)質(zhì)量不高,內(nèi)部 差異性大;缺少個體化數(shù)據(jù)處理方法;缺少“病證結(jié)合”中醫(yī)特色數(shù)據(jù)的方法等。相信隨著相關(guān)方法的規(guī)范化和科學(xué)化,中藥 人用經(jīng)驗數(shù)據(jù)能為中藥新藥的研發(fā)提供有力的證據(jù)。
近年來,國家發(fā)布了一系列政策文件指導(dǎo)中醫(yī)藥工作, 明確將中藥新藥研發(fā)作為中醫(yī)藥發(fā)展的重點任務(wù)之一,為中 藥新藥研發(fā)帶來了歷史性機遇[。其中,中藥注冊分類的配 套文件強調(diào)了人用經(jīng)驗的重要性,基于悠久的歷史傳承和廣 泛的使用,人用經(jīng)驗是中醫(yī)藥的獨特優(yōu)勢,為中藥新藥的研 發(fā)提供了有力的佐證[2]。
目前《中藥注冊分類及申報資料要求》中明確基于古代 經(jīng)典名方、醫(yī)療機構(gòu)制劑、名老中醫(yī)方等具有人用經(jīng)驗的中 藥新藥審評技術(shù)要求,加快中藥新藥審批,根據(jù)處方來源和 組成、臨床中藥人用經(jīng)驗及制備工藝情況等可適當(dāng)減免藥效 學(xué)試驗3]。中藥人用經(jīng)驗的主要來源是古籍醫(yī)案、醫(yī)療機構(gòu) 制劑及名老中醫(yī)等專家經(jīng)驗方。但是"人用經(jīng)驗"不直接等 同于堆砌的“人用數(shù)據(jù)”,而是需要通過嚴謹?shù)恼撟C總結(jié)為 “人用證據(jù)”[24]。因此,從臨床經(jīng)驗數(shù)據(jù)中評價療效、形成證據(jù)是中藥人用經(jīng)驗中重要的一環(huán)。
目前,藥物療效評價主要是基于隨機對照臨床試驗,分析 藥物效果得出證據(jù)。然而中藥人用經(jīng)驗的臨床數(shù)據(jù)類型比較 復(fù)雜,主要是以個體醫(yī)案、病例等累積而來的臨床數(shù)據(jù),混雜 因素眾多,其分析方法顯得多樣而復(fù)雜5]。因此本文試論述 中藥人用經(jīng)驗中臨床數(shù)據(jù)以及分析統(tǒng)計方法,供同行參考。
1 臨床數(shù)據(jù)類型
由于中醫(yī)藥已經(jīng)廣泛在臨床上使用,相關(guān)的臨床試驗設(shè) 計更傾向于實用性而非解釋性,因此各種類型實用性臨床試 驗(PRCT) 更加契合中醫(yī)藥的臨床設(shè)計原則[6]。但在大多數(shù) 情況下,中藥人用經(jīng)驗的臨床數(shù)據(jù)沒有預(yù)先的干預(yù)設(shè)計,所 以一般更多采用觀察性研究的方法來評估藥物效力。而根 據(jù)觀察人群是否存在對照組,又可以把觀察性數(shù)據(jù)分為觀察 類試驗性數(shù)據(jù)和非試驗數(shù)據(jù),見圖1。

1.1 類試驗觀察性數(shù)據(jù) 臨床試驗的目的是確定藥物療效 (effectiveness),其特征必須包含干預(yù)組、對照組,以及2組干 預(yù)前和干預(yù)后的數(shù)據(jù)。觀察性研究并沒主動干預(yù),但是含有 中藥治療人群和對照人群,以及2組干預(yù)前和干預(yù)后的數(shù) 據(jù),因此把含有這4種元素的臨床數(shù)據(jù)稱為類試驗觀察性數(shù) 據(jù),用于評估藥物效力 (efficacy)。干預(yù)前/后的數(shù)據(jù)如果 是 不 同 時 間 點 分 別 收 集 , 則 為 縱 向 數(shù) 據(jù) (longitudinal observational data),如果依靠回顧一次性記錄,則為斷面數(shù)據(jù) (cross-sectional data)[8]。 在縱向數(shù)據(jù)中,如果滿足的基本條 件,即治療前后記錄相關(guān)指標(biāo),則為縱向類試驗數(shù)據(jù) (longitudinal pre-post data)。如果治療前和治療后多次重復(fù) 測量數(shù)據(jù),則為中斷時序縱向類試驗數(shù)據(jù) (longitudinal interrupted time series data)?。在觀察性研究中,中斷時序 縱向數(shù)據(jù)由于可以矯正時間依賴性偏倚,因此在評估中藥療效的內(nèi)部效度(藥物與療效的因果關(guān)系)方面較好。雖然斷 面數(shù)據(jù)質(zhì)量整體不及縱向數(shù)據(jù),但是也能為中藥療效的內(nèi)部 效度評估提供一定信息[0]。在斷面數(shù)據(jù)中,也可以根據(jù)多 次,或者一次性收集治療前后的結(jié)果,分為中斷時序斷面數(shù) 據(jù)(cross-sectional interrupted time series data)和前后性斷面 數(shù)據(jù)( cross-sectional pre-post data),前者的數(shù)據(jù)質(zhì)量優(yōu)于后 者。如果數(shù)據(jù)僅僅提供治療后信息,則會混入大量混雜信 息,幾乎不能評價治療與結(jié)局之間的因果。
1.2 非試驗數(shù)據(jù) 在實際的臨床數(shù)據(jù)中,往往有大量的醫(yī) 案、門診病歷等數(shù)據(jù),這些數(shù)據(jù)缺乏對照組,因此為非試驗數(shù) 據(jù)。相比于類試驗觀察性數(shù)據(jù),非試驗數(shù)據(jù)對于療效評價, 以及中藥-療效的因果關(guān)系推論要弱,然而在中藥人用經(jīng)驗 中,絕大部分數(shù)據(jù)都為非試驗性,合理收集這些數(shù)據(jù),歸納分 析結(jié)果仍可能為后續(xù)的臨床試驗設(shè)計提供不少佐證[7, 非試驗數(shù)據(jù)根據(jù)數(shù)據(jù)記錄時間,以及是否重復(fù)測量,同樣可 分為中斷時序縱向數(shù)據(jù)、縱向前后數(shù)據(jù)、中斷時序斷面數(shù)據(jù) 以及前后性斷面數(shù)據(jù)4種。其中縱向數(shù)據(jù)能提供的信息很 為優(yōu)質(zhì),即使在非試驗數(shù)據(jù)中,采用與目標(biāo)值對比的方法,時 序縱向數(shù)據(jù)也能在一定程度上評估中藥的療效和安全 性[12]。相反,橫斷面數(shù)據(jù)由于患者的狀況會隨時間變化,或 其混入其他因素,可能會導(dǎo)致嚴重的信息偏倚。因此在收集 臨床數(shù)據(jù)時,應(yīng)注重保存類試驗觀察性數(shù)據(jù)。而在缺少對照 組時,也應(yīng)該保證有治療前后的數(shù)據(jù),避免回顧性記錄而產(chǎn) 生偏倚。
2 結(jié)局及安全性評價
結(jié)局指標(biāo)是評價藥物療效的核心數(shù)據(jù)。在中藥人用經(jīng) 驗中,既要考慮臨床評價利用度,又要顧及中醫(yī)藥自身實踐。 一般建議在中藥人用經(jīng)驗的療效評價上,主要結(jié)局還是采用 國際公認的結(jié)局指標(biāo),次要結(jié)局可選取報告結(jié)局(PRO), 用 于評估患者生命質(zhì)量等[13]。中藥人用經(jīng)驗數(shù)據(jù)一般采用病 證結(jié)合記錄,證候評分是中醫(yī)藥數(shù)據(jù)的特色,但證候評分與 重要療效的關(guān)系要謹慎處理,評分的高低與患者實際的療效 獲益不一定呈絕對相關(guān)[14]。結(jié)局指標(biāo)選擇可以參考高質(zhì)量 指南、系統(tǒng)綜述或隨機對照試驗等,也可以參考國際核心結(jié) 局指標(biāo)集,如 COMET 核心結(jié)局等。此外在循證基礎(chǔ)上,應(yīng)該 鼓勵完善和應(yīng)用中醫(yī)藥相關(guān)的核心指標(biāo)集進行療效 評價[15]。
安全性的評價是中約人用經(jīng)驗數(shù)據(jù)的一個重點,也是其 薄弱環(huán)節(jié)[16]。在平時的臨床記錄中,往往忽視不良事件的 記錄, 一些不合理的低不良事件率在很多時候是由于沒有合 理記錄造成。因此平日需加強病歷臨床數(shù)據(jù)管理,規(guī)范不良 事件的定義和等級,平時按照要求上報和處理。在規(guī)范化方 面使用如 MedDRA、WHOART、ICD10 等統(tǒng)一標(biāo)準(zhǔn)的不良反 應(yīng)編碼慣例或字典[17-18
在結(jié)局統(tǒng)計方面,中藥人用經(jīng)驗臨床數(shù)據(jù)包含大量混雜 因素,因此需要通過多種方法對藥物的效力值進行矯正。即使應(yīng)用了分層、匹配和模型矯正后,對結(jié)果的解讀也需要慎 重,此時得出的統(tǒng)計結(jié)果可以為后續(xù)臨床試驗作為參考,但 不能直接解讀為藥物的療效或者效力[1921]。此外,中藥人用 經(jīng)驗數(shù)據(jù)的類型和統(tǒng)計目的與臨床試驗有較大差別,由于沒 有預(yù)先設(shè)定臨床有效閾,且樣本量較多,基于中藥人用經(jīng)驗 的統(tǒng)計往往會出現(xiàn)有統(tǒng)計學(xué)意義,而無臨床意義的情況(如 某種中藥確定有降壓作用,但是由于作用太弱沒有應(yīng)用價 值)。因此中藥人用經(jīng)驗數(shù)據(jù)的統(tǒng)計結(jié)果應(yīng)注重描述性統(tǒng) 計,強調(diào)結(jié)果的臨床解讀而弱化統(tǒng)計學(xué)意義,為后續(xù)試驗提 供更多的信息[22]。對于病案記載的中醫(yī)證候,可應(yīng)用評分 工具進行評估,并建議采用標(biāo)準(zhǔn)化差異統(tǒng)計,用于排除偏倚。 對于多個互相不能重合的結(jié)局,應(yīng)該選擇競爭風(fēng)險模型 competing risk model),考慮多種潛在結(jié)局來評估藥效,避免 錯誤估計藥物對某種結(jié)局的效果[23]。
3 偏倚評估
相對于設(shè)計良好的臨床試驗數(shù)據(jù),中藥人用經(jīng)驗數(shù)據(jù)由 于沒有良好的質(zhì)控,往往存在較大偏倚。中藥人用經(jīng)驗數(shù)據(jù) 可見各種選擇性偏倚和信息偏倚,如僅在醫(yī)院收集臨床經(jīng)驗 數(shù)據(jù),會出現(xiàn)伯克森偏倚[2];中醫(yī)藥證候結(jié)局具有多樣性, 僅觀察一種證候結(jié)局時,可能造成競爭風(fēng)險偏倚[25];而信息 偏倚在中藥人用經(jīng)驗數(shù)據(jù)中更為常見,如回憶偏倚、報告偏 倚、誘導(dǎo)偏倚等。而臨床記錄的不規(guī)范,則會產(chǎn)生藥物暴露 錯分和結(jié)局錯分偏倚[26]。
對于選擇性偏倚,在數(shù)據(jù)收集、篩選流程和細節(jié)上要謹 慎設(shè)計,制定相應(yīng)的納入排除樣本標(biāo)準(zhǔn),明確每種偏倚產(chǎn)生 的原因和每個步驟可能產(chǎn)生的偏倚,以提高樣本的可分析 性[27]。對于信息偏倚,應(yīng)盡量提取相同指標(biāo)的重復(fù)測量信 息,并采用回歸稀釋方法評估測量誤差并對其校正。對于矛 盾數(shù)據(jù)需要溯源,查看原始醫(yī)案/病歷記錄。對于異常值,需 要在統(tǒng)計分析計劃中預(yù)先制定敏感性分析的方案,并依次在 統(tǒng)計分析報告中進行異常值的敏感性分析。此外還有來源 于混雜因素的偏倚,由下面單獨討論[26]。
4 混雜因素處理
混雜是指干預(yù)對結(jié)果的影響(或關(guān)聯(lián))被另一個變量的 存在所扭曲的情況,是數(shù)據(jù)偏倚產(chǎn)生的重要原因之一。由于 混雜因素與藥物干預(yù)/療效單獨相關(guān),因此在評估時常常扭 曲干預(yù)和結(jié)果之間實際關(guān)系,從而導(dǎo)致錯誤估計中藥療效。 控制混雜因素好的方法即是隨機對照過程,通過隨機分組 可以使比較基線相等,排除混雜因素。然而由于中藥人用經(jīng) 驗的臨床數(shù)據(jù)多為觀察性,且數(shù)據(jù)的來源、質(zhì)控均不嚴格,因 此混雜因素問題可能是中藥人用經(jīng)驗數(shù)據(jù)分析的一大難點, 需要重點處理[28-29
在識別混雜因素方面,需要緊密結(jié)合臨床知識,盡可能 納入并矯正潛在對藥物療效有影響的因素[30]。由于中藥 人用經(jīng)驗數(shù)據(jù)質(zhì)控問題,可能存在較多未知的混雜因素,超 出臨床醫(yī)師的判斷范圍,此時可以結(jié)合一些統(tǒng)計學(xué)方法,如傳統(tǒng)的逐個相關(guān)性分析法,結(jié)合有向無環(huán)圖分析因子之間 的關(guān)系,從而判斷是否為混雜因素[31]。此外一些機器學(xué)習(xí) 的方法,如 Lasso 回歸的手段可分析各個因子對療效結(jié)局的 影響力,XGBoost算法可計算各種因子組合對療效的貢獻 度[32]?;谶@些方法配合知識,能更好地識別出混雜 因素。
在矯正混雜因素方面,對于連續(xù)性變量的結(jié)局指標(biāo), 一 般采用前后差值,或協(xié)方差方法來防止基線偏倚,或采用更 為穩(wěn)健的中斷時序設(shè)計矯正基線[33.34]。在數(shù)據(jù)量較大情況 下,對于潛在因素應(yīng)多分層,分層除了可以較好矯正混雜因 素以外,還可以繼續(xù)分析藥物和其他因素的協(xié)同作用。此 外,還可以依靠各種統(tǒng)計工具對混雜因素進行矯正,見表1。 各種回歸模型是矯正混雜因素的常用方法,如應(yīng)用多重線 性回歸處理連續(xù)性數(shù)據(jù)資料,應(yīng)用Logistic 回歸處理一般分 類資料,應(yīng)用 Poisson 回歸處理偏態(tài)分布資料,應(yīng)用Cox 回歸處理生存資料等[35-36]。回歸分析可以同時考慮多個因素的 作用,排除混雜因素的影響,但是要求結(jié)局事件的例數(shù)不能 太少。此外可以用隨機匹配法,使中藥組和對照組之間具有 可比性,而常用的匹配方法為傾向性評分法(propensity score method)[20]。 傾向性評分法可針對混雜因素進行模擬 擬合后打分,根據(jù)分數(shù)相似度進行匹配,使2組基線相近。 除了直接匹配,利用傾向性評分還可以進一步聯(lián)合分層、回 歸、加權(quán)等方法矯正混雜因素,相比于回歸法,傾向性評分可 以用于混雜因素較大,樣本數(shù)量較小的數(shù)據(jù),但難以像回歸 方法構(gòu)建矯正以后的中藥量-效的非線性關(guān)系[3]。中藥人用 經(jīng)驗數(shù)據(jù)往往包含大量的未知混雜因素,對其處理也一直是 業(yè)界的難題之一。工具變量(IVA) 分析是處理未知混雜因 素的常用辦法,如孟德爾隨機化設(shè)計就引入了基因型這一工 具變量[38]。但是在中醫(yī)藥的研究中,如何尋找合適的工具 變量,仍然存在爭議和困難。
5 數(shù)據(jù)缺失處理
不同于臨床試驗數(shù)據(jù),中藥人用經(jīng)驗數(shù)據(jù)由于沒有統(tǒng)一 規(guī)范設(shè)計,存在大量缺失值,因此對于缺失值的處理是中藥 人用經(jīng)驗的必經(jīng)環(huán)節(jié)。缺失值可以根據(jù)數(shù)據(jù)內(nèi)部隨機屬性, 分為完全隨機缺失、隨機缺失和非隨機缺失3種[3]。 一般 來說對于完全隨機缺失,其結(jié)果不依賴任何其他變量,因此 可直接對樣本進行填補,如應(yīng)用LOF 方法、多重插補法或回 歸方法進行變量填充[40]。但是在中藥人用經(jīng)驗臨床中,由 于記錄的模式問題,絕大多數(shù)缺失都存在非隨機性(如醫(yī)院 或者個人記錄的偏好,中醫(yī)醫(yī)案的風(fēng)格導(dǎo)致),如果直接刪除 或用傳統(tǒng)方法填補,可能會造成偏倚[4]。因此這時可利用 模式混合模型(pattern mixture models)進行插補,但是由于此 方法需要的樣本量較大,因此還需要對缺失值進行敏感性分 析,從而保證缺失填充的準(zhǔn)確性[42]。
6 問題與展望
目前在中藥人用經(jīng)驗臨床數(shù)據(jù)的處理和統(tǒng)計中,存在不 少問題和難點,如記錄質(zhì)控不高、規(guī)則不統(tǒng)一、標(biāo)準(zhǔn)和指標(biāo)難以收集和歸一化。諸多中醫(yī)藥個性化數(shù)據(jù),如如何在數(shù)據(jù)收 集和分析中合理處理組方配伍、量效關(guān)系等因素;如何納入 并統(tǒng)計評估中醫(yī)藥特色的指標(biāo),實現(xiàn)“病證結(jié)合”;如何構(gòu)建 中藥人用經(jīng)驗臨床證據(jù)等級的評估等。但盡管存在這樣和 那樣的問題,作者相信隨著國家的重視,交叉學(xué)科的融入以 及新方法的推廣,這些問題會逐個得到解決,中藥人用經(jīng)驗 數(shù)據(jù)收集和處理過程將會更加科學(xué)、嚴謹,形成規(guī)范,指導(dǎo)中 藥新藥的研發(fā)。
