日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

ICH E9:臨床試驗的統(tǒng)計學指導原則(下篇)

 qpalzmxmcbv 2019-07-11

題記:本文是【人用藥品注冊技術(shù)要求國際協(xié)調(diào)會 ICH】三方協(xié)調(diào)指導原則中有關(guān)臨床試驗的統(tǒng)計學指導原則的中文版,因原文較長,我們將分三部分推送,以饗讀者,以下為第三部分。

聲明:本文版權(quán)歸ICH 指導委員會。侵刪!

ICH E9:臨床試驗的統(tǒng)計學指導原則(上篇)

ICH E9:臨床試驗的統(tǒng)計學指導原則(中篇)

5. 數(shù)據(jù)分析

5.1 預定的分析計劃

在進行臨床試驗設計時,最終數(shù)據(jù)分析的統(tǒng)計方法的主要特征需在試驗方案中的統(tǒng)計分析部分加以說明。這一部分需包括主要變量的驗證性分析方法的所有主要特征,以及預期分析問題的處理方法。對于探索性試驗,這一部分還可包含一些更一般的原則及思路。

統(tǒng)計分析計劃(見詞匯)可以在完成試驗方案后單獨成文,可包含設計方案中主要特征的更加技術(shù)性的詳細細節(jié)(見 7.1)。這一計劃可包括主要變量或次要變量及其他數(shù)據(jù)統(tǒng)計分析的詳細執(zhí)行步驟。在對試驗資料進行盲態(tài)評閱(見7.1 的定義)分析后,應對統(tǒng)計分析方案進行再檢查和必要的修訂,并應在揭盲之前完成。正式記錄應當在統(tǒng)計分析計劃完成和其后的揭盲前保持不接觸。

如果盲態(tài)評閱建議更改試驗方案中所述的主要特征,需以文件的形式寫入修訂方案中,否則,根據(jù)盲態(tài)評閱結(jié)果建議對統(tǒng)計分析計劃作出修改即可。只有在試驗方案(包括修訂方案) 中設想的,分析結(jié)果才可被認為是證實性的。

在臨床研究報告的統(tǒng)計分析一節(jié),必須詳細寫明統(tǒng)計方法,包括是什么時候作出關(guān)于臨床試驗過程方法學決策的(見ICH E3)。

5.2 分析集

數(shù)據(jù)用于主要分析的病例集(Analysis Sets)需在分析方案的統(tǒng)計一節(jié)明確定義。另外,所有將要開始試驗過程(例如,進入階段)的病例的文件都是有用的,該文件的內(nèi)容取決于特定試驗的詳細特點,但是,只要可能,應當收集人口學的及病情的基線資料。

如果所有隨機化進入臨床試驗的病例均符合入組標準,參與了試驗的全過程且無失訪,并提供了完整的數(shù)據(jù)記錄,則該例應包括在分析中是顯然的。試驗的設計與執(zhí)行均應盡可能到達這一目標。但實際上,是否能完全做到這一點是有疑問的。因此,試驗方案中統(tǒng)計部分應有預見性地寫明預期的問題,說明這些對用于分析的病例和數(shù)據(jù)有何影響。試驗方案中還必須說明一些方法,以使研究執(zhí)行過程中可能出現(xiàn)的不正確做法減到最少。這些會有損分析的滿意性,包括各種類型的偏離試驗方案、退出治療及缺失值。試驗方案應考慮到如何減少這類問題的出現(xiàn)頻度,又要考慮到在分析資料時出現(xiàn)了這類問題的處理方法。在盲法核查時,應在可能有的補充文件中寫明分析時對違反方案的處理方法。最好確認任何對試驗方案的偏離發(fā)生的時間、原因及對結(jié)果的影響。偏離試驗方案的頻率、類型、缺失值,以及其他問題均需寫入試驗報告中,它們對試驗結(jié)果可能產(chǎn)生的影響亦需在試驗方案中加以論述(見ICH-E3)。

關(guān)于分析集的決定,需遵循以下兩個原則:1)使偏倚到達最?。?)控制I 類錯誤的增加。

5.2.1 全分析集

意向性分析(intention-to-treat,見詞匯)的基本原則是:主要分析應包括所有隨機化的病例。依從這一原則需要完整地隨訪所有隨機化對象的研究結(jié)果。但實際上這一想法難以達到,理由將在下面敘述。因此,在此文件中以“全分析集”用于描述分析集,是指盡可能完全并且盡可能接近包括所有隨機化病例的意向性分析的思想。在分析中保留初始隨機化在防止偏倚并提供統(tǒng)計檢驗的安全基礎方面是重要的。在很多臨床試驗中,“全分析集”方法是保守的,在許多情況下它也會對治療效果作出估計,這種估計更能反映以后實踐中的情況。有少數(shù)情況可能導致從“全分析集”中排除已隨機化的病例,包括不滿足主要入組標準(違反合格性),沒有用過一次藥以及在隨機化后沒有任何數(shù)據(jù)。這類排除都需證明其合理性。不符合入組標準的病例可以從分析中排除而不會引入偏倚的只有以下一些情況:

(1)入組標準判定在隨機化之前。

(2)可以完全客觀地作出有關(guān)違反合格性的檢測。

(3)所有病例接受相同的違反合格性的檢查(這在開放的研究中或即使在雙盲研究中如果數(shù)據(jù)在強調(diào)盲態(tài)審核的重要性而在檢查之前揭盲的情況下,可能是很困難的)。

(4)所有按特定的入組標準檢出的違反行為都被排除掉了。

在某些情況下,從所有隨機化病例集中除掉任何從未用過試驗藥的病人是合理的。盡管排除這些病例,例如,是否開始治療的決定不會受到因了解病人的處理安排的影響時,仍然保持了意向性治療的原則。在另外一些情況,有必要從所有隨機化病人集中去除任何在隨機化后沒有數(shù)據(jù)的病人。除非由于這些排除,或任何其他原因引起的可能偏倚都被述及,否則沒有一個分析是完整的。當用病人的“全分析集”時,在隨機化之后違反方案可能對數(shù)據(jù)和結(jié)論有影響,尤其是當它發(fā)生與處理的指定有關(guān)時。從多方面考慮,將這些病人的數(shù)據(jù)包括在分析中,與意向性治療一致,是恰當?shù)摹L厥鈫栴}在于,有關(guān)病人在接受一次或多次劑量后退出,而在此后不再有數(shù)據(jù),以及由于其他原因而失訪的病人,因為在“全分析集”中不包括這些病人,可能嚴重地削弱這種方法的基礎。因而,當主要變量是在病人由于任何理由失訪的情況下測定的,或是隨后根據(jù)方案中的預期評定日程收集的則是有價值的;如主要變量是死亡率或嚴重的發(fā)病率時繼續(xù)收集的資料,則特別重要。以這種方法意向性收集數(shù)據(jù)應在設計方案中寫明。歸因技術(shù),從最后一次觀察的結(jié)轉(zhuǎn)(carrying forward)到應用復雜的數(shù)學模型的方法也可用于補償缺失值。其他用于保證可對“全分析集”的每一個病例進行測量的方法可能需要關(guān)于病例的結(jié)果的某些假設或者結(jié)果的較簡單的選擇(如成功/失?。?。任何這些策略的應用應當在設計方案的統(tǒng)計部分描述并證明其正確性,且所用任何數(shù)學模型所基于的假定應當清晰地說明。同樣重要的是顯示相應分析結(jié)果的強壯性,尤其是當討論的策略能導致有偏倚的處理效應的估計時。

由于某些問題的不可預見性,有時將對試驗中所出現(xiàn)的無規(guī)律性情況作出的詳細考慮推遲到試驗結(jié)束對試驗數(shù)據(jù)盲態(tài)檢查后則更好。如果循此做法,需在試驗方案中加以說明。

5.2.2 符合方案集

病例的“符合方案”集,有時稱為“有效病例”、“效驗”樣本或“可評價病例”樣本。它定義了全分析集的一個子集。這些病人對方案更具依從性,并有符合如下準則的特征:

(1)完成某一個預定的處理規(guī)程的最小規(guī)定部分。

(2)測定主要變量的可能性。

(3)沒有任何大的違反方案的地方,包括違反入組標準。

將病人排除在符合方案集之外的理由應當講清楚,并以一種適合這一特定試驗情況的方式,在破盲之前用文件寫明。應用符合方案集可能使新的治療在分析中顯示出附加效果的機會最大化,并且更密切地反應了作為方案的基礎的科學模型。然而,相應的無效假設的檢驗和處理效應的估計依據(jù)試驗不同而可能是保守的或不是保守的;由于虔誠地遵守方案而導致的偏倚,可能是嚴重的,與處理和結(jié)果有關(guān)。

導致排除病例產(chǎn)生符合方案集的問題,以及其他對方案的違反,應當被完全識別出來并加以總結(jié)。有關(guān)的違反方案可能包括處理指定的錯誤、使用了不許用的藥物、依從性不好、失訪和數(shù)據(jù)缺失。評價各處理組間關(guān)于頻度和發(fā)生時間這種問題的模式是良好的做法。

5.2.3 不同分析集的作用

一般說來,顯示選擇不同的病例集進行分析對主要的試驗結(jié)果不敏感是有優(yōu)越性的。在驗證性試驗計劃的同時對全分析集及符合方案集進行分析,一般來說是恰當?shù)?,由此可以對它們之間的任何差異進行清楚的討論和解釋。在有些情況下,最好能計劃選擇不同的分析集進行對結(jié)論的敏感性的探索。當全分析集和符合方案集得出實質(zhì)上是相同的結(jié)論時,則試驗結(jié)果的可信性增加了。然而有一點需注意,從符合方案集中排除較大比例的病例時,則對試驗的總有效性會產(chǎn)生影響。

在優(yōu)效性試驗(為了顯示研究產(chǎn)品的效果更好)和在等效或非優(yōu)效性試驗(為了顯示研究產(chǎn)品具有可比性,見 3.3.2)中,全分析集和符合方案集起著不同的作用。在優(yōu)效性試驗中,全分析集用于主要分析(除了特殊情況),因為它傾向于避免由于符合分析集所致的效果的過于最優(yōu)化估計。這是由于,在全分析集中包括了依從性不良者一般會減少估計的處理效應。然而,在一個等效性或非劣效性試驗中,應用全分析集一般并不保守其作用應當非常仔細地考慮。

5.3 缺失值及離群值

缺失值是臨床試驗中的一個潛在的偏倚來源,因此,必須盡一切努力完成試驗方案中所有有關(guān)搜集資料和數(shù)據(jù)管理的各項要求。然而,事實上任何試驗幾乎不可避免地總有缺失值。

不過,一個試驗倘若處理缺失值的方法是敏感的,尤其那些方法在方案中已預先定義了,可以認為是有效的。在盲法核查時,在統(tǒng)計分析計劃中更新這方面內(nèi)容,可以改進方法的定義。遺憾的是,尚無一個通用的處理缺失值的方法可供推薦。研究者必須注意分析結(jié)果對處理缺失值方法的敏感性,特別當缺失值較多時。

應當用類似的方法探索離群值的影響。統(tǒng)計學上對離群值的定義在某種程度上講是主觀確定的。從醫(yī)學和統(tǒng)計學上共同清晰地判斷某一個特定數(shù)據(jù)是離群值更加可信,而醫(yī)學上的判斷常常確定適當?shù)男袆?。任何在方案中或統(tǒng)計分析計劃中設定的對離群值處理的步驟應當不會對任何一個處理組有偏向。同樣,這方面的分析計劃也常在資料的盲態(tài)核查時進行有用的更新。如果在試驗方案中未預先指定處理離群值的方法,則用實際資料分析所得結(jié)果,以及去除或削弱離群值的影響后的至少一個分析結(jié)果均需給出,并對結(jié)果不一致之處加以討論。

5.4 數(shù)據(jù)的變換

對關(guān)鍵變量是否要進行變換,最好根據(jù)以前的研究中類似資料的性質(zhì),在試驗設計時就作出決定。擬采用的變換(如平方根、對數(shù))及其原理需在試驗方案中說明,特別是對主要變量。變換是為了確保資料滿足統(tǒng)計分析方法所基于的假定,變換方法的選擇原則在一般的教科書上均能找到,一些特定變量的常用變換方法已在某些特定的臨床領(lǐng)域得到成功應用。對一個變量是否采用變換,以及如何變換,常受到臨床解釋方法的影響。導出的變量亦需作同樣考慮,如從基線的改變量,從基線改變的百分數(shù),重復測量“曲線下的面積”或兩個不同變量之比值。后繼的臨床上的解釋需仔細考慮,所選新變量導出方法需在試驗方案說明其正確性。與此密切相關(guān)的一些問題已在2.2.2節(jié)作了討論。

5.5 參數(shù)估計、可信區(qū)間及假設檢驗

試驗方案中的統(tǒng)計部分應當說明要檢驗的假設和/或為了滿足試驗的主要目的而待估計的處理效應。為完成這些任務的主要變量(最好也有次要變量)的統(tǒng)計分析方法,以及所基于的統(tǒng)計模型需闡述清楚;如可能,處理效應的估計需同時有可信區(qū)間,并需說明其計算方法。如想要根據(jù)基線資料以提高估計精度,或?qū)赡艿幕€差異估計值進行校正,如協(xié)方差分析,亦需在試驗方案中寫明。

明確說明所采用的假設檢驗是單側(cè)的還是雙側(cè)的是非常重要的,特別是當要采用單側(cè)檢驗時,需事先說明其是正確的。如果認為假設檢驗不合適,則需給出其他得到統(tǒng)計結(jié)論的方法。關(guān)于統(tǒng)計推斷用單側(cè)還是雙側(cè)是有爭議的,在統(tǒng)計文獻中可見到不同的觀點。通常推薦在設定單側(cè)檢驗的第I類錯誤時可以設為雙側(cè)檢驗中的一半,這就使得與通常適用于估計兩種處理間差異的可能大小的雙側(cè)可信區(qū)間相一致。

所選擇的統(tǒng)計模型應當能反映目前醫(yī)學和統(tǒng)計學關(guān)于所分析的變量以及試驗設計的知識。所有在分析中擬合的效應(例如在方差分析模型中的)應當全面地說明。而且,如果有的話,應當對由于初步結(jié)果而進行了修改的效應集加以說明。對在協(xié)方差分析(見 5.7)中擬合的協(xié)變量集也應作同樣的考慮。在選擇統(tǒng)計方法時,應注意到主要和次要變量的統(tǒng)計分布。在進行選擇時(例如參數(shù)還是非參數(shù)方法),應當記住需要提供處理效應的大小及其可信區(qū)間(除了提供統(tǒng)計意義檢驗之外)。

主要變量的主要分析應當清晰地與主要或次要變量的附加分析區(qū)別開來。在方案的統(tǒng)計部分或者統(tǒng)計分析計劃中,也應當概述除了主要和次要變量之外的數(shù)據(jù)總結(jié)和報告的方法。這應當包括各種試驗,例如安全性數(shù)據(jù)中的分析達到一致性所采用的任何方法的參考文獻。

建立模型方法與已知的藥理學參數(shù)、病人對方案的依從性或其他基于生物學數(shù)據(jù)的了解相結(jié)合可以對實際的或可能的效果,特別是對于處理效應的估計,提供有價值的洞悉。這類模型所基于的假定都應當清晰地加以說明,而任何結(jié)論的局限性也應仔細地描述。

5.6 I 類錯誤及可信水準的調(diào)整

當出現(xiàn)多重性(multiplicity)時,常用的分析臨床試驗資料的頻率的方法需對I類錯誤進行調(diào)整。多重性可以由于以下情況而產(chǎn)生,例如多個主要變量(見2.2.2)、處理的多重比較、不同時期的多次評估和/或期中分析(見4.6)。如果有可能,最好采用避免或減少多重性的方法,如確定一個關(guān)鍵的主要變量(多重變量)、選擇關(guān)鍵的處理對比(多重比較)、運用綜合變量如“曲線下面積(重復測量時)。作了這樣的處理后,在驗證性分析中,如仍有多重性方面的問題,則需在試驗方案中確定;必須考慮調(diào)整,調(diào)整的詳細步驟,以及為何不必調(diào)整均需在分析計劃中說明。

5.7 次級組、交互作用及協(xié)變量

主要變量常系統(tǒng)地與除處理因素以外的其他因素有關(guān),例如,年齡、性別等與協(xié)變量有關(guān),特定的次級組間,如在多中心試驗中,不同中心治療的病人可能有差異。在有些情況下,對協(xié)變量及對次級組效應的校正是分析計劃中不可缺少的一部分,故亦需在試驗方案中陳述。需在試驗前深思熟慮地識別可能對主要變量有重要影響的協(xié)變量和因素,并且應當考慮如何對其進行分析以提高估計的精度,以及補償處理組間不均衡所產(chǎn)生的影響。如果在設計中有一個或多個分層因素,在分析中應當包括這些因素。當一個校正的可能數(shù)值可疑時,建議將未經(jīng)校正的分析結(jié)果作為主要依據(jù),而將校正后的分析結(jié)果作為參考。特別要注意中心的作用及主要變量的基線值的作用。在隨機化分組后測量的協(xié)變量值對主要分析作調(diào)整是不可取的,因為它們可能受處理的影響。

處理效應的大小會因次級組或協(xié)變量的不同而不同,例如,效應可能會隨年齡的增加而減少,或?qū)δ骋活惒∪溯^大。在有些情況下,這種交互作用能預期到或者特別感興趣(如老年等),因此,次級組分析,或包含交互作用的統(tǒng)計模型,都屬驗證性分析計劃的一部分。然而,在大多數(shù)情況下,次級組分析和交互作用分析是探索性的,并且應當清晰地認為是如此的;它們應當探索任何處理在不同情況下得出的效應是一樣的??傊?,這類分析首先應在所研究的統(tǒng)計模型中添加交互作用項,再加上對有關(guān)病人的次級組內(nèi)或由協(xié)變量定義的層內(nèi)的這病例作附加的探索性分析,加以補充。在作探索性分析時,對這種分析的解釋必須十分審慎,任何僅基于次級組所作的探索性分析,任何關(guān)于有效(或無效),或是安全性的結(jié)論,均不宜被接受。

5.8 資料的完整性與計算機軟件的正確性

資料分析的數(shù)值結(jié)果的可信程度,依賴于用于數(shù)據(jù)處理、數(shù)據(jù)輸入、儲存、核實、改錯、檢索和統(tǒng)計學處理中的方法和軟件(內(nèi)部和外部的)的質(zhì)量和正確性。所以,數(shù)據(jù)處理須基于完善的、有效的標準操作程序。用于數(shù)據(jù)管理和統(tǒng)計分析的計算機軟件必須可靠,并提供恰當?shù)能浖z驗過程文件。

6. 安全性與耐受性評價

6.1 評價的范圍

在所有的臨床試驗中,安全性及耐受性(見詞匯)評價是非常重要的一個方面。在試驗早期,這一評價主要是探索性的,且只對毒性明顯的表現(xiàn)敏感,而在后期,由于樣本較大,對于藥物的安全性和耐受性的評價將更為全面。后期的對照試驗,代表了一個重要的以無偏的方式探索任何新的潛在的不良反應的方法,盡管這類試驗在這一方面的把握度較低。

為了說明在安全性與耐受性方面與其他藥物或該藥物的其他劑量的比較的優(yōu)效性或等效性,可設計某些試驗。這種申述需要相應的驗證試驗的支持,這與相應的有效性的申述要求是一樣的。

6.2 變量的選擇與資料搜集

在任何一個臨床試驗中,用于評價一種藥物的安全性和耐受性的方法及度量準則依賴于一些因素,包括與之密切相關(guān)的藥物的不良反應知識、非臨床試驗或早期臨床試驗的信息、該藥物的藥效學及藥代動力學(pharmacodynamic/pharmacokinetic)特性、服藥方式、所研究的病人類型,以及試驗的期間等。實驗室檢驗包括臨床化學和血液學、生命指征(vital signs)及臨床不良反應(疾病、體征和癥狀)的實驗檢查,通常構(gòu)成了安全性與耐受性資料的主體部分。嚴重不良事件的發(fā)生,及因不良事件導致治療終止對于注冊特別重要(見ICH E2A及ICH E3)。

此外,為便于對不同試驗的資料進行合并,建議在整個臨床試驗中,資料的收集及評價所用的方法最好一致。使用一個通用的不良事件的詞典是特別重要的。該詞典從三個不同的級別對不良事件的資料的概括給出可能性,即系統(tǒng)-器官級,推薦名詞或包括名詞(見詞匯)。推薦名詞是通常用于匯總不良事件所用的名詞,然后,在數(shù)據(jù)的描述表達時讓同一系統(tǒng)-器官級的推薦名詞進行合并。

6.3 用于評價的病例集及數(shù)據(jù)的表達

評價總的安全性與耐受性時,用于匯總的病例集常定義為至少接受了一劑被研究藥物。從這些病例中收集的安全性及耐受性變量應盡可能地全面,包括不良反應類型、嚴重程度、發(fā)生及持續(xù)時間(見 ICH E2B)。另外,在特定的次級人群,如女性、老年人(見ICH E7)、危重病人,或接受了輔助藥物治療的人可能需要附加的安全性及耐受性的評價。這些評價需說明更特殊的問題(見ICH E3)。

所有安全性及耐受性變量在評價中均需十分重視,所用的主要分析方法需在研究方案中指明。所有的不良事件均需報告,無論是否被認為與處理有關(guān)。在評價中,研究人群的所有可用資料均需說明。實驗室變量的度量單位及參考值范圍必須認真制訂,如在同一試驗,出現(xiàn)不同的單位及不同的參考值范圍(如多個實驗室參與研究),則需進行恰當?shù)臉藴驶?,以便進行統(tǒng)一評價。毒性等級尺度也必須事先確定,并說明其正確性。

某不良事件的發(fā)生強度通常以出現(xiàn)不良事件的病例數(shù)與暴露病例數(shù)之比來表示。然而,發(fā)生強度并非總是十分清楚的。例如,根據(jù)不同情況,可考慮用暴露病例數(shù)或暴露程度(用人年表示)作為分母。無論是用于估計危險度還是進行處理組間的比較,定義需在試驗方案中寫明,這一點是很重要的。尤其對于時間較長的治療,估計會有較大的退出治療的比例及死亡比例時,對這類情況,需考慮用生存分析,并計算累積不良反應率,以避免低估的危險。

當體征和癥狀存在較大的背景噪音(如精神病的試驗)時,在估計不同不良事件的危險時需考慮對此進行說明的方法。有一種方法是運用“處理后出現(xiàn)的事件”(見詞匯)的概念,只有當不良事件相對于治療前的基線出現(xiàn)惡化時才被記錄。

其他消除背景噪音的方法也可以選用,如忽略程度輕微的不良事件,或在重復隨訪觀察到者方可計入分子。這些方法需在試驗方案中解釋并說明其正確性。

6.4 統(tǒng)計學評價

安全性與耐受性的研究是一個多方面的問題。雖然,某些不良反應通常可被預計到,且對所有藥物都進行監(jiān)測,但不良反應的可能范圍很廣,新的未預計到的不良反應總是有可能發(fā)生的。此外,當違背了試驗方案,如使用了方案中禁用的藥物,出現(xiàn)了不良事件,就可以產(chǎn)生偏倚。這一背景構(gòu)成了藥物安全性和耐受性評價有關(guān)統(tǒng)計上的困難,這意味著由驗證性臨床試驗得到的結(jié)論性信息只是一種例外,而不是通例。

在大多數(shù)試驗中,對安全性與耐受性最好用描述性統(tǒng)計方法對數(shù)據(jù)進行分析,并在有利于說明時輔以可信區(qū)間。對處理組間及病例間的不良事件的模式用圖形式來表達也是有價值的。

計算P 值有時也是很有用的,既有利于評價某一感興趣的差別,又可作為一種'特殊標志'手段應用于大量安全性與耐受性變量,以顯示其差別值得進一步注意。這對實驗室資料特別有用,因為除此以外,很難給予恰當?shù)膮R總。建議實驗室資料既要作定量分析,如估計處理的均數(shù),又要作定性分析,計算高于或低于某一閾值的病例數(shù)。

如用假設檢驗,則在進行多重比較時需進行統(tǒng)計上的修正以控制I類錯誤,但通常更關(guān)注Ⅱ類錯誤的大小。如未對多重比較作修正,則解釋被認為統(tǒng)計學上有意義的結(jié)果時需特別小心。

在大多數(shù)研究中,觀察者希望確定,與陽性對照藥及安慰劑相比,安全性及耐受性未出現(xiàn)臨床上不可接受的差別。對非劣效性或等效性評價,應用可信區(qū)間比用假設檢驗更佳,這樣,因發(fā)生頻數(shù)較低而造成的較大的不精確性可以清晰地表示出來。

6.5 綜合總結(jié)

藥物的安全性與耐受性通常是在藥物的開發(fā)過程中連續(xù)地通過試驗過程總結(jié)出來的,特別是進行上市申請時。然而,總結(jié)的有用性依賴于適當?shù)?、嚴格控制的有高質(zhì)量數(shù)據(jù)的個別試驗。藥物的總的有用性總是一個權(quán)衡利弊的問題,即使對利與弊的評價總是對整個臨床試驗項目進行總結(jié)時才進行 ( 見7.2.2),但在單一試驗中,這一觀點亦應考慮到。有關(guān)安全性與耐受性報告中所需的更詳細的內(nèi)容見  ICH E3 的第12 節(jié)。

7. 研究報告

正如引言中所述,臨床試驗報告的格式與內(nèi)容是ICH E3 的內(nèi)容。ICH 全面地包括了統(tǒng)計工作的報告,亦適當結(jié)合了一些臨床及其他材料。本節(jié)只作簡單討論。

如第5 節(jié)所述,在試驗的設計階段,分析方法的主要特點必須在研究方案中確定。當試驗結(jié)束后,數(shù)據(jù)已收集完整,則可作初步審查,正如第5 節(jié)所描述的,對數(shù)據(jù)按計劃好的分析進行盲法審查是很有價值的。這種對處理保持盲態(tài)的預分析審查應當包括關(guān)于以下一些問題的決定,例如從分析集中剔除個體或數(shù)據(jù);考察可能的變量變換,定義離群值;將其他最新研究中確定的重要協(xié)變量增加到模型中去;重新考慮用參數(shù)方法還是用非參數(shù)方法。此時所作的決定需寫入報告,并與統(tǒng)計學專業(yè)人員在知道處理編碼后所作的決定相區(qū)別,因為在盲態(tài)所作的決定一般引入偏倚的可能性較小。參加非盲期中統(tǒng)計分析的統(tǒng)計學專業(yè)人員或其他人員不應當參加盲法審查或?qū)y(tǒng)計分析計劃的修改。當處理所致的效應在數(shù)據(jù)中顯示出來的可能性威脅到盲法時,盲法審查需要特別小心。許多更詳細的表達和列表方面應當在接近或正當盲法審查時最終完成以便在實際分析時整個計劃的所有各方面已經(jīng)存在,這些方面包括病例的篩選、數(shù)據(jù)的篩選與修正、資料的匯總與列表、參數(shù)估計及假設檢驗。一旦數(shù)據(jù)核查已完成,則應按預定的分析計劃進行分析,越遵循分析計劃,所得結(jié)論的可信度就越大。當實際分析有別于在試驗方案中、修訂方案中及對資料進行盲態(tài)審核時所確定的統(tǒng)計分析計劃時,要特別注意,對于偏離計劃的分析必須給予認真詳細的解釋。

凡進入臨床試驗的病例,不管是否參與統(tǒng)計分析,均需在研究報告中說明。所有排除在分析之外的理由均需寫明,任何一個包含在全分析集但不包含在符合方案集中的病例亦需寫明其排除符合方案集的理由。同樣,所有參與分析集的病例,其所有重要變量的測量值均需說明其測量的時點。

所有病例或數(shù)據(jù)的丟失、退出處理及違背試驗方案等情況對主要變量分析的影響必須認真考慮。病例的失訪、退出治療、或嚴重違背試驗方案必須確認,并對其進行描述性分析,包括退出的理由,以及與處理及結(jié)果的關(guān)系。

描述性分析是研究報告中必不可少的部分。應當用圖或表的形式清晰地表示主要變量、次要變量、主要預后及人口學變量的重要特征。與試驗目的相關(guān)的主要分析的結(jié)果應當是研究報告中特別仔細描述的內(nèi)容。在報告統(tǒng)計學意義檢驗的結(jié)果時,應當報告精確的P 值(如P=0.034),而不是列出唯一的參照臨界值。

盡管臨床試驗分析的主要目的應當是回答總目標中提出的問題,但在非盲態(tài)分析時基于觀察數(shù)據(jù)又會出現(xiàn)一些新的問題,這時就需要用其他的或更復雜的統(tǒng)計分析方法來處理。在研究報告中,這部分的工作必須與方案中計劃分析的內(nèi)容嚴格區(qū)分開來。

由于機遇的作用,可能導致對處理組間基線測定項目的未預見的不均衡項在計劃的分析方案中沒有被預先定義為協(xié)變量,但它對預后具有一定的重要意義。處理這種不平衡的最佳方法是用一種附加的統(tǒng)計分析,說明在考慮這種不平衡因素后可以得出與原計劃的統(tǒng)計分析方案相一致的結(jié)論。如果經(jīng)過如上處理不能得出相一致的結(jié)論,則需對這種不平衡對結(jié)論的影響加以討論。

一般而言,計劃外的分析應盡量少用。如果認為治療效果有可能由于其他某個或某些因素的改變而不同時,常需進行這種分析。這時可能是企圖識別效果特別好的試驗對象的某一亞組。對于計劃外亞組分析結(jié)果過度解釋的潛在危險是眾所周知的(參見 5.7),應設法小心地避免。雖然,當一個處理無效或該處理對亞組試驗對象具有副作用也會出現(xiàn)類似解釋的問題,但我們應對其可能性作出適當評價并加以報告。

最后的統(tǒng)計學判定對臨床試驗結(jié)果的分析、解釋及表達有關(guān)。為此,試驗統(tǒng)計學專業(yè)人員應當是臨床試驗報告負責人員之一,并批準最終報告。

7.2 臨床數(shù)據(jù)庫的總結(jié)

在進行藥品上市申請時,需要所有報告和臨床試驗的有關(guān)安全性和有效性全面小結(jié)和證據(jù)的綜合材料(歐盟的專家報告,美國的整體小結(jié)和日本的概要)。在適當?shù)臅r候需附有統(tǒng)計學的綜合結(jié)果。

在小結(jié)中,應包括如下專門的統(tǒng)計學分析內(nèi)容:參與臨床試驗過程中治療人群的人口學特征和臨床表現(xiàn)的描述;根據(jù)有關(guān)的(一般是有對照的)試驗結(jié)果回答較關(guān)鍵問題,且著重說明其一致和不一致的程度;總結(jié)所有試驗的綜合數(shù)據(jù)庫中所有的安全性信息,其結(jié)果對于上市申請有作用并可驗明可能的安全性問題。在臨床試驗計劃設計時,必須注重變量的定義及測量值收集的一致性,這將有利于隨后的系列試驗結(jié)果的解釋,特別是當幾個試驗進行聯(lián)合時。必須選用一個通用的記錄用藥詳情、病史及不良事件的通用詞典,對主要變量與次要變量采用公認的定義往往是有益的,而且是后繼綜合分析的基礎。測量關(guān)鍵有效性變量的方式、安排對隨機化/進入試驗評價的時間、處理對違反或偏離試驗方案者以及可能對預后因素的定義,都必須保持一致,除非有充分理由不這么做。

任何用于不同試驗間數(shù)據(jù)聯(lián)合的統(tǒng)計方法均需詳細描述,對因試驗的選擇而可能導致的偏倚、對它們結(jié)果的齊性,以及對不同的變異來源建立恰當?shù)哪P投急仨氂枰允肿⒁?。結(jié)論對假定及所作的選擇的敏感性必須進行探索。

7.2.1 有效性資料

每一個臨床試驗的樣本量都必須足夠大,以確保達到預期的目的。通過對本質(zhì)上是說明相同的關(guān)鍵的效應問題的一系列臨床試驗結(jié)果的總結(jié),也可能得到附加的有價值的信息。這一系列試驗的主要結(jié)果應當以統(tǒng)一的格式表達,以便于比較,一般是用表格或圖形的方式表達,主要是估計值和可信區(qū)間。用后繼綜合分析技術(shù)對這些參數(shù)進行綜合就是一個很好的方法,因為該法可為所產(chǎn)生的處理效應的大小提供一個更加精確的總的估計,為試驗結(jié)果提供一個完整而簡潔的總結(jié)。在某些特殊情況下,后繼綜合分析也可能是最合適或唯一的方法,它通過總的假設檢驗提供充分的總的有效證據(jù)。當為此目的應用后繼綜合分析時,應該有其自己寫好的方案。

7.2.2 安全性資料

在總結(jié)安全性數(shù)據(jù)時,要徹底檢查安全性數(shù)據(jù)庫中任何可能的中毒跡象,并且以尋找觀察值的有關(guān)聯(lián)的提供證據(jù)的模式來隨訪任何跡象,這是重要的。將所有服用新藥的人群的安全性資料聯(lián)合起來分析,可提供信息的重要來源,因為大樣本為檢出發(fā)生率較低的不良事件提供機會,也許還可估計出近似發(fā)生率。但因為沒有對照組,很難對由這一數(shù)據(jù)中得到的發(fā)生率進行評價,對照試驗的資料對克服這種困難就顯得特別有價值。用共同對照組(安慰劑或指定的陽性對照)的研究結(jié)果,應當進行綜合,并對每一有足夠數(shù)據(jù)的比較組分別給出研究結(jié)果。

探索資料時發(fā)現(xiàn)的任何潛在的中毒跡象均需報告。對這些潛在的不良反應的真實性的評價需考慮因大量的比較而產(chǎn)生的復雜性問題。在評價時也可適當運用生存分析方法,求得不良事件的發(fā)生率與服藥時間和/或隨訪時間之間的潛在關(guān)系。與已識別的不良反應事件相聯(lián)系的危險性必須適當量化,以便權(quán)衡利弊關(guān)系。

詞匯

貝葉斯方法(Bayesian Appmaches):數(shù)據(jù)分析的方法,由觀察數(shù)據(jù)及參數(shù)的先驗概率分布導出某些參數(shù)(如處理效應)的后驗概率分布。

偏倚(統(tǒng)計的和操作上的)(Bias Statistical & Operational):與設計、執(zhí)行、分析和評價臨床試驗結(jié)果有關(guān)的任何因素的系統(tǒng)傾向使操作效應的估計值偏離其真值。由于執(zhí)行不正確造成的偏倚稱為“操作”偏倚。上面所列出的偏倚的其他原因稱為“統(tǒng)計學的”。

盲態(tài)審核(Blind Review):在試驗完成(最后一例病人的最后一次觀察)與揭盲之間對數(shù)據(jù)進行核對和評價,以便把計劃的分析最后定下來。

含義的有效性(Content Validity):一個變量(如等級量表)度量了其應該度量的大小的程度。

雙模擬(Double-Dummy):在臨床試驗中當兩種處理不能做到一樣時,使應用制品時仍保持盲態(tài)的一種技術(shù),如為處理 A(有效藥和不能區(qū)別的安慰劑)及處理 B(有效藥和不能區(qū)別的安慰劑)制備制品。病人接受兩套處理:或者是A(有效藥)及 B(安慰劑),或者是 A(安慰劑)和B(有效藥)。

脫落(Dropout):臨床試驗中的病人由于任何原因不能繼續(xù)進行試驗到按試驗方案要求他/她的最后一次隨訪。

等效性試驗(Equivalence Trial):一個試驗的主要目的是要顯示兩種或多種處理的反應差別大小在臨床上并無重要性。這通常以顯示真正的處理差異是在臨床上可以接受的等效性的上下界之間。

頻率法(Frequentist Methods):統(tǒng)計方法,如統(tǒng)計意義檢驗和可信區(qū)間,可以用同一試驗情況下假設的重復實現(xiàn)時某一結(jié)果出現(xiàn)的頻率來說明。

全分析集(Full Analysis Set):盡可能接近按意向性治療原則的理想的病例集。由所有隨機化的病人中以最少的和合理的方法排除病例得出。

廣義性(Generalisability, Generalisation):一個臨床試驗的結(jié)果可以被可信地由參加試驗的病人外推到廣大的病人群體和廣大范圍的臨床環(huán)境的程度。

全局評定變量(Global Assessment Variable):單一變量,通常是把客觀變量和研究者對病人的狀況或者狀態(tài)的改變情況結(jié)合起來的順序分類等級尺度。

獨立數(shù)據(jù)監(jiān)視委員會(數(shù)據(jù)和安全監(jiān)視組,監(jiān)視委員會,數(shù)  據(jù)  監(jiān)  視  委  員  會  )( Independent Data Monitoring Committee-IDMC, Data and Safty Monitoring Board, Monitoring Committee, Data Monitoring Committee):一個獨立的數(shù)據(jù)監(jiān)視委員會可以是由申辦者建立的經(jīng)常評定臨床試驗的進度、安全性數(shù)據(jù)以及關(guān)鍵性效果的結(jié)果,并且向申辦者提出建議是否繼續(xù)、修改或停止試驗。

意向性治療原則(Intention To Treat Principle ):一種認為處理策略以想要治療病人 ( 即計劃好的治療進程),而不是基于實際給予的治療為基礎進行評價,可以對效果作出最好的評定原則。其結(jié)果是分到一個處理組的病人即應作為該組的成員被隨訪、評價和分析,而不管他們是否依從計劃的處理過程。

交互作用 ( 定性的和定量的 )(Interaction , Qualitative & Quantitative):一種處理的對比(例如研究產(chǎn)品與對照之間的差異)依賴于另外一個因素(如中心)的情況。定量的交互作用是指對比差異的大小在因素的不同水平時不同,而定性交互作用時對比差異的方向至少在因素的一個水平上不同。

平定者間的可靠性(Inter-Rater Reliability):不同評定者在不同情況下產(chǎn)生相同結(jié)果的性能。

評定者內(nèi)的可靠性(Intre-Rater Reliability):同一評定者在不同情況下產(chǎn)生相同結(jié)果的性能。

期中分析(Interim Analysis) :在正式結(jié)束試驗之前在任何時期為了比較效果或安全性的任何分析。

后期綜合分析(Meta-Analysis):對同一個問題的兩個或更多的試驗的定量證據(jù)進行正式的評價。這常是從各試驗的小結(jié)統(tǒng)計資料進行統(tǒng)計合作,但此名詞有時也用于對原始數(shù)據(jù)的合并。

多中心試驗(Multicentre Trial):按單一試驗方案在多個地點進行的臨床試驗。因而,由多個研究者進行。

非劣效性試驗(Non-Inferiority Trial):主要目的是顯示研究產(chǎn)品的反應在臨床上不劣于比較制劑(陽性或安慰劑對照)的試驗。

推薦和包括名詞(Preferred and Included Terms):在一個分層次的醫(yī)學詞典中,例如 MedDRA,包括名詞是最低級別的詞典名詞,以研究者的描述進行編碼。推薦名詞是對包括名詞進行并組的級別,用于報告發(fā)生頻率。例如,研究者寫的是“左臂疼痛”,包括名詞編碼為“關(guān)節(jié)疼痛”,在推薦名詞級別可報告為“關(guān)節(jié)痛”。

符合方案集(有效病例,有效樣本,可評價病例樣本)(Perprotocol Set, Valid  Cases, Efficacy Sample,Evaluable Subjects Sample):由充分依從于方案以保證這些數(shù)據(jù)會按所基于的科學模型而表現(xiàn)出治療效果的病例子集所產(chǎn)生的數(shù)據(jù)集。依從性包括以下一些考慮,如暴露于處理、可以測定以及沒有對方案大的違反等。

安全性和耐受性(Safety and Tolerability):醫(yī)學產(chǎn)品的安全性涉及到病人的醫(yī)療風險,通常在臨床試驗中由實驗室檢查(包括臨床生化與血液學)、生命體征、臨床不良事件(疾病、體征和癥狀),以及其他專門的安全性檢查(例如心電圖、眼科檢查)等來評定。醫(yī)學產(chǎn)品的耐受性代表了病人能忍受明顯的不良反應的程度。

統(tǒng)計分析計劃(Statistical Analysis Plan):統(tǒng)計分析計劃是包括比方案中描述的主要分析特征更加技術(shù)性和更多詳細細節(jié)的文件,并且包括了對主要和次要變量及其他數(shù)據(jù)進行統(tǒng)計分析的詳細過程。

優(yōu)效性試驗(Superiority Trial):主要目的是顯示研究產(chǎn)品的反應優(yōu)于對比制劑(陽性或安慰劑對照)的試驗。

間接變量(Surrogate variable):在直接測定臨床效果不可能或不實際時,提供效果間接測定的變量。

處理效應(Treatment Effect):在臨床試驗中歸因于處理的效果。在大多數(shù)臨床試驗中感興趣的處理效應是兩個或多個處理的比較(或?qū)Ρ龋?/span>

處理后出現(xiàn)的事件(Treatment Emergent):在治療時出現(xiàn)的,而在治療前沒有的或比治療前狀況更壞的事件。

試驗統(tǒng)計學專業(yè)人員(Trial Statistician):經(jīng)過教育、培訓并且有經(jīng)驗足以貫徹本指導中的原則并且負責試驗的統(tǒng)計方面的統(tǒng)計學專業(yè)人員。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多