提到樣本量計(jì)算,應(yīng)該是臨床研究者比較頭疼的一件事情。因?yàn)闃颖玖康挠?jì)算需要提供一些參數(shù),我們都知道樣本量是由公式算來,公式里當(dāng)然有各種參數(shù),如果沒有參數(shù)再完美的公式也沒法運(yùn)算。在這些參數(shù)里,除了需要常規(guī)的Ⅰ類錯(cuò)誤(通常ɑ=0.05)和Ⅱ類錯(cuò)誤(通常β=0.1或0.2)外,還需要該研究終點(diǎn)觀察指標(biāo)的參數(shù),比如某手術(shù)方式術(shù)后并發(fā)癥的發(fā)生率。 這時(shí)候往往會(huì)有人說,我的研究有很多終點(diǎn)觀察指標(biāo)怎么辦(如術(shù)中出血、手術(shù)時(shí)間和術(shù)后并發(fā)癥等)?那么就需要挑出一些重要的指標(biāo)來計(jì)算了。如果好幾個(gè)指標(biāo)都很重要,這時(shí)候需要逐個(gè)計(jì)算,然后取最大的樣本量來開展研究。既然能滿足最大樣本量需要的終點(diǎn)觀察指標(biāo),其他指標(biāo)應(yīng)該也都能滿足了。 經(jīng)常有研究者說,我的課題還沒做呢,我怎么知道不同術(shù)式后的并發(fā)癥的發(fā)生率啊?這樣就需要參考別人的文獻(xiàn)了。但也有的情況時(shí),在各大數(shù)據(jù)庫里根本就沒有這些文獻(xiàn),這時(shí)候研究者就只能自己去做預(yù)實(shí)驗(yàn)獲得這些指標(biāo)了。 言歸正傳,首先說說樣本量的計(jì)算軟件吧。常用的計(jì)算軟件有SAS、Stata、SPSS、PASS、G*Power、StatXact和各種R包等等。其中除SPSS Sample Power、PASS和StatXact外,其他都是免費(fèi)的。其次是兩個(gè)率比較時(shí)需要考慮的因素:1、采用漸進(jìn)還是精確的檢驗(yàn),2、是否合并兩組率及派生合并方法,3、是否采用連續(xù)性校正,4、是否進(jìn)行反正弦轉(zhuǎn)換。 下面我們就來看一下不同選擇時(shí)的樣本量計(jì)算公式(精確檢驗(yàn)沒有固定的樣本量計(jì)算公式,反正弦轉(zhuǎn)換也不作討論),假設(shè)對照組的率為p0,試驗(yàn)組的率p1,q0=1-p0,q1=1-p1,兩組樣本比例為1:1,總樣本量為n。 1、合并兩組率的計(jì)算公式為: 2、不合并兩組率的計(jì)算公式為: 3、派生合并兩組率的計(jì)算公式: 4、連續(xù)性校正的計(jì)算公式: 說了那么多的樣本量計(jì)算公式,那么它們計(jì)算的結(jié)果之間有沒有差別呢?我們一起來看一篇文獻(xiàn)的計(jì)算結(jié)果。如下圖: 上圖的“% increase from small to largest”=(最大的樣本量-最小的樣本量)/最小的樣本量*100,以上結(jié)果我們可以看出:1、不同算法所得樣本量不同,樣本量較小時(shí)不同算法間的差異越大;2、固定一個(gè)率時(shí),兩個(gè)率差越大,所需樣本量越小;3、固定兩個(gè)率的差值時(shí),兩個(gè)率越大(在小于0.5的情況下)所需樣本量越多;4、盡管不同算法的樣本量不同,但是所得樣本量之間的絕對差值近似。 上面的結(jié)果提示我們在進(jìn)行兩個(gè)率比較的樣本量計(jì)算時(shí),選擇不同的條件產(chǎn)生的計(jì)算結(jié)果是不同的。在研究計(jì)劃或標(biāo)書的書寫時(shí),最好是能夠?qū)懨魉x用的計(jì)算假設(shè)、計(jì)算參數(shù)、計(jì)算公式和采用的計(jì)算軟件;在研究結(jié)果的統(tǒng)計(jì)分析時(shí),也需要遵照樣本量計(jì)算時(shí)假設(shè)進(jìn)行分析(如是否進(jìn)行精確檢驗(yàn)或連續(xù)性校正等等)。近日國外的一項(xiàng)研究顯示,在未發(fā)表的RCT研究方案中僅有30%(134/446)的研究提供了樣本量計(jì)算的足夠細(xì)節(jié),其樣本量計(jì)算過程可以重現(xiàn)。不知在咱們的方案中樣本量計(jì)算過程是否也可以重現(xiàn)呢? 另外,在計(jì)算樣本量時(shí)也需要謹(jǐn)慎選擇在線的樣本量計(jì)算網(wǎng)頁或網(wǎng)上下載的R程序包,因?yàn)樗鼈兊暮笈_(tái)往往是個(gè)黑箱子。 |
|