歡迎來到醫(yī)科研,這里是白介素2的讀書筆記,跟我一起聊臨床與科研的故事, 生物醫(yī)學(xué)數(shù)據(jù)挖掘,R語言,TCGA、GEO,SEER數(shù)據(jù)挖掘。 SEER數(shù)據(jù)的內(nèi)容完善SEER數(shù)據(jù) 為所有原發(fā)侵襲性癌和其他某些診斷(例如原位癌)收集的數(shù)據(jù)包括診斷日期和人口統(tǒng)計(jì)變量,例如診斷時(shí)的年齡,性別,種族/民族和居住的縣。從健康記錄中提取與第一療程有關(guān)的手術(shù)管理和/或放射治療數(shù)據(jù);
癌癥數(shù)據(jù)每年更新一次,以獲取生存狀態(tài),生存時(shí)間和死亡原因等信息。SEER最初的7個(gè)癌癥登記中心的隨訪時(shí)間現(xiàn)已超過40年。生存狀態(tài)通過與 National Death Index 鏈接以及通過醫(yī)療記錄摘要獲得的最近一次已知聯(lián)系的日期的補(bǔ)充數(shù)據(jù)來確認(rèn)。SEER被認(rèn)為是美國和全球癌癥注冊(cè)機(jī)構(gòu)中數(shù)據(jù)質(zhì)量的黃金標(biāo)準(zhǔn)。通過與地區(qū)注冊(cè)機(jī)構(gòu)的合同協(xié)議來保證質(zhì)量,并且在傳輸數(shù)據(jù)之前必須滿足SEER的標(biāo)準(zhǔn) SEER數(shù)據(jù)的開放SEER允許不受限制地訪問SEER網(wǎng)站www.seer.cancer.gov,SEER數(shù)據(jù)的復(fù)制和獲取無需經(jīng)過許可。癌癥統(tǒng)計(jì)資料審查(Cancer Statistic Review)”選項(xiàng)以易于理解的文字,圖表和圖形提供所有癌癥和特定部位癌癥的摘要信息。除了癌癥數(shù)據(jù)集外,SEER中的其他數(shù)據(jù)集還有SEER地區(qū)的標(biāo)準(zhǔn)人口數(shù)據(jù),美國死亡率數(shù)據(jù)以及與人口普查區(qū)域社會(huì)經(jīng)濟(jì)狀況索引或縣屬性相關(guān)聯(lián)的美國人口數(shù)據(jù)。這些數(shù)據(jù)可用于與SEER癌癥數(shù)據(jù)進(jìn)行匹配分析。除此以外 SEER數(shù)據(jù)還與其它數(shù)據(jù)庫鏈接以支持更深層次的研究挖掘。包括:Medicare, Medicare Health Outcomes Survey (SEER-MHOS), National Longitudinal Mortality Study (NLMS), 以及鏈接的生物樣本。 劃重點(diǎn):SEER提供專門用于提取分析數(shù)據(jù)的軟件:包括SEER * Stat,SEER PREP,JointPoint,Health Disparities Calculator。只需要填寫申請(qǐng)表格申請(qǐng)下即可免費(fèi)使用所有數(shù)據(jù)庫和軟件,附上表格的鏈接(www.seer.cancer.gov/data/access_seer_data.pdf)。 SEER生物樣本試點(diǎn)計(jì)劃SEER非常重視病理材料的可用性,以進(jìn)行免疫組織化學(xué)(IHC)檢測和二代代測序等分析。RTR和最新提出的VTR是近期的試點(diǎn)計(jì)劃,旨在擴(kuò)大各種癌癥病例的病理學(xué)材料的“生物儲(chǔ)備”,并將組織鏈接(注釋)到完整的SEER數(shù)據(jù)集9。RTR維護(hù)來自3個(gè)癌癥登記機(jī)構(gòu)(愛荷華州,夏威夷和洛杉磯)的組織,并且由福爾馬林固定石蠟包埋的組織塊在所有特定部位的癌癥上組成。到2010年已檢測的癌組織數(shù)量達(dá)到141,241,最大的四個(gè)癌癥組是肺癌,結(jié)腸癌/直腸癌,乳腺癌和前列腺癌。研究人員可以通過提交在線申請(qǐng)(www.seer.cancer.gov/biospecimen/application.html)并提供擬進(jìn)行的研究的簡要摘要,來訪問基于人群的資料,也可以使用某些癌癥的組織微陣列數(shù)據(jù),例如乳腺癌,卵巢癌和結(jié)腸/直腸癌。 VTR是一個(gè)試點(diǎn)項(xiàng)目,涉及7個(gè)SEER注冊(cè)管理機(jī)構(gòu)。最初的試點(diǎn)旨在提供有關(guān)成本和最佳實(shí)踐的信息,以將該過程擴(kuò)展到更大的SEER注冊(cè)中心。它將專門探討存活至少5年的胰腺導(dǎo)管腺癌患者和在短時(shí)間內(nèi)死于癌癥的局部淋巴結(jié)陰性女性乳腺癌患者。病例將與具有更典型生存模式的對(duì)照相匹配,并將基于邏輯回歸模型中確定的腫瘤和人口統(tǒng)計(jì)學(xué)特征。最初的試點(diǎn)項(xiàng)目將定義基于人群的生物樣本采集的最佳實(shí)踐。將收集定制的注釋信息,包括合并癥,詳細(xì)的化療,復(fù)發(fā)時(shí)間和結(jié)果。實(shí)驗(yàn)室調(diào)查將收集有關(guān)組織位置,檢索成本以及將不明身份的數(shù)據(jù)提供給研究人員的要求的信息。試點(diǎn)項(xiàng)目還將探索獲取材料的最佳實(shí)踐,以及與數(shù)字圖像和病理學(xué)檢查的聯(lián)系。目標(biāo)是擴(kuò)大未來的VTR,以支持當(dāng)前廣泛的癌癥研究問題。 |
|