服務(wù)熱線(xiàn)
020-86438890
當我們資源不足時(shí),自然會(huì )想要找一些省錢(qián)的辦法來(lái)發(fā)文章,窮則思變嘛。生信是個(gè)好辦法,
可是有些醫生朋友還是覺(jué)得不太熟悉,別說(shuō)后邊的分析方法了,就連開(kāi)始找數據都不好找。
研究腫瘤的比較有福,腫瘤的數據zui豐富了,像大名鼎鼎的 TCGA、Ocomine 等??裳芯科?/span>
他疾病的怎么辦,有沒(méi)有疾病特異性數據庫呢?
資源上哪找
隨著(zhù)研究成果的積累,大大小小的數據庫們就冒了出來(lái),駐扎在互聯(lián)網(wǎng)的各個(gè)角落,現在已
1218經(jīng)有了上千個(gè)。
找數據比較權wei的資源集中站,是牛津大學(xué)出版社的 Nucleic Acids Research(NAR)雜志。從
1994 年開(kāi)始,NAR 每年都要出版分子生物學(xué)數據庫特輯(database issue),收錄新增的數據
庫、盤(pán)點(diǎn)舊數據庫的更新?tīng)顩r、移除失效鏈接等,做個(gè)總結。目前版是第 24 版,即 2017
版。
而所有收錄的數據庫可以在 NAR 的網(wǎng)站上找到,下面是一個(gè)按字母排序的列表
不過(guò)找起來(lái)更方便的可能是按功能分類(lèi)查找:
NAR 把數據庫分為 15 個(gè)類(lèi)別(有些數據庫會(huì )同時(shí)被分到好幾個(gè)類(lèi)別):
1219有些分類(lèi)下邊還有子類(lèi)別,可以跟據自己的目的逐級點(diǎn)開(kāi),找到相應的資源。比如想找個(gè)特
定的疾病,就點(diǎn)開(kāi) Human Genes and Diseases,下邊還有 4 個(gè)子分類(lèi),其中癌癥基因數據庫
是單*個(gè)子類(lèi)(Cancer gene databases),其他的疾病可以點(diǎn)開(kāi) Gene-, system- or disease
specific databases,就可看到具體數據庫列表。
1220這當然只是一部分啦~
圖中可看到注意力缺陷多動(dòng)障礙(ADHDgene),自身免疫性淋巴細胞增生綜合征(ALPSbase),
阿茲海默?。?/span>AlzGene)等等。
點(diǎn)進(jìn)去會(huì )有數據庫的描述說(shuō)明,或詳或略。并附有數據庫網(wǎng)站鏈接,點(diǎn)進(jìn)去就是了。
注意數據庫的質(zhì)量
數據庫這么多,也有大小之分,當然不是隨便一個(gè)數據庫拿來(lái)就用,用了就能得到非常牢靠
的研究成果。
一個(gè)成功的數據庫背后,要有良好的管理維護工作。大數據庫為什么著(zhù)名、好用,是因為有
一個(gè)大集團在運營(yíng)。比較著(zhù)名的機構有美國國家生物技術(shù)信息中心(NCBI)、歐洲分子生物
學(xué)實(shí)驗室-歐洲生物信息學(xué)研究所(EMBL-EBI)、瑞士生物信息學(xué)研究所(SIB)、日本國立遺
傳學(xué)研究所(NIG)、華大基因(BGI)等。
而一些小團隊為自己特定的研究領(lǐng)域創(chuàng )建的數據庫,質(zhì)量就參差不齊了,上邊提到的疾病特
異性數據庫大多屬于此類(lèi)。
1221雖然小團隊不容易跟大佬競爭,而且有時(shí)候同一個(gè)領(lǐng)域會(huì )有好幾個(gè)相似的數據庫,NAR 也不
介意都收錄,只要它們符合一定質(zhì)量條件,且還在運營(yíng)、維護、為研究者提供服。因為 NAR
鼓勵良性競爭,讓那些數據庫經(jīng)歷時(shí)間的考驗證明自己。像研究 G 蛋白耦聯(lián)受體的 GPCRdb
和研究碳水化合物活性酶的 CAZy 就是小團隊的成功范例。
對于用戶(hù)來(lái)說(shuō),采用一個(gè)數據庫做研究之前要多留心,要了解好它的數據來(lái)源和運營(yíng)維護情
況,是否有及時(shí)回應用戶(hù)的反饋,是否有版本控制;還要多檢索文獻,看看這個(gè)數據庫的使
用情況,大家利用它做出了哪些成果,反饋如何等等。必要時(shí)可多找幾個(gè)相關(guān)的數據庫互相
佐證。
掃一掃 微信咨詢(xún)
© 2024 廣州市超博科技有限公司 版權所有 備案號:粵ICP備19162636號
技術(shù)支持:化工儀器網(wǎng) 管理登陸 GoogleSitemap