gtex数据库打不开(GTEX数据库)

gtex数据库打不开(GTEX数据库)

扫码添加渲大师小管家,免费领取渲染插件、素材、模型、教程合集大礼包!

我们在进行数据库介绍。尤其是肿瘤相关数据库的时候。经常会提到说这个使用了 TCGA/GTEx 数据库的数据。那么这两个数据库到底是什么呢?为什么会有用这两个数据库呢?另外呢。由于最近ICGC提的也比较多。所以这里也就做一下简单的介绍。

需要明确的是。这几个数据库属于原始数据储存数据库。我们在这里得到的都是相对原始的数据库。需要具备一定的数据分析能力。

TCGA

TCGA, 全称为The Cancer Genome Atlas(癌症基因组图谱)。通过其名称我们就知道这个数据库主要做的就是肿瘤相关的数据库。为什么经常看到别人用这个数据库呢?还是因为这个数据库收集的信息全呀。

gtex数据库打不开(GTEX数据库)

首先。对于研究病种而言。这个数据库包括了33个种肿瘤的数据。具体包括的癌种可以看后面的链接。

其次。数据库检测的数据类型多。对于同一个癌种。我们可以获得这个癌种的: 表达数据、miRNA表达数据、甲基化数据、突变数据和拷贝数数据。如果我们使用GEO数据库检索某一个癌种。同样也可以得到这些相关的数据。但是TCGA数据库珍贵的地方是。这个数据都是出自同一个人的。这样的话。我们就可以研究不同组学之间的交叉反应了。比如突变对于表达的影响、甲基化和表达的关系等等。。。

gtex数据库打不开(GTEX数据库)

另外。TCGA除了包括了不同测序的数据。同时对于每一个纳入的患者还包括了其临床的信息。更难能可贵的是。临床信息当中还包括了预后随访的信息。这个我们就可以来分析以上的测序数据集和临床信息之间的关系了。比如分析基因表达和预后的关系等等。。。

gtex数据库打不开(GTEX数据库)

PS: 其实GEO有的数据集也有临床信息以及预后信息。但是这个得需要我们慢慢的去寻找了。

ICGC

ICGC (https://dcc.icgc.org/), 全称International Cancer Genome Consortium(国际癌症基因组联盟)。这个数据库和TCGA的关系。就是ICGC数据库包括了TCGA的数据。另外呢。ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话。我们可以得到更多的数据。

ICGC是一个储存原始数据的地方。我们只需要检索相对应的关键词就可以得到具体的信息了。我们可以检索疾病、基因名称或者突变信息都可以。例如我们检索 gastric cancer。我们就可以得到这个联盟纳入的数据集。

我们点击进去就可以看到每个数据集详细的信息。按照下图所示。我们点开的这个就只有突变的数据。

GTEx

GTEx。全称Genotype-Tissue Expression。这个数据库和TCGA和ICGC不同的是。TCGA和ICGC更多的还是肿瘤相关的数据。而GTEx收集的是正常人身上的组织来进行的测序。所以GTEx数据库包括的就只是正常人的数据。

这个数据集的用处呢。一方面是可以研究正常人不同组织之间的基因表达的区别。另外的一个呢。就是和TCGA联合使用。由于TCGA重点收集的还是癌症组织的数据。对于其正常的数据收集的相对来说较少。由于正常样本少所以对于差异表达的结果可能就不是很准确。这个时候如果我们把GTEx的数据纳入进来。这样分析的结果就会准确一些了。

以上就是三个数据库内容的基本介绍。如果想要想在相关的数据的话。各个数据库都提供了自己的下载方式。另外。很多别的机构也都提供了这个数据的下载链接。这个还是很推荐使用UCSC XENA这里汇总和目前常用的很多公共数据库的原始数据。甚至包括今年刚发表的PCAWG的数据。

分享到 :
相关推荐

小型企业用云服务器有哪些优势

小型企业用云服务器的优势有:1。不需要安装和更新软件。电子邮件服务器或文件服务器。使...

怎么区别香港服务器和VPS主机(怎么区别香港服务器和vps主机)

区别香港服务器和VPS主机的方法:1。香港VPS主机运用虚拟技术将香港服务器划分为若...

虚拟主机和服务器的差异在哪里(虚拟主机和服务器的差异在哪里查)

网络服务器和虚拟主机的差别?传统式虚拟主机也就是说共享资源网络服务器。是很多个客户另...

企业建网站,做好这几点为自己选合适的服务器(企业建网站,做好这几点为自己选合适的服务器)

服务器是网络时代的根基。服务器的优劣也是决策了一家互联网企业的发展趋势。非常是独立主...

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注