GEO数据库的介绍及使用

GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据,目前已经发表的论文中涉及到的基因表达检测的数据可以通过这个数据库中找到,并且免费提供下载,对科研人来说真是非常友好的存在。


首先,怎么进入这个数据库并进行检索呢?


这是它的网址:https://www.ncbi.nlm.nih.gov/geo/


也可以直接搜索GEO进入官方网站,进入之后界面如下,右边就是检索框,输入关键词就可以进行搜索公开收录的高通量测序信息。

图片


搜索关键词后会出现GEO Datasets 和GEO profiles 两种可供选择。


这两者的区别在于前者是整个试验所有样本的测序数据集合,后者是某一个样本的测序结果,可以根据自己的需要进行选择。

图片


选择进入相关页面后的显示大致分为三部分

检索限定条件、检索结果检索记录信息


关于检索限定条件主要是以下几种:

图片


检索结果的内容

图片


检索记录的信息

图片


点进需要的测序结果会显示以下信息:

图片
图片


在获得我们需要的测序结果之后,我们就要开始进行相关差异表达基因的分析以获取我们想要研究的靶点。


一种方法是通过下载相关文件进行分析,另一种就是可以进行在线分析。


在这里简单介绍一下在线分析,


通过点击Analyze with GEO2R进入以下界面:

图片


通过Define groups设计分组后点击Analyze进行分析,然后就可以得到一些高大上的图以及差异基因列表。

图片
图片


一般可以得到Genesymbol ,即基因的名字然后进行相关的检索。


如果没有则可以通过选定select column中的gene assignment显示的第二个即为Genesymbol。

图片

下载后在Excel中通过分列就可以获取单独的Genesymbol,即最终的差异基因列表。



通过下载GEO公共数据库的测序结果可以进行分析差异基因以及后续的一些分析用于生信相关文章或者是课题设计


总而言之是一个宝藏数据库


在这里只是做了个简单介绍


希望大家能够挖到自己需要的宝贝

早日成为科研大佬!


24小时服务热线
132-9904-0289
联系邮箱 ikeyanda@163.com
联系地址
西省咸阳市秦都区秦创原科创大厦2503室
联系QQ
473159619