立即注册
登录
搜索
前端开发
后端开发
虚幻引擎
U3D引擎
体感研发
数据库
论坛
BBS
本版
帖子
用户
麒麟软控
»
论坛
›
麒麟软控
›
数据库
›
从geo数据库下载数据的几种方法
返回列表
发新帖
从geo数据库下载数据的几种方法
拜天雨
拜天雨
当前离线
积分
19
5
主题
10
帖子
19
积分
新手上路
新手上路, 积分 19, 距离下一级还需 31 积分
新手上路, 积分 19, 距离下一级还需 31 积分
积分
19
发消息
发表于 2023-1-8 12:57:22
|
显示全部楼层
对于从事生物医学及生物信息学的人员来说,GEO(Gene Expression Omnibus database)数据库的重要性大家一定不陌生了吧,GEO数据库收集了大量表达谱、甲基化、LncRNA、miRNA、拷贝数变异(CNV)等各种芯片数据,并且还存储了一些二代数据和其他高通量测序数据。
今天小云将带大家学习如和从GEO数据库下载你所需要的数据,让GEO数据库成为你科研路上重要的助力。
GEO数据库所包含的信息:
GEO Platform (GPL) 芯片平台
GEO Sample (GSM) 样本ID号
GEO Series (GSE) study的ID号
GEO Dataset (GDS) 数据集的ID号
文献中会提到所用数据集
数据下载
方法一:
打开GEO官网:
Home - GEO - NCBI (nih.gov)
输入GSE编号,点击Search
下拉,选择Series Matrix File(s)
下载matrix文件 ,可以下载到本地,也可以通过文件传输的方式在服务器进行传输wget https://ftp.ncbi.nlm.nih.gov/geo/series/GSE102nnn/GSE102031/matrix/GSE102031_series_matrix.txt.gz(42M)
如果想要下载原始数据,可以点击Download下面的下载链接进行下载,
还可以通过直接查找SRA编号—Send to—File—Runinfo下载csv表格,打开后有一个下载链接可以直接下载
下载完成后您可能有些疑问,我们会得到一个.sra结尾的数据,SRA是压缩文件,我们只要使用fastq-dump进行解压就能得到原始文件。
也可以打开网址:Index of / (nih.go11111v):
选择geo—seris—要选的系列—GSE编号:
方法二:
通过加装GEOquery包,使用GEOquery包可以得到对应GEO的表达矩阵,注释信息,样本信息等。
options()$repos #翻墙
options("repos" c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))#选择镜像
options()$BioC_mirror
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
library(GEOquery)
gset <- getGEO(&#39;GSE102031&#39;, ##GSE编号
destdir=&#34;.&#34;,
AnnotGPL = T, ## 注释文件
getGPL = T) ## 平台文件
上一篇:
2023区块链比特币/以太坊最新网赚赚钱方式教程教学
下一篇:
首次发布!医药数据库产品数据能力大公开
回复
举报
使用道具
分享
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
快速回复
返回顶部
返回列表