基因本体论(GO)分析中的一系列基因(带有ENTREZID)

我很新的 GO 分析,我有点困惑如何做到这一点我的基因列表。

我很新的 GO 分析,我有点困惑如何做到这一点我的基因列表。

我有一个基因列表(n = 10):

gene_list
    SYMBOL ENTREZID                              GENENAME
1    AFAP1    60312   actin filament associated protein 1
2  ANAPC11    51529 anaphase promoting complex subunit 11
3   ANAPC5    51433  anaphase promoting complex subunit 5
4     ATL2    64225                     atlastin GTPase 2
5    AURKA     6790                       aurora kinase A
6    CCNB2     9133                             cyclin B2
7    CCND2      894                             cyclin D2
8    CDCA2   157313      cell division cycle associated 2
9    CDCA7    83879      cell division cycle associated 7
10  CDCA7L    55536 cell division cycle associated 7-like

和我只是想找到他们的功能,我被建议使用 GO 分析工具。我不确定这是否是一个正确的方法。这里是我的解决方案:

x & lt;-org.hs.egGO

# Get the entrez gene identifiers that are mapped to a GO ID
    xx<- as.list(x[gene_list$ENTREZID])

所以,我有一个带有 EntrezID 的列表,它被分配给每个基因的几个 GO 术语。例如:

> xx$`60312`
$`GO:0009966`
$`GO:0009966`$GOID
[1] "GO:0009966"
$`GO:0009966`$Evidence
[1] "IEA"
$`GO:0009966`$Ontology
[1] "BP"
$`GO:0051493`
$`GO:0051493`$GOID
[1] "GO:0051493"
$`GO:0051493`$Evidence
[1] "IEA"
$`GO:0051493`$Ontology
[1] "BP"

我的问题是:如何以更简单的方式找到每个基因的功能,我也想知道我是否做对了?因为我想将函数添加到 gene_list 作为函数 / GO 列。

提前感谢,

4

编辑:有一个新的Bioinformatics SE(当前处于 beta 模式)。

我希望我得到你在这里的目标。

顺便说一句,对于生物信息学相关主题,您还可以查看biostar,它们与 SO 具有相同的目的,但用于生物信息学

如果你只想有一个与基因相关的每个函数的列表,你可以通过biomaRtbioconductor 包来查询数据库,比如ENSEMBl,这是一个用于查询 biomart 数据库的 API。

Bioconductor 提出了用于生物信息学研究的软件包,这些软件包通常带有良好的小插曲,可让您完成分析的不同步骤(甚至突出显示您应该如何设计数据或哪些是一些陷阱)。

在您的情况下,直接从biomaRt vignette-特别是任务 2:

注意:有一个稍微快一点的方法,我在报告:

# load the library
library("biomaRt")
# I prefer ensembl so that the one I will query, but you can
# query other bases, try out: listMarts() 
ensembl=useMart("ensembl")
# as it seems that you are looking for human genes:
ensembl = useDataset("hsapiens_gene_ensembl",mart=ensembl)
# if you want other model organisms have a look at:
#listDatasets(ensembl)

您需要创建查询(您的 ENTREZ ID 列表)。要查看可以查询的过滤器:

filters = listFilters(ensembl)

然后要检索属性:您的 GO 编号和描述。要查看可用属性的列表

attributes = listAttributes(ensembl)

对你来说,查询看起来像:

goids = getBM(
        #you want entrezgene so you know which is what, the GO ID and
        # name_1006 is actually the identifier of 'Go term name'
        attributes=c('entrezgene','go_id', 'name_1006'), 
        filters='entrezgene', 
        values=gene_list$ENTREZID, 
        mart=ensembl)

查询本身可能需要一段时间。

然后,您可以随时将信息折叠成两列(但我不建议将其用于报告目的)。

Go.collapsed<-Reduce(rbind,lapply(gene_list$ENTREZID,function(x)
                           tempo<-goids[goids$entrezgene==x,]
                           return(
                                   data.frame('ENTREZGENE'= x,
                                  'Go.ID'= paste(tempo$go_id,collapse=' ; '),
                                  'GO.term'=paste(tempo$name_1006,collapse=' ; '))
)

如果要查询以前版本的 ensembl 数据库:

ens82<-useMart(host='sep2015.archive.ensembl.org',
               biomart='ENSEMBL_MART_ENSEMBL',
               dataset='hsapiens_gene_ensembl')

然后查询将是:

goids = getBM(attributes=c('entrezgene','go_id', 'name_1006'),  
        filters='entrezgene',values=gene_list$ENTREZID, 
        mart=ens82)

本站系公益性非盈利分享网址,本文来自用户投稿,不代表码文网立场,如若转载,请注明出处

(569)
功能性镜片(lens function)
上一篇
(Excel)如果单元格大于<条件>则减去<数字>
下一篇

相关推荐

  • 基因本体论(GO)分析中的一系列基因(带有ENTREZID)

    我很新的 GO 分析,我有点困惑如何做到这一点我的基因列表。…

    2022-11-11 15:20:05
    0 53 69
  • java entry用法:如何使用Java Entry来管理和更新数据

    Java Entry用法是指Java中Map接口的一个实现,它表示一个键值对,其中键和值都可以是任何对象(包括null)。Entry接口提供了getKey()和getValue()方法来获取键和值,以及setValue()方法来更新值。…

    2023-07-04 07:55:46
    0 20 98
  • 程序开发设计与编程:测试驱动开发与配对编程(test driven development by example)

    关于程序开发设计与编程的问题,在test driven development by example中经常遇到,我在一个团队中,我试图说服我的队友采用 TDD(因为我已经看到它在我以前的团队中工作,并且设置是相似的)。另外,我个人的信念是,至少在开始时,如果 TDD 和 Pair Programming 一起完成,它确实会有所帮助。这样,两个没有经验的(在 TDD 中)开发人员可以互相帮助,讨论编写什么样的测试并取得良好的进展。…

    2022-12-21 15:42:10
    0 37 80
  • Ps5序列号:注册WMIEvent在PS5中工作 但不是PS7

    关于Ps5序列号的问题,在ps7 release date中经常遇到,以下脚本适用于 PS5_ISE & amp;CMD。…

    2022-12-24 01:20:23
    0 26 80
  • 堕落帝国觉醒代码:与帝国单位合作(what is imperial measurement)

    关于堕落帝国觉醒代码的问题,在what is imperial measurement中经常遇到,我正在玩弄一个应用程序,粗略地说,这是建筑行业的另一种建模器应用程序。将来,我希望用户可以同时使用 SI 单位和英制。根据我的理解,在美国建筑行业中,通常在指定测量值时会使用英寸的分数,例如输入 3 1 / 2“-而在 SI 中,我们将编写 3.5,而不是 3 1 / 2。我正在寻找一种方法来使用这些不同的系统进行分析。…

    2022-12-17 04:00:44
    0 92 24
  • fgo服务器:如何利用FGO服务器获得更好的游戏体验

    FGO服务器是一种用于运行FGO(Fate/Grand Order)游戏的服务器。它主要负责处理与游戏相关的数据,包括游戏内容、游戏状态、游戏角色信息等。…

    2023-05-17 11:03:33
    0 47 55
  • go服务器框架快速构建高性能Web应用

    Go服务器框架是一种基于Go语言的Web服务器框架,它可以帮助开发者快速搭建一个高性能的Web应用程序。Go服务器框架使用Go语言的标准库中的net/http包来处理HTTP请求,并且提供了一些常用的功能,如路由、中间件、模板引擎等,从而让开发者更加方便地构建Web应用程序。…

    2023-06-06 03:45:49
    0 77 59
  • goms模型实例:如何利用GOMS模型提高工作效率

    GOMS模型实例是一个用于模拟人类行为的模型,它可以帮助我们理解人类行为,并帮助我们改进工作流程。GOMS模型的基本原理是把人的行为分解成一系列的原子操作,然后根据不同的条件来模拟不同的行为。…

    2024-03-26 14:24:52
    0 53 86

发表评论

登录 后才能评论

评论列表(53条)