生信文章分享！多组学数据、多重网络、PageRank

今天跟大家分享一篇去年发表在Computers in Biology and Medicine期刊上的文章，题目为Network-based prioritization of cancer genes by integrative ranks from multi-omics data

摘要：

作者提出一种整合的基于等级(rank-based)的方法(iRank)，通过一个统一的网络框架整合多组学数据来对癌症基因进行优先级排序。应用于TCGA的HCC数据集上。iRank的核心是基于带有约束的改进PageRank算法。

数据：

出于概念验证(proof-of-concept，是对某些想法的一个较短而不完整的实现，以证明其可行性，示范其原理，其目的是为了验证一些概念或理论)的考虑，作者优先考虑从KEGG和Malacards汇编的HCC癌基因，共有33个基因与HCC的发生和发展有因果关系。HCC多组学数据从TCGA下载。在匹配一致的样本信息后，最终选择了37个具有对照和肿瘤的样本。

iRank使用数据类型有RNA-Seq，DNA methylation，somatic mutation, miRNA-seq和copy number variant

作者使用多重网络(multiplex network)来组织相应的多组学数据。在跨级交互组(cross-level interactome)中，作者选择基因调控网络(GRN)作为核心层。作者从RegNetwork下载整合的人类GRN，并从miRTarbase下载了miRNA调控相互作用。另外使用STRING, Bind, BioGrid, HPRD, IntAct和MINT数据库构建了蛋白质相互作用网络(PPI)。

iRank框架：

iRank框架示意图

iRank框架，主要包含6步。(a)(b)下载HCC数据，并从各种数据库中构建了多层级的综合生物分子网络。(c)根据正常癌症样本的差异互信息(DMI)衡量边的权重，将网络与多组学数据进行整合。(d)作者在加权多重网络基础上提出了约束PageRank算法(CPR），在每个网络中，节点的PR值通过CPR实现。(e)(f)整合多个网络的等级后，获得每个节点的最终排名。图中R()代表节点在相应层级的排名，α，β，γ是相应权重。

(c)多重网络与多组学数据整合

通过计算一条边上两个节点X和Y之间的互信息，对多重网络边进行加权(weighing)，从而将分子数据映射到整合的多重网络上。定义多重网络每个边的差异互信息(DMI)为随后DMI通过min-max方法进行标准化，使用标准化后的DMI来权衡边以获得加权多重网络。

现以ORIrd为例说明(ORIrd代表所用数据为GRN+RNA-Seq+DNA甲基化)：

在RNA-Seq数据中找到7391和1843两个基因的37个正常样本数据，37个癌症样本数据。计算差异互信息(权重)。

在DNA甲基化和RNA-Seq数据中找到5934号基因的37个正常样本数据，37个癌症样本数据。计算差异互信息(权重)。

(d)在加权多重网络上实施约束PageRank算法(CPR)

在去除权重为0的边后，加权网络是一种特定内容网络(content-specific network)，然后通过CPR算法的PR值获得节点排序。

仍以ORIrd为例说明：

1)基因调控网络(RegNetwork)层面的转移矩阵构建

针对weighted_gene_regulation_network，统计source gene，target gene，再取并集得到基因总数NR。构造转移矩阵(稀疏)：首先构造三个全零的NR×NR的稀疏矩阵R, RW, RCS。如果两基因之间有调控关系，R和RCS对应元素为1，RW对应元素对DMI。然后对R每一列求和，如果某列和为n(不为零)，则R中该列元素除以n。加权转移矩阵为RTW=R.*RW。

2)DNA到RegNetwork的转移矩阵构建

针对DNA_to_RNA_regulation，统计基因交集个数D。构造转移矩阵(稀疏)：首先构造三个全零的NR×D的稀疏矩阵DR, DWR, DRCS。如果甲基化基因与网络基因之间有调控关系，DR和DRCS对应元素为1，DWR对应元素对DMI。然后对DR每一列求和，如果某列和为n(不为零)，则DR中该列元素除以n。加权转移矩阵为DRTW=DR.*DWR*(λ/2)。

最终得到(NR+D)长度的PR值。对于33个HCC癌基因，找到每个基因对应的PR值以及在所有基因中的排名。

PageRank算法以前就是Google的网页排序算法。PageRank算法，对每个目标网页进行附上权值，权值大的就靠前显示，权值小的就靠后显示。PageRank算法就是给每个网页附加权值。PageRank算法借鉴学术界论文重要性的评估方法：谁被引用的次数多，谁就越重要。

PageRank算法的核心思想

(1)如果一个网页被很多其他网页链接到的话,说明这个网页比较重要，也就是PageRank值会相对较高。

(2)如果一个PageRank值很高的网页链接到一个其他的网页，那么被链接到的网页的PageRank值会相应地因此而提高。

一个网页的PR值，概率上理解就是此网页被访问的概率，PR值越高其排名越高。

结果：

给出了将网络和组学数据结合在一起的不同策略的等级箱型图。ORI代表在原始GRN中获得的等级排名，意味着仅考虑GRN的网络拓扑。ORIr代表通过RNA-Seq数据加权后的GRN基因排名。

还通过添加多级信息(即DNA甲基化(d)，体细胞突变(s)和miRNA(m))在多层网络中依次运行iRank。

作者发现，当在优先次序中整合更多分子水平的组学数据时，癌症基因往往会获得更高的排名。并且拥有更小的平均值和标准差。

你可能想看：

think，thinkof，thinkabout，thinkover的区别和用法？

think、think of、think about、think over的区别为指代不同、用法不同、侧重点不同，意思用法如下：

getCurrentUser（）。role在DaftMonk / generator-angular-fullstack中未定义

$scope.user.email,password:$scope.user.password;" + Auth.getCurrentUser().role);User.get();会触发一个异步HT...

think of think about与think over的区别？

think of, think about,think over,think for的区别为：含义不同、用法不同、介词不同。Helen，are you thinking of marrying Tom...

我手机桌面有微信文件怎么删除红米手机怎样找到保存到桌面的微信文件

文章目录：红米手机如何找到桌面上保存的微信文件微信上的文件下载到桌面上怎么看不到为什么用手机编辑的文件被发送到电脑上显示…在齐捷微信中添加到桌面是什么意思，微信消息为什么显示在桌面上的红米手机如何找到...

点击加关注，有更多关于收藏的视频和文章分享！

我是师傅很闲（持续更新文章、视频分享钱币收藏投资价值）也可免费鉴定现代纪念币、纪念钞，很高兴回答您的问题。我是师傅很闲（持续更新文章、视频分享钱币收藏投资价值）也可免费鉴定现代纪念币、纪念钞，很高兴回...

软文推广助手每日推荐有关秋天的文章分享

凉爽的风，深邃的天空，在秋天平静的气息的触摸下静静地到达。在这个收获期，让我们一起走在黄金大道上，感受秋天的独特魅力。秋天是自然的调色板，壮观的绘画。枫叶、橘子、黄色和深红交织着美丽的风景，仿佛地球正...

曝光（pùguāng）？曝光（bàoguāng）？周杰在《非常静距离》中

刚刚看了"非常静距离"中李静访谈周杰，这个节目似乎有意给周杰一个回应是非传闻的机会，当然媒体有误解的地方解释清楚也是应该，我们并不知道演艺界的真实面目，姑妄听之。究竟应读什么音呢，不知道周杰翻的是什么...

曝光（pùguāng）？曝光（bàoguāng）？看访谈周杰-“非常静距离

阳阳有氧运动健身操直播间阳阳[yáng yáng]什么意思?近义词和反义词是什么?英文翻译是什么...

阳阳[y hm2 ng y hm2 ng][阳阳]基本上是解释1。色彩鲜艳。2。形容温暖如春天。3.健壮的身姿。4.得到自己的脸。阳光与“扬”相通。5.就像自己的样子。阳光与“扬”相通。[阳阳]详细说...

数据管理，数据治理，数据中心，数据中台，数据湖都是什么意思，有什么关系呢？

数据湖一般是公有云服务商提出得一个概念，即企业得结构化，非结构化数据都可以全部采集和存储到我这里来。在存过来后，数据湖再提供一些标准得开放接口给你使用数据，这些接口包括了查询SQL类接口，计算引擎接口...

计生信息是指什么计生信息是指什么

文章目录：什么是计生信息是指什么样的计生信息是指确认跨省计生信息到村委会登记计生信息需要什么资料计生信息是指计划生育信息主要是个人计划生育信息，计生信息主要是：个人身份信息、婚育信息；包括节育(结扎或...

为何复仇者联盟的英文是“avengers”而不是“revengers”？

在回答这个问题之前，我们先了解一下复仇者联盟这部电影吧，影片讲述了尼克·弗瑞为了搞定《雷神》中被流放的洛基，四处寻找王者知音，将钢铁侠、美国队长、雷神托尔、绿巨人、黑寡妇和鹰眼这六位超牛的人物聚集在了...

《Hierarchical Text-Conditional Image Generation with CLIP Latents》阅读笔记

模型真的学习到了文本图像特征，基于CLIP的分层文本条件图像生成——使用CLIP训练好的特征，生成类似于CLIP的图像特征：可以实时利用文本信息引导模型生成、编辑各种图像，然后得到输出的文本特征和图像...

《dreadhunger》进不去怎么办dreadhunger进不去怎么办

但是，由于游戏没有提供国内玩家专用的服务器，玩家由于无法连接游戏服务器而往往无法进入游戏，Dread Hunger不能进入的概率是玩家无法连接到服务器造成的；玩家的网络质量不支持与游戏服务器的稳定连接...

PHP communication management system wamp running custom development mysql database html webpage computer software engineering

Modify and delete picturesMessage board：admin Database configuration file data.php2.The development ...

[Kogel.Subscribe.Mssql]SQL Server incremental subscription, database change monitoring

您可以下载安装到Nuget：[Display(Rename=“t_oms_order_detail”)]，[Identity]；[Display(Rename=“trade_id)]；[Nest.Pr...

通过文章分页和网站内链提升网站PV值的思路解析

一个网站得以长久持续的发展不仅仅需要高流量，同时PV值也占据着重要的作用，作为衡量一个网站整体价值的重要依据之一，如果流量很稳定，PV越高，用户体验好了，你的网站就更有可能获得大的收益。那么，针对一些...

DTY网络丝、重网丝、轻网丝区别？

网络DTY丝是DTY丝经网络喷嘴在压缩空气的作用下加工而成 ,它在改进DTY丝的极光效应和蜡状 (树脂 )感方面有较好的效果 ,并给DTY丝带来某些独特风格。根据目前市场情况 ,按网络度和网络牢度的不...

概念数据模型和逻辑数据模型什么是数据模型?数据模型的三要素是什么

数据模型(Data Model)是真实世界数据特征的抽象，或者真实世界的数据模拟。在数据库中，用数据模型抽象地表示现实世界的数据和信息。数据模型的三要素是数据结构、数据操作以及完整性约束条件。文章列表...

look over, get over , go over 分别是什么意思

她无法克服她的羞怯心理。She seemed to get over the death of her husband in no time。她好像很快就从失去丈夫的哀伤中恢复过来。He never ...

标签: 大数据

分享给朋友：

问答百科

生信文章分享！多组学数据、多重网络、PageRank

Copyright © 2024 问答百科网 All Rights Reserved.
蜀ICP备11000655号-9