日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

Gephi網(wǎng)絡(luò)圖極簡教程 生信老司機帶你一文搞定蛋白互作網(wǎng)絡(luò)

 創(chuàng)客小組 2019-03-10
Gephi網(wǎng)絡(luò)圖極簡教程
HelloWorld
網(wǎng)絡(luò)分析背景知識

1.圖是一種數(shù)據(jù)結(jié)構(gòu)

 

圖結(jié)構(gòu):是研究數(shù)據(jù)元素之間的多對多的關(guān)系。在這種結(jié)構(gòu)中,任意兩個元素之間可能存在關(guān)系。即結(jié)點之間的關(guān)系可以是任意的,圖中任意元素之間都可能相關(guān)。

  sci666  

基于圖論(Graph theory)的網(wǎng)絡(luò)科學(xué)認為,任何非連續(xù)事物之間的關(guān)系都可以用網(wǎng)絡(luò)來表示,通過將互聯(lián)網(wǎng)內(nèi)的電腦、社會關(guān)系中的個人、生物的基因等不同屬性的實體抽象為節(jié)點(Node),并用連接(Link)來展示實體之間的關(guān)系,通過量化以節(jié)點和連接為組件的網(wǎng)絡(luò)結(jié)構(gòu)指數(shù)(Index),從而能夠在統(tǒng)一的框架下尋找復(fù)雜系統(tǒng)的共性。

 

網(wǎng)絡(luò)關(guān)系圖(network analysis)是一款比較火的分析,最近頻繁出現(xiàn)在微生物生態(tài)研究的各大論文里。其實單純看網(wǎng)絡(luò)關(guān)系的話,只是一種數(shù)據(jù)分析的手段,很早就應(yīng)用在其他領(lǐng)域。然而到了2006年,Proulx等科學(xué)家在TRENDS ECOL EVOL(IF=16.74)發(fā)文,提出網(wǎng)絡(luò)關(guān)系也可以作為一種分析手段應(yīng)用在生態(tài)領(lǐng)域(Proulx et al. 2006)。到了2012年,Barberán等科學(xué)家在ISME發(fā)文,通過構(gòu)建土壤中微生物的網(wǎng)絡(luò)關(guān)系來研究其共生模式(Barberán et al. 2012)。

 

目前生態(tài)學(xué)領(lǐng)域大家用到的網(wǎng)絡(luò)圖多為基于群落數(shù)據(jù)相關(guān)性構(gòu)建的Co-occurrence網(wǎng)絡(luò)圖。此類網(wǎng)絡(luò)可以采用R中igraph包、Python 中的Networkx構(gòu)建并實現(xiàn)出圖。當然,除此之外,還有一些非命令行的軟件,例如cytoscape,gephi,pajek,graphviz(dot),Ucinet等。

 

其中 Gephi 是開源免費跨平臺基于JVM的復(fù)雜網(wǎng)絡(luò)分析軟件, 其主要用于各種網(wǎng)絡(luò)和復(fù)雜系統(tǒng),因它簡單、易學(xué)、出圖美觀而備受青睞。當你打開網(wǎng)絡(luò)圖的大門,第一個映入眼簾的可能就是它,適合入門,被譽為Networker的初戀[扯]。

 

2.圖相關(guān)的概念和術(shù)語

  • 節(jié)點與邊
  • 無向圖和有向圖
  • Co-occurrence網(wǎng)絡(luò)圖與 相關(guān)性網(wǎng)絡(luò)圖 (兩個矩陣的相關(guān)性)
  • 權(quán):圖中的邊或弧上有附加的數(shù)量信息,這種可反映邊或弧的某種特征的數(shù)據(jù)成為權(quán)。
  • 網(wǎng):圖上的邊或弧帶權(quán)則稱為網(wǎng)??煞譃橛邢蚓W(wǎng)和無向網(wǎng)。
  • 度:在無向圖中,與頂點v關(guān)聯(lián)的邊的條數(shù)成為頂點v的度。有向圖中,則以頂點v為弧尾的弧的條數(shù)成為頂點v的出度,以頂點v為弧頭的弧的條數(shù)成為頂點v的入度,而頂點v的度=出度+入度。圖中各點度數(shù)之和是邊(或弧)的條數(shù)的2倍。

     

3.圖的度量

 

  • 節(jié)點數(shù)(Nodes): 節(jié)點的個數(shù)。
  • 邊數(shù)(Edges):邊或連接的個數(shù)。
  • 平均度(Average degree): 表示每個節(jié)點連接邊的平均數(shù),如果絡(luò)圖是無向圖,平均度的計算為 2*edges/nodes。
  • 平均路徑長度(Average network distance): 任意兩個節(jié)點之間的距離的平均值。 反映網(wǎng)絡(luò)中各個節(jié)點間的分離程度。 值越小代表網(wǎng)絡(luò)中節(jié)點的連接度越大。
  • 模塊化指數(shù)(Modularity index): 衡量了網(wǎng)絡(luò)圖結(jié)構(gòu)的模塊化程度。一般>0.44 就說明該網(wǎng)絡(luò)圖達到了一定的模塊化程度 。
  • 聚類系數(shù)(Clustering coefficient): 和平均路徑長度一起,能夠展示所謂的‘小世界’效應(yīng),從而給出一些節(jié)點聚類或抱團的總體跡象。網(wǎng)絡(luò)的小世界特性指網(wǎng)絡(luò)節(jié)點的平均路徑小。
  • 網(wǎng)絡(luò)直徑(Diameter): 網(wǎng)絡(luò)圖直徑最大測量長度,即任意兩點都有 1 個最短距離,這些最短距離之中的最大值即為該網(wǎng)絡(luò)圖直徑。
Gephi 實現(xiàn)網(wǎng)絡(luò)圖繪制

1.Gephi 安裝

 下文Gephi官網(wǎng)安裝(我略,你不能略)

2.數(shù)據(jù)處理

以CSV格式文件為例:

  • 邊文件((edge):前兩列為節(jié)點ID,另一列為相關(guān)系數(shù)。
  • 節(jié)點文件(node):一列節(jié)點ID,一列節(jié)點類型

     

Gephi網(wǎng)絡(luò)圖極簡教程

邊文件

Gephi網(wǎng)絡(luò)圖極簡教程

節(jié)點文件

3.導(dǎo)入數(shù)據(jù)

當然你要打開Gephi?!疚募俊敬蜷_】選擇文件,在點擊下一步的同時注意一下每個參數(shù)的含義是不是你要表達的意思。分別導(dǎo)入節(jié)點文件與邊文件。

Gephi網(wǎng)絡(luò)圖極簡教程
導(dǎo)入數(shù)據(jù)

 

輸入第二個文件時 注意:

 

Gephi網(wǎng)絡(luò)圖極簡教程
導(dǎo)入數(shù)據(jù)

4.設(shè)置布局樣式

Gephi提供多種布局方式,一般圓形網(wǎng)絡(luò)圖選擇”Fruchterman Reingold”布局格式。點擊【運行】,等布局穩(wěn)定后,點擊 【停止】,生成圓形布局的網(wǎng)絡(luò)圖。

Gephi網(wǎng)絡(luò)圖極簡教程
布局調(diào)整

5.網(wǎng)絡(luò)拓撲參數(shù)計算

點擊【窗口-統(tǒng)計】面板,分別點擊 【運行】-【關(guān)閉】當然你也可以選擇打印、復(fù)制,保存,最終你還是要選擇關(guān)閉。進行以下6個拓撲參數(shù)的計算:平均度、網(wǎng)絡(luò)直徑、圖密度、模塊化、平均聚類系數(shù)、平均路徑長度。

注:對于無向網(wǎng)絡(luò)圖,平均度和平均加權(quán)度 數(shù)值相同。再次注意:可能會卡。

Gephi網(wǎng)絡(luò)圖極簡教程
拓撲參數(shù)計算

6.節(jié)點設(shè)定

點擊【窗口】-【外觀】-【節(jié)點】-大小-數(shù)值設(shè)定,選擇渲染方式為 ,設(shè)置節(jié)點大小的 最大尺寸和最小尺寸(此處分別為20和70),點擊 應(yīng)用。顏色設(shè)置也在外觀節(jié)點中,設(shè)置渲染方式為Modularity Class注意紅色方框里內(nèi)容,從左到右依次為:顏色、大小,標簽顏色、標簽尺寸。

Gephi網(wǎng)絡(luò)圖極簡教程
節(jié)點設(shè)置

7.邊設(shè)定

在【外觀】中選擇【邊】Partition 渲染方式選擇pn即我們數(shù)據(jù)中相關(guān)性標簽;Ranking選擇【度】。如下:

Gephi網(wǎng)絡(luò)圖極簡教程
邊設(shè)置

8.預(yù)覽修飾

點擊預(yù)覽,修改如下圖紅色方框選項,在 預(yù)覽設(shè)置 面板對網(wǎng)絡(luò)圖進行輸出前的最后修飾。

  • 邊框?qū)挾龋涸O(shè)為0.0,不顯示節(jié)點邊框。
  • 顯示標簽:打勾,顯示節(jié)點標簽。
  • 字體:此處修改為 Times New Roman 23號 加粗
  • 縮短標簽:打勾,不然標簽會過長導(dǎo)致相互覆蓋。
  • 厚度:根據(jù)顯示需要修改邊線厚度,此處改為5。
  • 重新調(diào)整權(quán)重:打勾,根據(jù)邊線權(quán)重顯示不同厚度。

另外的選項可根據(jù)需要自行調(diào)整。在之前的設(shè)置中也可以通過預(yù)覽來查看效果,一步一步調(diào)整。

Gephi網(wǎng)絡(luò)圖極簡教程
效果圖

9.圖像導(dǎo)出

Gephi 支持多種格式的輸出:SVG、PNG、PDF、gexf圖文件等。

Gephi網(wǎng)絡(luò)圖極簡教程

導(dǎo)出格式

 


  1. 節(jié)點:相同顏色是同一個門;節(jié)點大小表示連接度;
  2. 邊:紅色正相關(guān),藍色負相關(guān)(spearman),粗細表示相關(guān)系數(shù)絕對值大??;

 

導(dǎo)出的矢量圖可用AI等圖形編輯軟件進一步修改,圖形文件也可以用腳本來處理,圖個性化地添加圖例等。圖文件也是一種標簽語言。

 

讓大家見識一下,開頭HelloWorld的代碼:

 

<?xml version=”1.0″ encoding=”UTF-8″?><gexf xmlns=”http://www./1.3″ version=”1.3″ xmlns:viz=”http://www./1.3/viz” xmlns:xsi=”http://www./2001/XMLSchema-instance” xsi:schemaLocation=”http://www./1.3 http://www./1.3/gexf.xsd”>
<meta lastmodifieddate=”2018-05-30″>
<creator>Gephi 0.9</creator>
<description></description>
</meta>
<graph defaultedgetype=”directed” mode=”static”>
<nodes>
<node id=”0″ label=”Hello”>
<viz:size value=”10.0″></viz:size>
<viz:position x=”-157.09903″ y=”-64.66471″></viz:position>
<viz:color r=”251″ g=”9″ b=”9″></viz:color>
</node>
<node id=”1″ label=”World”>
<viz:size value=”10.0″></viz:size>
<viz:position x=”157.09904″ y=”64.66471″></viz:position>
<viz:color r=”10″ g=”194″ b=”245″></viz:color>
</node>
</nodes>
<edges>
<edge id=”0″ source=”0″ target=”1″>
<viz:color r=”0″ g=”109″ b=”44″></viz:color>
</edge>
</edges>
</graph></gexf>

 

GEXF (Graph Exchange XML Format) 是一種描述復(fù)雜網(wǎng)絡(luò)的語言,包括復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu),數(shù)據(jù)等等。最初是由Gephi項目2007年確立。生成gexf需要用到布局算法, 常見的有 Force-directed_graph_drawing 力導(dǎo)向算法, 算法的核心思想是節(jié)點之間產(chǎn)生斥力,邊給兩個節(jié)點提供拉力,通過多次迭代最后維持一個穩(wěn)定狀態(tài),手動實現(xiàn)布局算法還是有一些復(fù)雜度的,好在gephi-tookit組件提供了API來處理數(shù)據(jù), 首先在maven項目中加入gephi的倉庫和依賴。

一個花的例子:How Programmers Relate based on Google Searches

Gephi網(wǎng)絡(luò)圖極簡教程
How Programmers Relate
難點在哪?
  1. 現(xiàn)有的數(shù)據(jù)到Gephi需要的數(shù)據(jù)格式。
  2. 布局與配色
  3. Gephi 沒有生成圖例

參考:

gephi 中文教程|視頻
gephi 官網(wǎng)
Co-occurrence網(wǎng)絡(luò)圖在R中的實現(xiàn)
從《你的名字》學(xué)做“網(wǎng)絡(luò)關(guān)系圖”——Gephi篇
R||Network
Python · Networkx
GEXF File Format
模塊度Q——復(fù)雜網(wǎng)絡(luò)社區(qū)劃分評價標準
如何將枯燥的大數(shù)據(jù)呈現(xiàn)為可視化的圖和動畫?
學(xué)習(xí)新技術(shù)時你應(yīng)當掌握的『最少必要知識』
Revelle, W. & Revelle, M. W. Package ‘psych’. The Comprehensive R Archive Network (2015).
Bastian, M., Heymann, S. & Jacomy, M. Gephi: an open source software for exploring andmanipulating networks. Icwsm 8, 361-362 (2009).
Newman, M. E. Modularity and community structure in networks. Proceedings of the national academy of sciences 103, 8577-8582 (2006).
Barberan, A., Bates, S. T., Casamayor, E. O. & Fierer, N. Using network analysis to explore cooccurrence patterns in soil microbial communities. The ISME journal 6, 343-351,doi:10.1038/ismej.2011.119 (2012)

 

作者:周運來,一個讀序列天書的公子哥,穩(wěn)健,瀟灑,大方,靠譜。大型測序工廠的螺絲釘,統(tǒng)計草原上的游牧者。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多