diff --git a/2021/09/11/bioinfo_synteny_WGDI/index.html b/2021/09/11/bioinfo_synteny_WGDI/index.html
index e442a6273c..199badbffb 100644
--- a/2021/09/11/bioinfo_synteny_WGDI/index.html
+++ b/2021/09/11/bioinfo_synteny_WGDI/index.html
@@ -32,8 +32,8 @@
 <meta property="article:modified_time" content="2023-03-13T02:36:55.555Z">
 <meta property="article:author" content="南方枝叶">
 <meta property="article:tag" content="biosoft">
-<meta property="article:tag" content="Ks">
 <meta property="article:tag" content="WGD">
+<meta property="article:tag" content="Ks">
 <meta property="article:tag" content="synteny">
 <meta property="article:tag" content="colinearity">
 <meta property="article:tag" content="WGDI">
@@ -666,8 +666,8 @@ <h1 id="4-references"><a href="#4-references" class="headerlink" title="4. refer
       <footer class="post-footer">
           <div class="post-tags">
               <a href="/tags/biosoft/" rel="tag"># biosoft</a>
-              <a href="/tags/Ks/" rel="tag"># Ks</a>
               <a href="/tags/WGD/" rel="tag"># WGD</a>
+              <a href="/tags/Ks/" rel="tag"># Ks</a>
               <a href="/tags/synteny/" rel="tag"># synteny</a>
               <a href="/tags/colinearity/" rel="tag"># colinearity</a>
               <a href="/tags/WGDI/" rel="tag"># WGDI</a>
diff --git a/2021/10/29/bioinfo_align_pep2cds/index.html b/2021/10/29/bioinfo_align_pep2cds/index.html
index 9306cd2a54..c8a4b8f2e3 100644
--- a/2021/10/29/bioinfo_align_pep2cds/index.html
+++ b/2021/10/29/bioinfo_align_pep2cds/index.html
@@ -33,8 +33,8 @@
 <meta property="article:author" content="南方枝叶">
 <meta property="article:tag" content="biosoft">
 <meta property="article:tag" content="tutorial">
-<meta property="article:tag" content="ParaAT">
 <meta property="article:tag" content="sequence alignment">
+<meta property="article:tag" content="ParaAT">
 <meta property="article:tag" content="protein">
 <meta property="article:tag" content="CDS">
 <meta property="article:tag" content="PAL2NAL">
@@ -418,8 +418,8 @@ <h1 id="3-references"><a href="#3-references" class="headerlink" title="3. refer
           <div class="post-tags">
               <a href="/tags/biosoft/" rel="tag"># biosoft</a>
               <a href="/tags/tutorial/" rel="tag"># tutorial</a>
-              <a href="/tags/ParaAT/" rel="tag"># ParaAT</a>
               <a href="/tags/sequence-alignment/" rel="tag"># sequence alignment</a>
+              <a href="/tags/ParaAT/" rel="tag"># ParaAT</a>
               <a href="/tags/protein/" rel="tag"># protein</a>
               <a href="/tags/CDS/" rel="tag"># CDS</a>
               <a href="/tags/PAL2NAL/" rel="tag"># PAL2NAL</a>
diff --git a/2021/11/27/bioinfo_synteny_MCScanX/index.html b/2021/11/27/bioinfo_synteny_MCScanX/index.html
index 3ee593aa41..b39d3d0da7 100644
--- a/2021/11/27/bioinfo_synteny_MCScanX/index.html
+++ b/2021/11/27/bioinfo_synteny_MCScanX/index.html
@@ -33,10 +33,10 @@
 <meta property="article:author" content="南方枝叶">
 <meta property="article:tag" content="biosoft">
 <meta property="article:tag" content="ggplot2">
+<meta property="article:tag" content="WGD">
 <meta property="article:tag" content="Ks">
 <meta property="article:tag" content="ParaAT">
 <meta property="article:tag" content="KaKs_Calculator">
-<meta property="article:tag" content="WGD">
 <meta property="article:tag" content="divergence time">
 <meta property="article:tag" content="paml">
 <meta property="article:tag" content="synteny">
@@ -591,10 +591,10 @@ <h1 id="4-references"><a href="#4-references" class="headerlink" title="4. refer
           <div class="post-tags">
               <a href="/tags/biosoft/" rel="tag"># biosoft</a>
               <a href="/tags/ggplot2/" rel="tag"># ggplot2</a>
+              <a href="/tags/WGD/" rel="tag"># WGD</a>
               <a href="/tags/Ks/" rel="tag"># Ks</a>
               <a href="/tags/ParaAT/" rel="tag"># ParaAT</a>
               <a href="/tags/KaKs-Calculator/" rel="tag"># KaKs_Calculator</a>
-              <a href="/tags/WGD/" rel="tag"># WGD</a>
               <a href="/tags/divergence-time/" rel="tag"># divergence time</a>
               <a href="/tags/paml/" rel="tag"># paml</a>
               <a href="/tags/synteny/" rel="tag"># synteny</a>
diff --git a/2022/03/22/omics_genome_submit/index.html b/2022/03/22/omics_genome_submit/index.html
index 61129aab82..1e1b625c45 100644
--- a/2022/03/22/omics_genome_submit/index.html
+++ b/2022/03/22/omics_genome_submit/index.html
@@ -534,7 +534,7 @@ <h5 id="4-2-3-3-1-sample-stats-x2F-sample-val文件中报错ERROR"><a href="#4-2
 </li>
 <li><strong>SEQ_FEAT.TransLen</strong><ul>
 <li>表示蛋白质长度与预测的蛋白质长度不匹配，运行错误</li>
-<li>建议重跑table2asn，报错持续存在就写邮件把sample.sqn和运行的命令行发给NCBI(<a href="mailto:&#x67;&#101;&#x6e;&#111;&#x6d;&#x65;&#115;&#64;&#110;&#99;&#x62;&#105;&#x2e;&#110;&#x6c;&#109;&#46;&#110;&#x69;&#104;&#x2e;&#103;&#111;&#118;">&#x67;&#101;&#x6e;&#111;&#x6d;&#x65;&#115;&#64;&#110;&#99;&#x62;&#105;&#x2e;&#110;&#x6c;&#109;&#46;&#110;&#x69;&#104;&#x2e;&#103;&#111;&#118;</a>)让帮忙修改这个错误。</li>
+<li>建议重跑table2asn，报错持续存在就写邮件把sample.sqn和运行的命令行发给NCBI(<a href="mailto:&#x67;&#101;&#110;&#111;&#109;&#x65;&#115;&#x40;&#x6e;&#x63;&#98;&#105;&#46;&#110;&#108;&#x6d;&#46;&#110;&#105;&#x68;&#x2e;&#103;&#x6f;&#118;">&#x67;&#101;&#110;&#111;&#109;&#x65;&#115;&#x40;&#x6e;&#x63;&#98;&#105;&#46;&#110;&#108;&#x6d;&#46;&#110;&#105;&#x68;&#x2e;&#103;&#x6f;&#118;</a>)让帮忙修改这个错误。</li>
 </ul>
 </li>
 <li><strong>SEQ_FEAT.BadInternalCharacter</strong><ul>
diff --git a/2022/06/16/bioinfo_fileformat_gb2tbl/index.html b/2022/06/16/bioinfo_fileformat_gb2tbl/index.html
index 35ed6d1b2f..0446492597 100644
--- a/2022/06/16/bioinfo_fileformat_gb2tbl/index.html
+++ b/2022/06/16/bioinfo_fileformat_gb2tbl/index.html
@@ -31,8 +31,8 @@
 <meta property="article:published_time" content="2022-06-15T16:00:00.000Z">
 <meta property="article:modified_time" content="2023-03-13T03:32:49.475Z">
 <meta property="article:author" content="南方枝叶">
-<meta property="article:tag" content="GenBank">
 <meta property="article:tag" content="tbl">
+<meta property="article:tag" content="GenBank">
 <meta property="article:tag" content="organellar genome">
 <meta property="article:tag" content="genome annotation">
 <meta property="article:tag" content="genome submit">
@@ -470,8 +470,8 @@ <h1 id="4-reference"><a href="#4-reference" class="headerlink" title="4. referen
 
       <footer class="post-footer">
           <div class="post-tags">
-              <a href="/tags/GenBank/" rel="tag"># GenBank</a>
               <a href="/tags/tbl/" rel="tag"># tbl</a>
+              <a href="/tags/GenBank/" rel="tag"># GenBank</a>
               <a href="/tags/organellar-genome/" rel="tag"># organellar genome</a>
               <a href="/tags/genome-annotation/" rel="tag"># genome annotation</a>
               <a href="/tags/genome-submit/" rel="tag"># genome submit</a>
diff --git a/2022/06/30/bioinfo_fileformat_mitogenomics/index.html b/2022/06/30/bioinfo_fileformat_mitogenomics/index.html
index e2d5066670..8504e8ee41 100644
--- a/2022/06/30/bioinfo_fileformat_mitogenomics/index.html
+++ b/2022/06/30/bioinfo_fileformat_mitogenomics/index.html
@@ -33,11 +33,11 @@
 <meta property="article:author" content="南方枝叶">
 <meta property="article:tag" content="mitogenome">
 <meta property="article:tag" content="organelle">
-<meta property="article:tag" content="tbl">
 <meta property="article:tag" content="mitogenomics">
 <meta property="article:tag" content="aln2tbl.py">
 <meta property="article:tag" content="aln2tbl-legacy.py">
 <meta property="article:tag" content="mitos2fasta.py">
+<meta property="article:tag" content="tbl">
 <meta name="twitter:card" content="summary">
 <meta name="twitter:image" content="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true">
 
@@ -407,11 +407,11 @@ <h1 id="references"><a href="#references" class="headerlink" title="references">
           <div class="post-tags">
               <a href="/tags/mitogenome/" rel="tag"># mitogenome</a>
               <a href="/tags/organelle/" rel="tag"># organelle</a>
-              <a href="/tags/tbl/" rel="tag"># tbl</a>
               <a href="/tags/mitogenomics/" rel="tag"># mitogenomics</a>
               <a href="/tags/aln2tbl-py/" rel="tag"># aln2tbl.py</a>
               <a href="/tags/aln2tbl-legacy-py/" rel="tag"># aln2tbl-legacy.py</a>
               <a href="/tags/mitos2fasta-py/" rel="tag"># mitos2fasta.py</a>
+              <a href="/tags/tbl/" rel="tag"># tbl</a>
           </div>
 
         
diff --git a/about/index.html b/about/index.html
index 05d66a4f19..a21e7e5e37 100644
--- a/about/index.html
+++ b/about/index.html
@@ -245,7 +245,7 @@ <h1 class="post-title" itemprop="name headline">关于生信技工
 <li>教育经历：目前(中山大学在读博士，植物基因组学)，硕士(四川大学，植物生态学)，本科(西南大学，食品科学)。</li>
 <li>微信公众号：生信技工</li>
 <li>个人网站：<a target="_blank" rel="noopener" href="https://yanzhongsino.github.io/">https://yanzhongsino.github.io/</a></li>
-<li>邮箱​：<a href="mailto:&#121;&#x61;&#x6e;&#x2e;&#122;&#104;&#x6f;&#110;&#x67;&#x2e;&#x73;&#105;&#x6e;&#111;&#64;&#x67;&#109;&#97;&#x69;&#108;&#46;&#x63;&#111;&#x6d;">&#121;&#x61;&#x6e;&#x2e;&#122;&#104;&#x6f;&#110;&#x67;&#x2e;&#x73;&#105;&#x6e;&#111;&#64;&#x67;&#109;&#97;&#x69;&#108;&#46;&#x63;&#111;&#x6d;</a></li>
+<li>邮箱​：<a href="mailto:&#121;&#97;&#110;&#x2e;&#x7a;&#x68;&#x6f;&#x6e;&#103;&#46;&#115;&#x69;&#110;&#x6f;&#x40;&#x67;&#109;&#x61;&#105;&#x6c;&#46;&#x63;&#x6f;&#109;">&#121;&#97;&#110;&#x2e;&#x7a;&#x68;&#x6f;&#x6e;&#103;&#46;&#115;&#x69;&#110;&#x6f;&#x40;&#x67;&#109;&#x61;&#105;&#x6c;&#46;&#x63;&#x6f;&#109;</a></li>
 </ul>
 <hr>
 <ul>
diff --git a/css/main.css b/css/main.css
index e191872da0..31e83744c8 100644
--- a/css/main.css
+++ b/css/main.css
@@ -1197,7 +1197,7 @@ pre .javascript .function {
 }
 .links-of-author a::before,
 .links-of-author span.exturl::before {
-  background: #38050d;
+  background: #99cd90;
   border-radius: 50%;
   content: ' ';
   display: inline-block;
diff --git a/search.xml b/search.xml
index 92ddfadd27..0640d32db3 100644
--- a/search.xml
+++ b/search.xml
@@ -699,116 +699,6 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>VennDiagram</tag>
       </tags>
   </entry>
-  <entry>
-    <title>批量计算Ka和Ks</title>
-    <url>/2022/09/07/bioinfo_Ks_batch.calculation.Ks/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=1901371647&auto=1&height=32"></iframe></div>
-
-<h1 id="1-ParaAT"><a href="#1-ParaAT" class="headerlink" title="1. ParaAT"></a>1. ParaAT</h1><p>参考blog.ParaAT：<a href="https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/">https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/</a></p>
-<h1 id="2-KaKs-Calculator-2-0"><a href="#2-KaKs-Calculator-2-0" class="headerlink" title="2. KaKs_Calculator 2.0"></a>2. KaKs_Calculator 2.0</h1><p>KaKs_Calculator 2.0工具包包含了17种计算Ka和Ks的方法，包含Gamma系列，并可识别基于蛋白编码序列的滑动窗口，基于C++和Java，在Windows和Linux平台都可使用。</p>
-<h1 id="3-Ka和Ks计算"><a href="#3-Ka和Ks计算" class="headerlink" title="3. Ka和Ks计算"></a>3. Ka和Ks计算</h1><ul>
-<li>ParaAT比对指定的基因对的氨基酸序列，并转化成比对的CDS序列，并可指定输出格式，如axt格式。</li>
-<li>KaKs_Calculator用于计算比对好的基因对的kaks。</li>
-</ul>
-<p>用还会用到两个脚本:</p>
-<ul>
-<li>axt2one-line.py:<a href="https://github.com/scbgfengchao/4DTv/blob/master/axt2one-line.py%E8%BD%AC%E6%8D%A2axt%E6%A0%BC%E5%BC%8F%E4%B8%BA%E5%8D%95%E8%A1%8C">https://github.com/scbgfengchao/4DTv/blob/master/axt2one-line.py转换axt格式为单行</a></li>
-<li>calculate_4DTV_correction.pl:<a href="https://github.com/JinfengChen/Scripts/blob/master/FFgenome/03.evolution/distance_kaks_4dtv/bin/calculate_4DTV_correction.pl%E8%AE%A1%E7%AE%974dtv%E3%80%82">https://github.com/JinfengChen/Scripts/blob/master/FFgenome/03.evolution/distance_kaks_4dtv/bin/calculate_4DTV_correction.pl计算4dtv。</a></li>
-</ul>
-<h1 id="4-软件准备"><a href="#4-软件准备" class="headerlink" title="4. 软件准备"></a>4. 软件准备</h1><ol>
-<li>安装ParaAT.pl</li>
-</ol>
-<ul>
-<li>参考blog.ParaAT：<a href="https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/">https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/</a></li>
-</ul>
-<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">wget ftp://download.big.ac.cn/bigd/tools/ParaAT2.0.tar.gz</span><br><span class="line">tar -zxf ParaAT2.0.tar.gz</span><br><span class="line">cd ParaAT2.0</span><br><span class="line">ParaAT.pl -h</span><br></pre></td></tr></table></figure>
-
-<ol start="2">
-<li>安装KaKs_Calculator2.0<br>KaKs_Calculator2.0下载地址：<a href="https://sourceforge.net/projects/kakscalculator2/?source=typ_redirect">https://sourceforge.net/projects/kakscalculator2/?source=typ_redirect</a></li>
-</ol>
-<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">wget https://altushost-swe.dl.sourceforge.net/project/kakscalculator2/KaKs_Calculator2.0.tar.gz</span><br><span class="line">tar -zxf KaKs_Calculator2.0.tar.gz</span><br><span class="line">chmod 777 ./KaKs_Calculator2.0/bin/Linux/KaKs_Calculator</span><br><span class="line">chmod 777 ./KaKs_Calculator2.0/src/AXTConvertor</span><br></pre></td></tr></table></figure>
-
-<ul>
-<li>然后把<code>./KaKs_Calculator2.0/bin/Linux/</code>和<code>./KaKs_Calculator2.0/src/</code>添加到环境变量即可使用<code>KaKs_Calculator</code>和<code>AXTConvertor</code>命令。</li>
-</ul>
-<h1 id="5-文件准备"><a href="#5-文件准备" class="headerlink" title="5. 文件准备"></a>5. 文件准备</h1><p>ParaAT.pl需要三个输入文件，参考blog.ParaAT：<a href="https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/">https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/</a></p>
-<ol>
-<li>sample.id</li>
-</ol>
-<ul>
-<li>两列，每行对应两条要做成对比对的序列ID；</li>
-<li>任意行，ParaAT可以批量处理多个成对比对。</li>
-<li>一个例子：<code>cat sample.collinearity |grep &quot;species_prefix&quot;|cut -f2,3 &gt;sample.id</code> 用MCScanX的结果文件提取blocks的同源gene对，获得sample.id文件。</li>
-</ul>
-<ol start="2">
-<li>cds.fa</li>
-</ol>
-<ul>
-<li>包括所有需要比对的cds序列的文件</li>
-</ul>
-<ol start="3">
-<li>pep.fa</li>
-</ol>
-<ul>
-<li>包括所有需要比对的蛋白序列的文件</li>
-</ul>
-<h1 id="6-操作步骤"><a href="#6-操作步骤" class="headerlink" title="6. 操作步骤"></a>6. 操作步骤</h1><h2 id="6-1-用ParaAT获取基因对比对序列"><a href="#6-1-用ParaAT获取基因对比对序列" class="headerlink" title="6.1. 用ParaAT获取基因对比对序列"></a>6.1. 用ParaAT获取基因对比对序列</h2><p>ParaAT比对sample.id指定的基因对的氨基酸序列，并转化成比对的CDS序列，并可指定输出为axt格式。</p>
-<ol>
-<li>命令</li>
-</ol>
-<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">echo &quot;24&quot; &gt;proc #指定ParaAT.pl使用线程</span><br><span class="line">ParaAT.pl -g -t -h sample.id -n cds.fa -a pep.fa -m mafft -p proc -f axt -o sample.paraat 2&gt; paraat.log &amp; #用ParaAT.pl调用mafft做每对基因的蛋白比对，并把蛋白比对转化成cds比对，输出axt格式。-g移除比对有gap的密码子，-t移除mismatched codons；-o指定生成目录；</span><br></pre></td></tr></table></figure>
-
-<ol start="2">
-<li>notes</li>
-</ol>
-<ul>
-<li>axt格式包括三行，第一行两个序列ID之间用短横杠-相连，第二行第一条序列，第三行第二条序列。</li>
-<li>建议加上-g和-t，免得后面计算Ks时报错<code>Error. The size of two sequences in &#39;ctg00816-ctg08844&#39; is not equal。</code></li>
-<li>ParaAT.pl命令中加上-k参数可以在获得axt文件后自动调用KaKs_Calculator计算kaks值，使用MA模型，比YN模型慢很多，推荐不加-k参数，而是手动用KaKs_Calculator的YN模型，生成sample.axt_yn.kaks文件。</li>
-</ul>
-<h2 id="6-2-用KaKs-Calculator计算基因对的Ka、Ks和4dtv值"><a href="#6-2-用KaKs-Calculator计算基因对的Ka、Ks和4dtv值" class="headerlink" title="6.2. 用KaKs_Calculator计算基因对的Ka、Ks和4dtv值"></a>6.2. 用KaKs_Calculator计算基因对的Ka、Ks和4dtv值</h2><p>ParaAT.pl的-k参数只能指定KaKs_Calculator的MA模型计算kaks值，如果需要指定其他的模型，则可以手动运行计算。</p>
-<p>KaKs_Calculator可计算比对好的CDS序列的Ka和Ks。</p>
-<ol>
-<li>计算Ka和Ks</li>
-</ol>
-<ul>
-<li>获得all.kaks文件<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cd sample.paraat # 进入ParaAT.pl生成的文件夹</span><br><span class="line">for i in `ls *axt`;do KaKs_Calculator -i $i -o $&#123;i&#125;_yn.kaks -m YN;done #用YN模型计算每个gene对的KaKs，生成四列数据，gene对，Ka，Ks，Ka/Ks</span><br><span class="line">for i in `ls |grep &quot;_yn.kaks&quot;`;do awk &#x27;NR&gt;1&#123;print $1&quot;\t&quot;$3&quot;\t&quot;$4&quot;\t&quot;$5&#125;&#x27; $i &gt;&gt;../all.kaks;done #合并kaks到all.kaks文件</span><br></pre></td></tr></table></figure></li>
-</ul>
-<ol start="2">
-<li>计算4dtv</li>
-</ol>
-<ul>
-<li>获得all.4dtv文件<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cd sample.paraat # 进入ParaAT.pl生成的文件夹</span><br><span class="line">for i in `ls *axt`;do axt2one-line.py $i $&#123;i&#125;.one-line;done #多行axt文件转换成单行</span><br><span class="line">ls |grep &quot;axt.one-line&quot;|while read id;do calculate_4DTV_correction.pl $id &gt; $&#123;id%%one-line&#125;4dtv;done #计算4dtv值，生成两列数据，gene对，4dtv</span><br><span class="line">for i in `ls |grep &quot;4dtv&quot;`;do awk &#x27;NR&gt;1&#123;print $1&quot;\t&quot;$3&#125;&#x27; $i &gt;&gt;../all.4dtv;done #合并4dtv值到all.4dtv</span><br></pre></td></tr></table></figure></li>
-</ul>
-<ol start="3">
-<li>合并和整理结果</li>
-</ol>
-<ul>
-<li>获得all.results文件<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cd .. #返回上一级目录</span><br><span class="line">join all.kaks all.4dtv |sed &quot;s/ /\t/g&quot; |awk &#x27;$3 != &quot;NA&quot; &#123;print $0&#125;&#x27; |sed &#x27;1i\genepair\tKa\tKs\tKa/Ks\t4dtv_corrected&#x27; &gt;all.results #以gene对为基准，join合并kaks和4dtv值到一个文件，然后过滤Ks值为NA的无效数据，添加标题行。</span><br><span class="line">rm all.kaks* all.4dtv* #删除中间文件</span><br></pre></td></tr></table></figure></li>
-</ul>
-<h1 id="7-references"><a href="#7-references" class="headerlink" title="7. references"></a>7. references</h1><ol>
-<li>ParaAT paper：<a href="https://www.sciencedirect.com/science/article/pii/S0006291X12003518">https://www.sciencedirect.com/science/article/pii/S0006291X12003518</a></li>
-<li>KaKs_Calculator2.0 github：<a href="https://github.com/kullrich/kakscalculator2">https://github.com/kullrich/kakscalculator2</a></li>
-<li>KaKs_Calculator2.0 paper：<a href="https://www.sciencedirect.com/science/article/pii/S1672022910600083?via=ihub">https://www.sciencedirect.com/science/article/pii/S1672022910600083?via%3Dihub</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>bioinfo</category>
-        <category>Ks</category>
-      </categories>
-      <tags>
-        <tag>Ks</tag>
-        <tag>Ka</tag>
-        <tag>4dtv</tag>
-        <tag>ParaAT</tag>
-        <tag>KaKs_Calculator</tag>
-      </tags>
-  </entry>
   <entry>
     <title>鉴定全基因复制事件(WGD)后保留的复制基因</title>
     <url>/2022/10/18/bioinfo_WGD_geneRetention/</url>
@@ -1311,6 +1201,116 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>trimAl</tag>
       </tags>
   </entry>
+  <entry>
+    <title>批量计算Ka和Ks</title>
+    <url>/2022/09/07/bioinfo_Ks_batch.calculation.Ks/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=1901371647&auto=1&height=32"></iframe></div>
+
+<h1 id="1-ParaAT"><a href="#1-ParaAT" class="headerlink" title="1. ParaAT"></a>1. ParaAT</h1><p>参考blog.ParaAT：<a href="https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/">https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/</a></p>
+<h1 id="2-KaKs-Calculator-2-0"><a href="#2-KaKs-Calculator-2-0" class="headerlink" title="2. KaKs_Calculator 2.0"></a>2. KaKs_Calculator 2.0</h1><p>KaKs_Calculator 2.0工具包包含了17种计算Ka和Ks的方法，包含Gamma系列，并可识别基于蛋白编码序列的滑动窗口，基于C++和Java，在Windows和Linux平台都可使用。</p>
+<h1 id="3-Ka和Ks计算"><a href="#3-Ka和Ks计算" class="headerlink" title="3. Ka和Ks计算"></a>3. Ka和Ks计算</h1><ul>
+<li>ParaAT比对指定的基因对的氨基酸序列，并转化成比对的CDS序列，并可指定输出格式，如axt格式。</li>
+<li>KaKs_Calculator用于计算比对好的基因对的kaks。</li>
+</ul>
+<p>用还会用到两个脚本:</p>
+<ul>
+<li>axt2one-line.py:<a href="https://github.com/scbgfengchao/4DTv/blob/master/axt2one-line.py%E8%BD%AC%E6%8D%A2axt%E6%A0%BC%E5%BC%8F%E4%B8%BA%E5%8D%95%E8%A1%8C">https://github.com/scbgfengchao/4DTv/blob/master/axt2one-line.py转换axt格式为单行</a></li>
+<li>calculate_4DTV_correction.pl:<a href="https://github.com/JinfengChen/Scripts/blob/master/FFgenome/03.evolution/distance_kaks_4dtv/bin/calculate_4DTV_correction.pl%E8%AE%A1%E7%AE%974dtv%E3%80%82">https://github.com/JinfengChen/Scripts/blob/master/FFgenome/03.evolution/distance_kaks_4dtv/bin/calculate_4DTV_correction.pl计算4dtv。</a></li>
+</ul>
+<h1 id="4-软件准备"><a href="#4-软件准备" class="headerlink" title="4. 软件准备"></a>4. 软件准备</h1><ol>
+<li>安装ParaAT.pl</li>
+</ol>
+<ul>
+<li>参考blog.ParaAT：<a href="https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/">https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/</a></li>
+</ul>
+<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">wget ftp://download.big.ac.cn/bigd/tools/ParaAT2.0.tar.gz</span><br><span class="line">tar -zxf ParaAT2.0.tar.gz</span><br><span class="line">cd ParaAT2.0</span><br><span class="line">ParaAT.pl -h</span><br></pre></td></tr></table></figure>
+
+<ol start="2">
+<li>安装KaKs_Calculator2.0<br>KaKs_Calculator2.0下载地址：<a href="https://sourceforge.net/projects/kakscalculator2/?source=typ_redirect">https://sourceforge.net/projects/kakscalculator2/?source=typ_redirect</a></li>
+</ol>
+<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">wget https://altushost-swe.dl.sourceforge.net/project/kakscalculator2/KaKs_Calculator2.0.tar.gz</span><br><span class="line">tar -zxf KaKs_Calculator2.0.tar.gz</span><br><span class="line">chmod 777 ./KaKs_Calculator2.0/bin/Linux/KaKs_Calculator</span><br><span class="line">chmod 777 ./KaKs_Calculator2.0/src/AXTConvertor</span><br></pre></td></tr></table></figure>
+
+<ul>
+<li>然后把<code>./KaKs_Calculator2.0/bin/Linux/</code>和<code>./KaKs_Calculator2.0/src/</code>添加到环境变量即可使用<code>KaKs_Calculator</code>和<code>AXTConvertor</code>命令。</li>
+</ul>
+<h1 id="5-文件准备"><a href="#5-文件准备" class="headerlink" title="5. 文件准备"></a>5. 文件准备</h1><p>ParaAT.pl需要三个输入文件，参考blog.ParaAT：<a href="https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/">https://yanzhongsino.github.io/2021/10/29/bioinfo_align_pep2cds/</a></p>
+<ol>
+<li>sample.id</li>
+</ol>
+<ul>
+<li>两列，每行对应两条要做成对比对的序列ID；</li>
+<li>任意行，ParaAT可以批量处理多个成对比对。</li>
+<li>一个例子：<code>cat sample.collinearity |grep &quot;species_prefix&quot;|cut -f2,3 &gt;sample.id</code> 用MCScanX的结果文件提取blocks的同源gene对，获得sample.id文件。</li>
+</ul>
+<ol start="2">
+<li>cds.fa</li>
+</ol>
+<ul>
+<li>包括所有需要比对的cds序列的文件</li>
+</ul>
+<ol start="3">
+<li>pep.fa</li>
+</ol>
+<ul>
+<li>包括所有需要比对的蛋白序列的文件</li>
+</ul>
+<h1 id="6-操作步骤"><a href="#6-操作步骤" class="headerlink" title="6. 操作步骤"></a>6. 操作步骤</h1><h2 id="6-1-用ParaAT获取基因对比对序列"><a href="#6-1-用ParaAT获取基因对比对序列" class="headerlink" title="6.1. 用ParaAT获取基因对比对序列"></a>6.1. 用ParaAT获取基因对比对序列</h2><p>ParaAT比对sample.id指定的基因对的氨基酸序列，并转化成比对的CDS序列，并可指定输出为axt格式。</p>
+<ol>
+<li>命令</li>
+</ol>
+<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">echo &quot;24&quot; &gt;proc #指定ParaAT.pl使用线程</span><br><span class="line">ParaAT.pl -g -t -h sample.id -n cds.fa -a pep.fa -m mafft -p proc -f axt -o sample.paraat 2&gt; paraat.log &amp; #用ParaAT.pl调用mafft做每对基因的蛋白比对，并把蛋白比对转化成cds比对，输出axt格式。-g移除比对有gap的密码子，-t移除mismatched codons；-o指定生成目录；</span><br></pre></td></tr></table></figure>
+
+<ol start="2">
+<li>notes</li>
+</ol>
+<ul>
+<li>axt格式包括三行，第一行两个序列ID之间用短横杠-相连，第二行第一条序列，第三行第二条序列。</li>
+<li>建议加上-g和-t，免得后面计算Ks时报错<code>Error. The size of two sequences in &#39;ctg00816-ctg08844&#39; is not equal。</code></li>
+<li>ParaAT.pl命令中加上-k参数可以在获得axt文件后自动调用KaKs_Calculator计算kaks值，使用MA模型，比YN模型慢很多，推荐不加-k参数，而是手动用KaKs_Calculator的YN模型，生成sample.axt_yn.kaks文件。</li>
+</ul>
+<h2 id="6-2-用KaKs-Calculator计算基因对的Ka、Ks和4dtv值"><a href="#6-2-用KaKs-Calculator计算基因对的Ka、Ks和4dtv值" class="headerlink" title="6.2. 用KaKs_Calculator计算基因对的Ka、Ks和4dtv值"></a>6.2. 用KaKs_Calculator计算基因对的Ka、Ks和4dtv值</h2><p>ParaAT.pl的-k参数只能指定KaKs_Calculator的MA模型计算kaks值，如果需要指定其他的模型，则可以手动运行计算。</p>
+<p>KaKs_Calculator可计算比对好的CDS序列的Ka和Ks。</p>
+<ol>
+<li>计算Ka和Ks</li>
+</ol>
+<ul>
+<li>获得all.kaks文件<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cd sample.paraat # 进入ParaAT.pl生成的文件夹</span><br><span class="line">for i in `ls *axt`;do KaKs_Calculator -i $i -o $&#123;i&#125;_yn.kaks -m YN;done #用YN模型计算每个gene对的KaKs，生成四列数据，gene对，Ka，Ks，Ka/Ks</span><br><span class="line">for i in `ls |grep &quot;_yn.kaks&quot;`;do awk &#x27;NR&gt;1&#123;print $1&quot;\t&quot;$3&quot;\t&quot;$4&quot;\t&quot;$5&#125;&#x27; $i &gt;&gt;../all.kaks;done #合并kaks到all.kaks文件</span><br></pre></td></tr></table></figure></li>
+</ul>
+<ol start="2">
+<li>计算4dtv</li>
+</ol>
+<ul>
+<li>获得all.4dtv文件<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cd sample.paraat # 进入ParaAT.pl生成的文件夹</span><br><span class="line">for i in `ls *axt`;do axt2one-line.py $i $&#123;i&#125;.one-line;done #多行axt文件转换成单行</span><br><span class="line">ls |grep &quot;axt.one-line&quot;|while read id;do calculate_4DTV_correction.pl $id &gt; $&#123;id%%one-line&#125;4dtv;done #计算4dtv值，生成两列数据，gene对，4dtv</span><br><span class="line">for i in `ls |grep &quot;4dtv&quot;`;do awk &#x27;NR&gt;1&#123;print $1&quot;\t&quot;$3&#125;&#x27; $i &gt;&gt;../all.4dtv;done #合并4dtv值到all.4dtv</span><br></pre></td></tr></table></figure></li>
+</ul>
+<ol start="3">
+<li>合并和整理结果</li>
+</ol>
+<ul>
+<li>获得all.results文件<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cd .. #返回上一级目录</span><br><span class="line">join all.kaks all.4dtv |sed &quot;s/ /\t/g&quot; |awk &#x27;$3 != &quot;NA&quot; &#123;print $0&#125;&#x27; |sed &#x27;1i\genepair\tKa\tKs\tKa/Ks\t4dtv_corrected&#x27; &gt;all.results #以gene对为基准，join合并kaks和4dtv值到一个文件，然后过滤Ks值为NA的无效数据，添加标题行。</span><br><span class="line">rm all.kaks* all.4dtv* #删除中间文件</span><br></pre></td></tr></table></figure></li>
+</ul>
+<h1 id="7-references"><a href="#7-references" class="headerlink" title="7. references"></a>7. references</h1><ol>
+<li>ParaAT paper：<a href="https://www.sciencedirect.com/science/article/pii/S0006291X12003518">https://www.sciencedirect.com/science/article/pii/S0006291X12003518</a></li>
+<li>KaKs_Calculator2.0 github：<a href="https://github.com/kullrich/kakscalculator2">https://github.com/kullrich/kakscalculator2</a></li>
+<li>KaKs_Calculator2.0 paper：<a href="https://www.sciencedirect.com/science/article/pii/S1672022910600083?via=ihub">https://www.sciencedirect.com/science/article/pii/S1672022910600083?via%3Dihub</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>bioinfo</category>
+        <category>Ks</category>
+      </categories>
+      <tags>
+        <tag>Ks</tag>
+        <tag>Ka</tag>
+        <tag>4dtv</tag>
+        <tag>ParaAT</tag>
+        <tag>KaKs_Calculator</tag>
+      </tags>
+  </entry>
   <entry>
     <title>蛋白质比对转换成CDS比对 —— ParaAT,PAL2NAL</title>
     <url>/2021/10/29/bioinfo_align_pep2cds/</url>
@@ -1398,8 +1398,8 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
       <tags>
         <tag>biosoft</tag>
         <tag>tutorial</tag>
-        <tag>ParaAT</tag>
         <tag>sequence alignment</tag>
+        <tag>ParaAT</tag>
         <tag>protein</tag>
         <tag>CDS</tag>
         <tag>PAL2NAL</tag>
@@ -1933,210 +1933,15 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
       </tags>
   </entry>
   <entry>
-    <title>富集分析：（五）clusterProfiler：Visualization</title>
-    <url>/2022/04/28/bioinfo_enrichment_clusterProfiler.visualization/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=283091&auto=1&height=32"></iframe></div>
-
-<p>(全文约4000字)</p>
-<p>clusterProfiler相关的博客共有三篇，共同食用，效果更好 :wink: ：</p>
-<ul>
-<li>博客<a href="https://yanzhongsino.github.io/2021/12/13/bioinfo_enrichment_clusterProfiler.intro/">富集分析：（三）clusterProfiler概述</a></li>
-<li>博客<a href="https://yanzhongsino.github.io/2022/04/26/bioinfo_enrichment_clusterProfiler.species/">富集分析：（四） clusterProfiler：不同物种的GO+KEGG富集分析</a></li>
-<li>博客<a href="https://yanzhongsino.github.io/2022/04/28/bioinfo_enrichment_clusterProfiler.visualization/">富集分析：（五）clusterProfiler：Visualization</a></li>
-</ul>
-<h1 id="1-可视化的输入数据"><a href="#1-可视化的输入数据" class="headerlink" title="1. 可视化的输入数据"></a>1. 可视化的输入数据</h1><p>clusterProfiler的可视化一般只支持clusterProfiler富集分析结果的可视化，通过认识clusterProfiler可视化接受的输入数据的格式，可以修改其他富集分析结果文件的格式，来用clusterProfiler进行可视化绘图。</p>
-<h2 id="1-1-可视化输入数据格式"><a href="#1-1-可视化输入数据格式" class="headerlink" title="1.1. 可视化输入数据格式"></a>1.1. 可视化输入数据格式</h2><ol>
-<li>查看ego格式<br>clusterProfiler的可视化包接受的输入数据是前面富集分析得到的结果(比如ego&#x2F;kk)，用<code>str(ego)</code>或<code>class(ego)</code>可以看到ego的格式是叫enrichResult的R的数据类型。<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>clusterProfiler<span class="punctuation">)</span></span><br><span class="line"><span class="operator">&gt;</span> <span class="built_in">class</span><span class="punctuation">(</span>ego<span class="punctuation">)</span> <span class="comment">#查看ego的数据类型/类</span></span><br><span class="line"><span class="punctuation">[</span><span class="number">1</span><span class="punctuation">]</span> <span class="string">&quot;enrichResult&quot;</span></span><br><span class="line"><span class="built_in">attr</span><span class="punctuation">(</span><span class="punctuation">,</span><span class="string">&quot;package&quot;</span><span class="punctuation">)</span></span><br><span class="line"><span class="punctuation">[</span><span class="number">1</span><span class="punctuation">]</span> <span class="string">&quot;DOSE&quot;</span></span><br></pre></td></tr></table></figure></li>
-</ol>
-<p>如果手头没有ego数据，可以用clusterProfiler的样例数据快速得到一个edo，与ego格式一样。</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>clusterProfiler<span class="punctuation">)</span></span><br><span class="line">data<span class="punctuation">(</span>geneList<span class="punctuation">)</span> <span class="comment">#导入示例数据</span></span><br><span class="line">de <span class="operator">&lt;-</span> <span class="built_in">names</span><span class="punctuation">(</span>geneList<span class="punctuation">)</span><span class="punctuation">[</span><span class="built_in">abs</span><span class="punctuation">(</span>geneList<span class="punctuation">)</span> <span class="operator">&gt;</span> <span class="number">2</span><span class="punctuation">]</span> <span class="comment">#得到差异表达的基因</span></span><br><span class="line">edo <span class="operator">&lt;-</span> enrichDGN<span class="punctuation">(</span>de<span class="punctuation">)</span> <span class="comment">#进行富集分析</span></span><br><span class="line"><span class="built_in">class</span><span class="punctuation">(</span>ego<span class="punctuation">)</span> <span class="comment">#查看edo的数据类型/类</span></span><br></pre></td></tr></table></figure>
+    <title>富集分析：（一）概述</title>
+    <url>/2021/11/12/bioinfo_enrichment_intro/</url>
+    <content><![CDATA[<div align="middle"><iframe width="298" height="52" src="https://www.youtube.com/embed/wcOM3Rx43ko" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe></div>
 
-<ol start="2">
-<li><p>enrichResult(R的class类型)格式<br>在DOSE包中查到，enrichResult具体格式如下：</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">setClass<span class="punctuation">(</span><span class="string">&quot;enrichResult&quot;</span><span class="punctuation">,</span></span><br><span class="line">         representation<span class="operator">=</span>representation<span class="punctuation">(</span></span><br><span class="line">           result         <span class="operator">=</span> <span class="string">&quot;data.frame&quot;</span><span class="punctuation">,</span></span><br><span class="line">           pvalueCutoff   <span class="operator">=</span> <span class="string">&quot;numeric&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           pAdjustMethod  <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           qvalueCutoff   <span class="operator">=</span> <span class="string">&quot;numeric&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           organism       <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           style<span class="operator">=</span><span class="string">&quot;margin: 0px; padding: 0px; color: rgb(221, 17, 68);&quot;</span><span class="operator">&gt;</span><span class="string">&quot;character&quot;</span><span class="punctuation">,</span>          </span><br><span class="line">           gene           <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           keytype        <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           universe       <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           gene2Symbol    <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           geneSets       <span class="operator">=</span> <span class="string">&quot;list&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           readable       <span class="operator">=</span> <span class="string">&quot;logical&quot;</span> </span><br><span class="line">         <span class="punctuation">)</span><span class="punctuation">,</span>         </span><br><span class="line">         prototype<span class="operator">=</span>prototype<span class="punctuation">(</span>readable <span class="operator">=</span> <span class="literal">FALSE</span><span class="punctuation">)</span></span><br><span class="line"><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+<p>（全文约​6600字）</p>
+<h1 id="1-富集分析"><a href="#1-富集分析" class="headerlink" title="1. 富集分析"></a>1. 富集分析</h1><h2 id="1-1-富集分析概念"><a href="#1-1-富集分析概念" class="headerlink" title="1.1. 富集分析概念"></a>1.1. 富集分析概念</h2><ol>
+<li><p>富集分析<br>富集分析，本质上是对数据的分布检验，如果分布集中在某个区域，则认为富集。<br>常用的分布检验方法有卡方检验、Fisher精确检验以及KS检验等方法。</p>
 </li>
-<li><p>result变量格式<br>enrichResult中最重要的是result，是储存富集结果的dataframe。<br>result变量与clusterProfiler富集分析中保存ego的结果文件是一致的。</p>
-</li>
-</ol>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">ego<span class="operator">@</span>result<span class="punctuation">[</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">13</span><span class="punctuation">,</span><span class="number">14</span><span class="punctuation">)</span><span class="punctuation">,</span><span class="punctuation">]</span> <span class="comment">#查看ego的result变量的13，14行</span></span><br><span class="line">   ONTOLOGY         ID                        Description GeneRatio   BgRatio   pvalue    p.adjust      qvalue      geneID   Count</span><br><span class="line"><span class="number">13</span>       BP GO<span class="operator">:</span><span class="number">0010051</span> xylem and phloem pattern formation    <span class="number">3</span><span class="operator">/</span><span class="number">349</span> <span class="number">129</span><span class="operator">/</span><span class="number">16975</span>    <span class="number">1.431350e-05</span> <span class="number">0.001294821</span> <span class="number">0.001099880</span>   mc40782<span class="operator">/</span>mc40784<span class="operator">/</span>mc40918   <span class="number">3</span></span><br><span class="line"><span class="number">14</span>       BP GO<span class="operator">:</span><span class="number">0048598</span>            embryonic morphogenesis    <span class="number">2</span><span class="operator">/</span><span class="number">349</span> <span class="number">131</span><span class="operator">/</span><span class="number">16975</span>    <span class="number">1.673394e-05</span> <span class="number">0.001405651</span> <span class="number">0.001194023</span>   mc40784<span class="operator">/</span>mc40918   <span class="number">2</span></span><br></pre></td></tr></table></figure>
-
-<p>一般而言result有9列。这里因为用enrichGO富集时ont参数选择ALL，结果就会在第一列前多一列ONTOLOGY。</p>
-<ul>
-<li>第一列是ID,也就是富集通路的编号(GO:0010222)；</li>
-<li>第二列是Description，也就是富集通路的名称；</li>
-<li>第三列是GeneRatio，也就是要富集的基因中在对应通路中的比例；</li>
-<li>第4列是BgRation,也就是对应通过的基因在全基因组注释中的比例；</li>
-<li>第5,6,7列都是统计检验的结果；</li>
-<li>第8列是geneID，也就是富集到基因的名字，多个geneID是以斜线隔开的；</li>
-<li>第9列是Count，也就是富集到的基因数目。</li>
-</ul>
-<h2 id="1-2-输入数据准备"><a href="#1-2-输入数据准备" class="headerlink" title="1.2. 输入数据准备"></a>1.2. 输入数据准备</h2><p>根据不同情况为clusterProfiler的可视化准备输入数据。</p>
-<ol>
-<li><p>接着clusterProfiler富集分析做可视化<br>如果是接着clusterProfiler的enrichGO(),gseGO(),enricher(),gseGO()等函数的结果<code>ego</code>，不要关闭R环境，在R里直接进行用于下一步可视化即可。</p>
-</li>
-<li><p>保存的clusterProfiler富集分析结果做可视化</p>
-</li>
-</ol>
-<ul>
-<li>如果是clusterProfiler的enrichGO(),gseGO(),enricher(),gseGO()等函数的结果<code>ego</code>保存成的文件，已关闭R环境。</li>
-<li>可导入文件，新建enrichResult对象ego，再进行下一步可视化。</li>
-<li>这里假设用R命令<code>write.table(as.data.frame(ego),&quot;go_enrich.csv&quot;,sep=&quot;\t&quot;,row.names =F,quote=F)</code>保存<code>ego</code>在<code>go_enrich.csv</code>文件。<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">data<span class="operator">&lt;-</span>read.table<span class="punctuation">(</span><span class="string">&quot;go_enrich.csv&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;\t&quot;</span><span class="punctuation">,</span>header<span class="operator">=</span><span class="built_in">T</span><span class="punctuation">,</span><span class="built_in">quote</span><span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span></span><br><span class="line">head<span class="punctuation">(</span>data<span class="punctuation">,</span><span class="number">2</span><span class="punctuation">)</span> <span class="comment">#查看data前2行</span></span><br><span class="line">  ONTOLOGY         ID                                 Description GeneRatio</span><br><span class="line"><span class="number">1</span>       BP GO<span class="operator">:</span><span class="number">0010222</span>      stem vascular tissue pattern formation    <span class="number">12</span><span class="operator">/</span><span class="number">349</span></span><br><span class="line"><span class="number">2</span>       BP GO<span class="operator">:</span><span class="number">0010588</span> cotyledon vascular tissue pattern formation    <span class="number">12</span><span class="operator">/</span><span class="number">349</span></span><br><span class="line">   BgRatio       pvalue     p.adjust       qvalue</span><br><span class="line"><span class="number">1</span> <span class="number">29</span><span class="operator">/</span><span class="number">16975</span> <span class="number">1.792157e-13</span> <span class="number">2.107577e-10</span> <span class="number">1.790270e-10</span></span><br><span class="line"><span class="number">2</span> <span class="number">39</span><span class="operator">/</span><span class="number">16975</span> <span class="number">1.122611e-11</span> <span class="number">6.600951e-09</span> <span class="number">5.607145e-09</span></span><br><span class="line">           geneID</span><br><span class="line"><span class="number">1</span> mc11300<span class="operator">/</span>mc11301<span class="operator">/</span>mc19080<span class="operator">/</span>mc19081<span class="operator">/</span>mc26300<span class="operator">/</span>mc31693<span class="operator">/</span>mc37850<span class="operator">/</span>mc40780<span class="operator">/</span>mc40781<span class="operator">/</span>mc40782<span class="operator">/</span>mc40784<span class="operator">/</span>mc40918</span><br><span class="line"><span class="number">2</span> mc11300<span class="operator">/</span>mc11301<span class="operator">/</span>mc19080<span class="operator">/</span>mc19081<span class="operator">/</span>mc26300<span class="operator">/</span>mc31693<span class="operator">/</span>mc37850<span class="operator">/</span>mc40780<span class="operator">/</span>mc40781<span class="operator">/</span>mc40782<span class="operator">/</span>mc40784<span class="operator">/</span>mc40918</span><br><span class="line">  Count</span><br><span class="line"><span class="number">1</span>    <span class="number">12</span></span><br><span class="line"><span class="number">2</span>    <span class="number">12</span></span><br><span class="line"></span><br><span class="line">geneID_all <span class="operator">&lt;-</span> unlist<span class="punctuation">(</span>apply<span class="punctuation">(</span>as.matrix<span class="punctuation">(</span>data<span class="operator">$</span>geneID<span class="punctuation">)</span><span class="punctuation">,</span><span class="number">1</span><span class="punctuation">,</span><span class="keyword">function</span><span class="punctuation">(</span>x<span class="punctuation">)</span> unlist<span class="punctuation">(</span>strsplit<span class="punctuation">(</span>x<span class="punctuation">,</span><span class="string">&#x27;/&#x27;</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="comment">#得到富集到的所用geneID</span></span><br><span class="line"></span><br><span class="line">ego<span class="operator">&lt;-</span>new<span class="punctuation">(</span><span class="string">&quot;enrichResult&quot;</span><span class="punctuation">,</span> result<span class="operator">=</span>data<span class="punctuation">,</span> gene<span class="operator">=</span>geneID_all<span class="punctuation">,</span> pvalueCutoff<span class="operator">=</span><span class="number">0.01</span><span class="punctuation">,</span>pAdjustMethod<span class="operator">=</span><span class="string">&quot;BH&quot;</span><span class="punctuation">,</span>qvalueCutoff<span class="operator">=</span><span class="number">0.05</span><span class="punctuation">,</span>ontology<span class="operator">=</span><span class="string">&quot;BP&quot;</span><span class="punctuation">,</span>keytype<span class="operator">=</span><span class="string">&quot;GID&quot;</span><span class="punctuation">,</span>universe<span class="operator">=</span><span class="string">&#x27;Unknown&#x27;</span><span class="punctuation">,</span>geneSets<span class="operator">=</span><span class="built_in">list</span><span class="punctuation">(</span><span class="punctuation">)</span><span class="punctuation">,</span>organism<span class="operator">=</span><span class="string">&quot;Unknown&quot;</span><span class="punctuation">,</span>readable<span class="operator">=</span><span class="literal">FALSE</span><span class="punctuation">)</span> <span class="comment">#把data内容赋值给ego的result，geneID_all赋值给gene，每个富集到的GO对应的gene集应该赋值给geneSets(数据是字典(键值对是GOID和geneIDs)组成的列表，这里直接给了空的)，ontology与enrichGO分析的ont参数一致，这里的pvalueCutoff=0.01,pAdjustMethod=&quot;BH&quot;,qvalueCutoff=0.05根据富集分析参数的设置，或者随意设置或者不设置也不会影响可视化。</span></span><br></pre></td></tr></table></figure></li>
-</ul>
-<ol start="3">
-<li>其他来源富集分析结果可视化<br>如果是其他软件的富集分析结果，可以根据ego的result变量格式进行修改格式，改成go_enrich.csv相同的格式的文件，再按照上面的步骤导入文件，并保存到新建的ego对象。即可用clusterProfiler的可视化包可视化其他软件的富集分析结果了。</li>
-</ol>
-<h1 id="2-功能富集结果可视化"><a href="#2-功能富集结果可视化" class="headerlink" title="2. 功能富集结果可视化"></a>2. 功能富集结果可视化</h1><p>下面的可视化大多基于在R中已获得富集分析的结果ego。</p>
-<h2 id="2-1-enrichplot包"><a href="#2-1-enrichplot包" class="headerlink" title="2.1. enrichplot包"></a>2.1. enrichplot包</h2><p>enrichplot包有几种可视化方法来解释富集结果，支持clusterProfiler获得的ORA和GSEA富集结果。</p>
-<h3 id="2-1-1-安装和载入"><a href="#2-1-1-安装和载入" class="headerlink" title="2.1.1. 安装和载入"></a>2.1.1. 安装和载入</h3><p>安装和载入enrichplot包</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">BiocManager<span class="operator">::</span>install<span class="punctuation">(</span><span class="string">&quot;enrichplot&quot;</span><span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>enrichplot<span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<h3 id="2-1-2-可视化包"><a href="#2-1-2-可视化包" class="headerlink" title="2.1.2. 可视化包"></a>2.1.2. 可视化包</h3><ul>
-<li>推荐dotplot或barplot可视化前10个GO Terms条目。</li>
-<li>推荐goplot有向无环图查看富集的GO Terms间的关系。</li>
-</ul>
-<ol>
-<li>可视化barplot —— 条形图<br>将富集分数（例如p 值）和基因计数或比率描述为条形高度和颜色。横轴为该GO term下的差异基因个数，纵轴为富集到的GO Terms的描述信息， showCategory指定展示的GO Terms的个数为20个，默认展示显著富集的top10个，即p.adjust最小的10个。</li>
-</ol>
-<p><code>barplot(ego, showCategory=20, title=&quot;EnrichmentGO_MF&quot;)</code></p>
-<p>使用mutate导出的其他变量也可以用作条形高度或颜色。</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">mutate<span class="punctuation">(</span>ego<span class="punctuation">,</span> qscore <span class="operator">=</span> <span class="operator">-</span><span class="built_in">log</span><span class="punctuation">(</span>p.adjust<span class="punctuation">,</span> base<span class="operator">=</span><span class="number">10</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="operator">%&gt;%</span> </span><br><span class="line">    barplot<span class="punctuation">(</span>x<span class="operator">=</span><span class="string">&quot;qscore&quot;</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Barplot-1.png" title="Bar plot of enriched terms" width="90%"/>
-
-<p><strong><p align="center">Figure 1. Bar plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="2">
-<li>可视化dotplot —— 点阵图<br><code>dotplot(edo, showCategory=30) + ggtitle(&quot;dotplot for ORA&quot;)</code></li>
-</ol>
-<p><code>dotplot(edo2, showCategory=30) + ggtitle(&quot;dotplot for GSEA&quot;)</code></p>
-<p>散点图，横坐标为GeneRatio，纵坐标为富集到的GO Terms的描述信息，showCategory指定展示的GO Terms的个数，默认展示显著富集的top10个，即p.adjust最小的10个。</p>
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Dotplotcap-1.png" title="Dot plot of enriched terms" width="90%"/>
-
-<p><strong><p align="center">Figure 2. Dot plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="3">
-<li>可视化cnetplot —— 类别网络图<br>cnetplot 将基因和生物学概念（例如 GO 术语或 KEGG 通路）的联系描述为一个网络（有助于查看哪些基因涉及富集通路和可能属于多个注释类别的基因）。对于基因和富集的GO terms之间的对应关系进行展示，如果一个基因位于一个GO Terms下，则将该基因与GO连线。图中灰色的点代表基因，黄色的点代表富集到的GO terms, 默认画top5富集到的GO terms, GO 节点的大小对应富集到的基因个数。</li>
-</ol>
-<p><code>cnetplot(ego, categorySize = &quot;pvalue&quot;, foldChange = gene_list</code></p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line"><span class="comment">## convert gene ID to Symbol</span></span><br><span class="line">edox <span class="operator">&lt;-</span> setReadable<span class="punctuation">(</span>ego<span class="punctuation">,</span> <span class="string">&#x27;org.Hs.eg.db&#x27;</span><span class="punctuation">,</span> <span class="string">&#x27;ENTREZID&#x27;</span><span class="punctuation">)</span></span><br><span class="line">p1 <span class="operator">&lt;-</span> cnetplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">)</span></span><br><span class="line"><span class="comment">## categorySize can be scaled by &#x27;pvalue&#x27; or &#x27;geneNum&#x27;</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> cnetplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> categorySize<span class="operator">=</span><span class="string">&quot;pvalue&quot;</span><span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">)</span></span><br><span class="line">p3 <span class="operator">&lt;-</span> cnetplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">,</span> circular <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span> colorEdge <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">)</span> </span><br><span class="line">cowplot<span class="operator">::</span>plot_grid<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> p3<span class="punctuation">,</span> ncol<span class="operator">=</span><span class="number">3</span><span class="punctuation">,</span> labels<span class="operator">=</span><span class="built_in">LETTERS</span><span class="punctuation">[</span><span class="number">1</span><span class="operator">:</span><span class="number">3</span><span class="punctuation">]</span><span class="punctuation">,</span> rel_widths<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">.8</span><span class="punctuation">,</span> <span class="number">.8</span><span class="punctuation">,</span> <span class="number">1.2</span><span class="punctuation">)</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Networkplot-1.png" title="Network plot of enriched terms" width="90%"/>
-
-<p><strong><p align="center">Figure 3. Network plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="4">
-<li>可视化heatplot —— 类热图功能分类<br>同样使用edox。<br>heatplot类似cnetplot，而显示为热图的关系。<br>如果用户想要显示大量重要术语，那么类别网络图可能会过于复杂。在heatplot能够简化结果和更容易识别的表达模式。</li>
-</ol>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">p1 <span class="operator">&lt;-</span> heatplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> showCategory<span class="operator">=</span><span class="number">5</span><span class="punctuation">)</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> heatplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">,</span> showCategory<span class="operator">=</span><span class="number">5</span><span class="punctuation">)</span></span><br><span class="line">cowplot<span class="operator">::</span>plot_grid<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> ncol<span class="operator">=</span><span class="number">1</span><span class="punctuation">,</span> labels<span class="operator">=</span><span class="built_in">LETTERS</span><span class="punctuation">[</span><span class="number">1</span><span class="operator">:</span><span class="number">2</span><span class="punctuation">]</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Heatplot-1.png" title="Heatmap plot of enriched terms" width="90%"/>
-
-<p><strong><p align="center">Figure 4. Heatmap plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="5">
-<li>可视化treeplot —— 树状图<br>treeplot()函数执行丰富术语的层次聚类。它依赖于pairwise_termsim()函数计算的丰富项的成对相似性，默认情况下使用 Jaccard 的相似性指数 (JC)。如果支持，用户还可以使用语义相似度值（例如，GO、DO和MeSH）。</li>
-</ol>
-<p>默认聚合方法treeplot()是ward.D，用户可以通过hclust_method参数指定其他方法（例如，’average’、’complete’、’median’、’centroid’等。</p>
-<p>treeplot()函数会将树切割成几个子树（由nCluster参数指定（默认为 5））并使用高频词标记子树。</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">edox2 <span class="operator">&lt;-</span> pairwise_termsim<span class="punctuation">(</span>edox<span class="punctuation">)</span></span><br><span class="line">p1 <span class="operator">&lt;-</span> treeplot<span class="punctuation">(</span>edox2<span class="punctuation">)</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> treeplot<span class="punctuation">(</span>edox2<span class="punctuation">,</span> hclust_method <span class="operator">=</span> <span class="string">&quot;average&quot;</span><span class="punctuation">)</span></span><br><span class="line">aplot<span class="operator">::</span>plot_list<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> tag_levels<span class="operator">=</span><span class="string">&#x27;A&#x27;</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/treeplot-1.png" title="Tree plot of enriched terms" width="90%"/>
-
-<p><strong><p align="center">Figure 5. Tree plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="6">
-<li>可视化emapplot —— 富集图<br>对于富集到的GO terms之间的基因重叠关系进行展示，如果两个GO terms系的差异基因存在重叠，说明这两个节点存在overlap关系，在图中用线条连接起来。每个节点是一个富集到的GO term, 默认画top30个富集到的GO terms, 节点大小对应该GO terms下富集到的差异基因个数，节点的颜色对应p.adjust的值，从小到大，对应蓝色到红色。</li>
-</ol>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">ego2 <span class="operator">&lt;-</span> pairwise_termsim<span class="punctuation">(</span>ego<span class="punctuation">)</span></span><br><span class="line">p1 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">)</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">,</span> cex_category<span class="operator">=</span><span class="number">1.5</span><span class="punctuation">)</span></span><br><span class="line">p3 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">,</span> layout<span class="operator">=</span><span class="string">&quot;kk&quot;</span><span class="punctuation">)</span></span><br><span class="line">p4 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">,</span> cex_category<span class="operator">=</span><span class="number">1.5</span><span class="punctuation">,</span>layout<span class="operator">=</span><span class="string">&quot;kk&quot;</span><span class="punctuation">)</span> </span><br><span class="line">cowplot<span class="operator">::</span>plot_grid<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> p3<span class="punctuation">,</span> p4<span class="punctuation">,</span> ncol<span class="operator">=</span><span class="number">2</span><span class="punctuation">,</span> labels<span class="operator">=</span><span class="built_in">LETTERS</span><span class="punctuation">[</span><span class="number">1</span><span class="operator">:</span><span class="number">4</span><span class="punctuation">]</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Enrichment-1.png" title="Plot for results obtained from hypergeometric test and gene set enrichment analysis" width="90%"/>
-
-<p><strong><p align="center">Figure 6. Plot for results obtained from hypergeometric test and gene set enrichment analysis. default (A), cex_category&#x3D;1.5 (B), layout&#x3D;”kk” (C) and cex_category&#x3D;1.5,layout&#x3D;”kk” (D).</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="7">
-<li>可视化upsetplot —— upset图<br>upsetplot是cnetplot可视化基因和基因集之间复杂关联的替代方法。它强调不同基因集之间的基因重叠。</li>
-</ol>
-<p><code>upsetplot(ego)</code></p>
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/upsetORA-1.png" title=" Upsetplot for over-representation analysis" width="90%"/>
-
-<p><strong><p align="center">Figure 7. Upsetplot for over-representation analysis.</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<ol start="8">
-<li>可视化ridgeplot —— 脊线图<br>ridgeplot将可视化核心富集基因的表达分布为GSEA富集类别。它帮助用户解释上调&#x2F;下调的途径。</li>
-</ol>
-<p><code>ridgeplot(ego)</code></p>
-<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/ridgeplot-1.png" title=" Ridgeplot for gene set enrichment analysis" width="90%"/>
-
-<p><strong><p align="center">Figure 8. Ridgeplot for gene set enrichment analysis.</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
-<h2 id="2-2-可视化plotGOgraph-x2F-goplot-——-有向无环图"><a href="#2-2-可视化plotGOgraph-x2F-goplot-——-有向无环图" class="headerlink" title="2.2. 可视化plotGOgraph&#x2F;goplot —— 有向无环图"></a>2.2. 可视化plotGOgraph&#x2F;goplot —— 有向无环图</h2><ol>
-<li><code>plotGOgraph(ego, firstSigNodes=10)</code></li>
-</ol>
-<ul>
-<li>有向无环图(Directed acyclic graph, DAG)，矩形代表富集到的top10个GO Terms，颜色从黄到红，对应p值从大到小。和<a href="https://yanzhongsino.github.io/2021/11/13/bioinfo_GSEA_topGO/">topGO做富集分析</a>的DAG图一样。</li>
-</ul>
-<p>当enrichGO富集分析时ont参数选了ALL时，结果文件会在第一列前增加一列ONTOLOGY为子类，这时直接用于plotGOgraph画图会报错。<br><strong>试了下，下面两种方案还是会报错Error in if (!ont %in% c(“BP”, “MF”, “CC”)) { :argument is of length zero。</strong>。还是尽量在enrichGO分析时就用ont&#x3D;”BP”吧。</p>
-<ul>
-<li>可以在结果文件中筛选出特定子类(比如BP)的结果行，并删除第一列ONTOLOGY后保存文件，再读进R用于plotGOgraph画图。</li>
-<li>也可以在R内用命令<code>ego2&lt;-ego%&gt;%filter(ONTOLOGY== &quot;BP&quot;)</code>筛选BP子类，接着用<code>ego3&lt;-ego2%&gt;%select(!ONTOLOGY)</code>或者<code>ego3&lt;-ego2[,-1]</code>删除第一列(即ONTOLOGY列)，然后用<code>plotGOgraph(ego3)</code>作图。</li>
-</ul>
-<img src="http://guangchuangyu.github.io/blog_images/Bioconductor/clusterProfiler/2016_GO_analysis_using_clusterProfiler_files/figure-markdown_strict/unnamed-chunk-7-4.png" title=" DAG图" width="90%"/>
-
-<p><strong><p align="center">Figure 9. DAG图</strong><br>from <a href="https://guangchuangyu.github.io/2016/01/go-analysis-using-clusterprofiler/">clusterProfiler blog</a></p></p>
-<ol start="2">
-<li><code>goplot(ego, showCategory = 10)</code></li>
-</ol>
-<ul>
-<li>igraph布局方式的有向无环图</li>
-</ul>
-<img src="https://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/goplot-1.png" title=" goplot的DAG图" width="90%"/>
-
-<p><strong><p align="center">Figure 10. goplot的DAG图</strong><br>from <a href="https://yulab-smu.top/biomedical-knowledge-mining-book/clusterprofiler-go.html">clusterProfiler book</a></p></p>
-<h2 id="2-3-可视化-——-wordcloud"><a href="#2-3-可视化-——-wordcloud" class="headerlink" title="2.3. 可视化 —— wordcloud"></a>2.3. 可视化 —— wordcloud</h2><p>词云的方式显示结果</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">install.packages<span class="punctuation">(</span><span class="string">&quot;wordcloud&quot;</span><span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>wordcloud<span class="punctuation">)</span></span><br><span class="line">wcdf <span class="operator">&lt;-</span> read.table<span class="punctuation">(</span>text <span class="operator">=</span> ego<span class="operator">$</span>GeneRatio<span class="punctuation">,</span> sep <span class="operator">=</span> <span class="string">&quot;/&quot;</span><span class="punctuation">)</span><span class="punctuation">[</span><span class="number">1</span><span class="punctuation">]</span></span><br><span class="line">wcdf<span class="operator">$</span>term <span class="operator">&lt;-</span>  ego<span class="punctuation">[</span><span class="punctuation">,</span><span class="number">2</span><span class="punctuation">]</span></span><br><span class="line">wordcloud<span class="punctuation">(</span>words <span class="operator">=</span> wcdf<span class="operator">$</span>term<span class="punctuation">,</span> freq <span class="operator">=</span> wcdf<span class="operator">$</span>V1<span class="punctuation">,</span> scale<span class="operator">=</span><span class="punctuation">(</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">4</span><span class="punctuation">,</span> <span class="number">.1</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">,</span> colors<span class="operator">=</span>brewer.pal<span class="punctuation">(</span><span class="number">8</span><span class="punctuation">,</span> <span class="string">&quot;Dark2&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span> max.words <span class="operator">=</span> <span class="number">25</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
-
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/images/bioinfo_GSEA_clusterProfiler_wordcloud.png?raw=true" title="wordcloud词云图" width="60%"/>
-
-<p><strong><p align="center">Figure 11. wordcloud词云图</strong><br>from <a href="https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/">NGS Analysis ebook</a></p></p>
-<h1 id="3-导出可视化结果"><a href="#3-导出可视化结果" class="headerlink" title="3. 导出可视化结果"></a>3. 导出可视化结果</h1><ol>
-<li>Rstudio</li>
-</ol>
-<p>如果是在Rstudio中，可以直接看到绘图结果，导出需要的文件格式即可。</p>
-<ol start="2">
-<li>代码导出<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">pdf<span class="punctuation">(</span><span class="string">&quot;ego.pdf&quot;</span><span class="punctuation">)</span> <span class="comment">#如果保存png，就改成png(&quot;ego.png&quot;)</span></span><br><span class="line">ego_fig<span class="operator">&lt;-</span>barplot<span class="punctuation">(</span>x<span class="punctuation">)</span> <span class="comment">#画图函数</span></span><br><span class="line">print<span class="punctuation">(</span>ego_fig<span class="punctuation">)</span> <span class="comment">#画到pdf文件</span></span><br><span class="line">dev.off<span class="punctuation">(</span><span class="punctuation">)</span> <span class="comment">#关闭pdf画板</span></span><br></pre></td></tr></table></figure></li>
-</ol>
-<h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
-<li>clusterProfiler github：<a href="https://github.com/YuLab-SMU/clusterProfiler">https://github.com/YuLab-SMU/clusterProfiler</a></li>
-<li>clusterProfiler paper：<a href="https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00066-7?_returnURL=https://linkinghub.elsevier.com/retrieve/pii/S2666675821000667?showall=true">https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00066-7?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666675821000667%3Fshowall%3Dtrue</a></li>
-<li>clusterProfiler book：<a href="http://yulab-smu.top/biomedical-knowledge-mining-book/index.html">http://yulab-smu.top/biomedical-knowledge-mining-book/index.html</a></li>
-<li>clusterProfiler manual：<a href="https://bioconductor.org/packages/devel/bioc/manuals/clusterProfiler/man/clusterProfiler.pdf">https://bioconductor.org/packages/devel/bioc/manuals/clusterProfiler/man/clusterProfiler.pdf</a></li>
-<li>clusterProfiler ducumentation：<a href="https://guangchuangyu.github.io/software/clusterProfiler/documentation/">https://guangchuangyu.github.io/software/clusterProfiler/documentation/</a></li>
-<li>其他来源结果可视化：<a href="https://cloud.tencent.com/developer/article/1613815">https://cloud.tencent.com/developer/article/1613815</a></li>
-<li>wordcloud：<a href="https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/">https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>
-]]></content>
-      <categories>
-        <category>bioinfo</category>
-        <category>enrichment</category>
-      </categories>
-      <tags>
-        <tag>gene set enrichment analysis</tag>
-        <tag>GSEA</tag>
-        <tag>enrichment analysis</tag>
-        <tag>over representation analysis</tag>
-        <tag>ORA</tag>
-        <tag>clusterProfiler</tag>
-        <tag>visualization</tag>
-      </tags>
-  </entry>
-  <entry>
-    <title>富集分析：（一）概述</title>
-    <url>/2021/11/12/bioinfo_enrichment_intro/</url>
-    <content><![CDATA[<div align="middle"><iframe width="298" height="52" src="https://www.youtube.com/embed/wcOM3Rx43ko" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe></div>
-
-<p>（全文约​6600字）</p>
-<h1 id="1-富集分析"><a href="#1-富集分析" class="headerlink" title="1. 富集分析"></a>1. 富集分析</h1><h2 id="1-1-富集分析概念"><a href="#1-1-富集分析概念" class="headerlink" title="1.1. 富集分析概念"></a>1.1. 富集分析概念</h2><ol>
-<li><p>富集分析<br>富集分析，本质上是对数据的分布检验，如果分布集中在某个区域，则认为富集。<br>常用的分布检验方法有卡方检验、Fisher精确检验以及KS检验等方法。</p>
-</li>
-<li><p>生物信息学领域的富集分析<br>在 <strong>背景基因集(N)</strong> 下获得 <strong>一组特定基因集(S)</strong> ，S可能是基因列表，表达图谱，基因芯片等形式。在预先构建好<strong>基因注释数据库</strong>(例如GO,KEGG等)已对背景基因集(N)根据生物功能或过程进行分类的前提下，通过<strong>统计学算法</strong>找出有那些显著区别于背景基因集(N)的类别(生物组成&#x2F;功能&#x2F;过程)，或者找出这组特定基因集间在生物组成&#x2F;功能&#x2F;过程的共性，经过聚类后去除冗余得到基因富集结果的过程，即为富集分析。</p>
+<li><p>生物信息学领域的富集分析<br>在 <strong>背景基因集(N)</strong> 下获得 <strong>一组特定基因集(S)</strong> ，S可能是基因列表，表达图谱，基因芯片等形式。在预先构建好<strong>基因注释数据库</strong>(例如GO,KEGG等)已对背景基因集(N)根据生物功能或过程进行分类的前提下，通过<strong>统计学算法</strong>找出有那些显著区别于背景基因集(N)的类别(生物组成&#x2F;功能&#x2F;过程)，或者找出这组特定基因集间在生物组成&#x2F;功能&#x2F;过程的共性，经过聚类后去除冗余得到基因富集结果的过程，即为富集分析。</p>
 </li>
 </ol>
 <p>可以这样简单理解富集分析在做什么。全国人口的户籍作为背景数据，我们通过富集分析可以知道相对于全国背景，客家人是不是明显在广东聚集。比如如果广东的客家人数&#x2F;全国客家人数这个比值远超过广东人数&#x2F;全国人数的比值，那么我们可以说客家人在广东是富集的。</p>
@@ -2427,15 +2232,212 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
 <li>GO overview：<a href="http://geneontology.org/docs/ontology-documentation/">http://geneontology.org/docs/ontology-documentation/</a></li>
 <li>KEGG：<a href="https://en.wikipedia.org/wiki/KEGG">https://en.wikipedia.org/wiki/KEGG</a></li>
 <li>clusterProfiler github：<a href="https://github.com/YuLab-SMU/clusterProfiler">https://github.com/YuLab-SMU/clusterProfiler</a></li>
-<li>universal enrichment analysis using clusterProfiler：<a href="http://yulab-smu.top/biomedical-knowledge-mining-book/universal-api.html">http://yulab-smu.top/biomedical-knowledge-mining-book/universal-api.html</a></li>
+<li>universal enrichment analysis using clusterProfiler：<a href="http://yulab-smu.top/biomedical-knowledge-mining-book/universal-api.html">http://yulab-smu.top/biomedical-knowledge-mining-book/universal-api.html</a></li>
+<li>clusterProfiler paper：<a href="https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00066-7?_returnURL=https://linkinghub.elsevier.com/retrieve/pii/S2666675821000667?showall=true">https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00066-7?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666675821000667%3Fshowall%3Dtrue</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>bioinfo</category>
+        <category>enrichment</category>
+      </categories>
+      <tags>
+        <tag>gene set enrichment analysis</tag>
+        <tag>GSEA</tag>
+        <tag>topGO</tag>
+        <tag>enrichment analysis</tag>
+        <tag>over representation analysis</tag>
+        <tag>ORA</tag>
+        <tag>clusterProfiler</tag>
+        <tag>KOBAS-i</tag>
+        <tag>GOEAST</tag>
+      </tags>
+  </entry>
+  <entry>
+    <title>富集分析：（五）clusterProfiler：Visualization</title>
+    <url>/2022/04/28/bioinfo_enrichment_clusterProfiler.visualization/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=283091&auto=1&height=32"></iframe></div>
+
+<p>(全文约4000字)</p>
+<p>clusterProfiler相关的博客共有三篇，共同食用，效果更好 :wink: ：</p>
+<ul>
+<li>博客<a href="https://yanzhongsino.github.io/2021/12/13/bioinfo_enrichment_clusterProfiler.intro/">富集分析：（三）clusterProfiler概述</a></li>
+<li>博客<a href="https://yanzhongsino.github.io/2022/04/26/bioinfo_enrichment_clusterProfiler.species/">富集分析：（四） clusterProfiler：不同物种的GO+KEGG富集分析</a></li>
+<li>博客<a href="https://yanzhongsino.github.io/2022/04/28/bioinfo_enrichment_clusterProfiler.visualization/">富集分析：（五）clusterProfiler：Visualization</a></li>
+</ul>
+<h1 id="1-可视化的输入数据"><a href="#1-可视化的输入数据" class="headerlink" title="1. 可视化的输入数据"></a>1. 可视化的输入数据</h1><p>clusterProfiler的可视化一般只支持clusterProfiler富集分析结果的可视化，通过认识clusterProfiler可视化接受的输入数据的格式，可以修改其他富集分析结果文件的格式，来用clusterProfiler进行可视化绘图。</p>
+<h2 id="1-1-可视化输入数据格式"><a href="#1-1-可视化输入数据格式" class="headerlink" title="1.1. 可视化输入数据格式"></a>1.1. 可视化输入数据格式</h2><ol>
+<li>查看ego格式<br>clusterProfiler的可视化包接受的输入数据是前面富集分析得到的结果(比如ego&#x2F;kk)，用<code>str(ego)</code>或<code>class(ego)</code>可以看到ego的格式是叫enrichResult的R的数据类型。<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>clusterProfiler<span class="punctuation">)</span></span><br><span class="line"><span class="operator">&gt;</span> <span class="built_in">class</span><span class="punctuation">(</span>ego<span class="punctuation">)</span> <span class="comment">#查看ego的数据类型/类</span></span><br><span class="line"><span class="punctuation">[</span><span class="number">1</span><span class="punctuation">]</span> <span class="string">&quot;enrichResult&quot;</span></span><br><span class="line"><span class="built_in">attr</span><span class="punctuation">(</span><span class="punctuation">,</span><span class="string">&quot;package&quot;</span><span class="punctuation">)</span></span><br><span class="line"><span class="punctuation">[</span><span class="number">1</span><span class="punctuation">]</span> <span class="string">&quot;DOSE&quot;</span></span><br></pre></td></tr></table></figure></li>
+</ol>
+<p>如果手头没有ego数据，可以用clusterProfiler的样例数据快速得到一个edo，与ego格式一样。</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>clusterProfiler<span class="punctuation">)</span></span><br><span class="line">data<span class="punctuation">(</span>geneList<span class="punctuation">)</span> <span class="comment">#导入示例数据</span></span><br><span class="line">de <span class="operator">&lt;-</span> <span class="built_in">names</span><span class="punctuation">(</span>geneList<span class="punctuation">)</span><span class="punctuation">[</span><span class="built_in">abs</span><span class="punctuation">(</span>geneList<span class="punctuation">)</span> <span class="operator">&gt;</span> <span class="number">2</span><span class="punctuation">]</span> <span class="comment">#得到差异表达的基因</span></span><br><span class="line">edo <span class="operator">&lt;-</span> enrichDGN<span class="punctuation">(</span>de<span class="punctuation">)</span> <span class="comment">#进行富集分析</span></span><br><span class="line"><span class="built_in">class</span><span class="punctuation">(</span>ego<span class="punctuation">)</span> <span class="comment">#查看edo的数据类型/类</span></span><br></pre></td></tr></table></figure>
+
+<ol start="2">
+<li><p>enrichResult(R的class类型)格式<br>在DOSE包中查到，enrichResult具体格式如下：</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">setClass<span class="punctuation">(</span><span class="string">&quot;enrichResult&quot;</span><span class="punctuation">,</span></span><br><span class="line">         representation<span class="operator">=</span>representation<span class="punctuation">(</span></span><br><span class="line">           result         <span class="operator">=</span> <span class="string">&quot;data.frame&quot;</span><span class="punctuation">,</span></span><br><span class="line">           pvalueCutoff   <span class="operator">=</span> <span class="string">&quot;numeric&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           pAdjustMethod  <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           qvalueCutoff   <span class="operator">=</span> <span class="string">&quot;numeric&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           organism       <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           style<span class="operator">=</span><span class="string">&quot;margin: 0px; padding: 0px; color: rgb(221, 17, 68);&quot;</span><span class="operator">&gt;</span><span class="string">&quot;character&quot;</span><span class="punctuation">,</span>          </span><br><span class="line">           gene           <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           keytype        <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           universe       <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           gene2Symbol    <span class="operator">=</span> <span class="string">&quot;character&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           geneSets       <span class="operator">=</span> <span class="string">&quot;list&quot;</span><span class="punctuation">,</span>           </span><br><span class="line">           readable       <span class="operator">=</span> <span class="string">&quot;logical&quot;</span> </span><br><span class="line">         <span class="punctuation">)</span><span class="punctuation">,</span>         </span><br><span class="line">         prototype<span class="operator">=</span>prototype<span class="punctuation">(</span>readable <span class="operator">=</span> <span class="literal">FALSE</span><span class="punctuation">)</span></span><br><span class="line"><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+</li>
+<li><p>result变量格式<br>enrichResult中最重要的是result，是储存富集结果的dataframe。<br>result变量与clusterProfiler富集分析中保存ego的结果文件是一致的。</p>
+</li>
+</ol>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">ego<span class="operator">@</span>result<span class="punctuation">[</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">13</span><span class="punctuation">,</span><span class="number">14</span><span class="punctuation">)</span><span class="punctuation">,</span><span class="punctuation">]</span> <span class="comment">#查看ego的result变量的13，14行</span></span><br><span class="line">   ONTOLOGY         ID                        Description GeneRatio   BgRatio   pvalue    p.adjust      qvalue      geneID   Count</span><br><span class="line"><span class="number">13</span>       BP GO<span class="operator">:</span><span class="number">0010051</span> xylem and phloem pattern formation    <span class="number">3</span><span class="operator">/</span><span class="number">349</span> <span class="number">129</span><span class="operator">/</span><span class="number">16975</span>    <span class="number">1.431350e-05</span> <span class="number">0.001294821</span> <span class="number">0.001099880</span>   mc40782<span class="operator">/</span>mc40784<span class="operator">/</span>mc40918   <span class="number">3</span></span><br><span class="line"><span class="number">14</span>       BP GO<span class="operator">:</span><span class="number">0048598</span>            embryonic morphogenesis    <span class="number">2</span><span class="operator">/</span><span class="number">349</span> <span class="number">131</span><span class="operator">/</span><span class="number">16975</span>    <span class="number">1.673394e-05</span> <span class="number">0.001405651</span> <span class="number">0.001194023</span>   mc40784<span class="operator">/</span>mc40918   <span class="number">2</span></span><br></pre></td></tr></table></figure>
+
+<p>一般而言result有9列。这里因为用enrichGO富集时ont参数选择ALL，结果就会在第一列前多一列ONTOLOGY。</p>
+<ul>
+<li>第一列是ID,也就是富集通路的编号(GO:0010222)；</li>
+<li>第二列是Description，也就是富集通路的名称；</li>
+<li>第三列是GeneRatio，也就是要富集的基因中在对应通路中的比例；</li>
+<li>第4列是BgRation,也就是对应通过的基因在全基因组注释中的比例；</li>
+<li>第5,6,7列都是统计检验的结果；</li>
+<li>第8列是geneID，也就是富集到基因的名字，多个geneID是以斜线隔开的；</li>
+<li>第9列是Count，也就是富集到的基因数目。</li>
+</ul>
+<h2 id="1-2-输入数据准备"><a href="#1-2-输入数据准备" class="headerlink" title="1.2. 输入数据准备"></a>1.2. 输入数据准备</h2><p>根据不同情况为clusterProfiler的可视化准备输入数据。</p>
+<ol>
+<li><p>接着clusterProfiler富集分析做可视化<br>如果是接着clusterProfiler的enrichGO(),gseGO(),enricher(),gseGO()等函数的结果<code>ego</code>，不要关闭R环境，在R里直接进行用于下一步可视化即可。</p>
+</li>
+<li><p>保存的clusterProfiler富集分析结果做可视化</p>
+</li>
+</ol>
+<ul>
+<li>如果是clusterProfiler的enrichGO(),gseGO(),enricher(),gseGO()等函数的结果<code>ego</code>保存成的文件，已关闭R环境。</li>
+<li>可导入文件，新建enrichResult对象ego，再进行下一步可视化。</li>
+<li>这里假设用R命令<code>write.table(as.data.frame(ego),&quot;go_enrich.csv&quot;,sep=&quot;\t&quot;,row.names =F,quote=F)</code>保存<code>ego</code>在<code>go_enrich.csv</code>文件。<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">data<span class="operator">&lt;-</span>read.table<span class="punctuation">(</span><span class="string">&quot;go_enrich.csv&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;\t&quot;</span><span class="punctuation">,</span>header<span class="operator">=</span><span class="built_in">T</span><span class="punctuation">,</span><span class="built_in">quote</span><span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span></span><br><span class="line">head<span class="punctuation">(</span>data<span class="punctuation">,</span><span class="number">2</span><span class="punctuation">)</span> <span class="comment">#查看data前2行</span></span><br><span class="line">  ONTOLOGY         ID                                 Description GeneRatio</span><br><span class="line"><span class="number">1</span>       BP GO<span class="operator">:</span><span class="number">0010222</span>      stem vascular tissue pattern formation    <span class="number">12</span><span class="operator">/</span><span class="number">349</span></span><br><span class="line"><span class="number">2</span>       BP GO<span class="operator">:</span><span class="number">0010588</span> cotyledon vascular tissue pattern formation    <span class="number">12</span><span class="operator">/</span><span class="number">349</span></span><br><span class="line">   BgRatio       pvalue     p.adjust       qvalue</span><br><span class="line"><span class="number">1</span> <span class="number">29</span><span class="operator">/</span><span class="number">16975</span> <span class="number">1.792157e-13</span> <span class="number">2.107577e-10</span> <span class="number">1.790270e-10</span></span><br><span class="line"><span class="number">2</span> <span class="number">39</span><span class="operator">/</span><span class="number">16975</span> <span class="number">1.122611e-11</span> <span class="number">6.600951e-09</span> <span class="number">5.607145e-09</span></span><br><span class="line">           geneID</span><br><span class="line"><span class="number">1</span> mc11300<span class="operator">/</span>mc11301<span class="operator">/</span>mc19080<span class="operator">/</span>mc19081<span class="operator">/</span>mc26300<span class="operator">/</span>mc31693<span class="operator">/</span>mc37850<span class="operator">/</span>mc40780<span class="operator">/</span>mc40781<span class="operator">/</span>mc40782<span class="operator">/</span>mc40784<span class="operator">/</span>mc40918</span><br><span class="line"><span class="number">2</span> mc11300<span class="operator">/</span>mc11301<span class="operator">/</span>mc19080<span class="operator">/</span>mc19081<span class="operator">/</span>mc26300<span class="operator">/</span>mc31693<span class="operator">/</span>mc37850<span class="operator">/</span>mc40780<span class="operator">/</span>mc40781<span class="operator">/</span>mc40782<span class="operator">/</span>mc40784<span class="operator">/</span>mc40918</span><br><span class="line">  Count</span><br><span class="line"><span class="number">1</span>    <span class="number">12</span></span><br><span class="line"><span class="number">2</span>    <span class="number">12</span></span><br><span class="line"></span><br><span class="line">geneID_all <span class="operator">&lt;-</span> unlist<span class="punctuation">(</span>apply<span class="punctuation">(</span>as.matrix<span class="punctuation">(</span>data<span class="operator">$</span>geneID<span class="punctuation">)</span><span class="punctuation">,</span><span class="number">1</span><span class="punctuation">,</span><span class="keyword">function</span><span class="punctuation">(</span>x<span class="punctuation">)</span> unlist<span class="punctuation">(</span>strsplit<span class="punctuation">(</span>x<span class="punctuation">,</span><span class="string">&#x27;/&#x27;</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="comment">#得到富集到的所用geneID</span></span><br><span class="line"></span><br><span class="line">ego<span class="operator">&lt;-</span>new<span class="punctuation">(</span><span class="string">&quot;enrichResult&quot;</span><span class="punctuation">,</span> result<span class="operator">=</span>data<span class="punctuation">,</span> gene<span class="operator">=</span>geneID_all<span class="punctuation">,</span> pvalueCutoff<span class="operator">=</span><span class="number">0.01</span><span class="punctuation">,</span>pAdjustMethod<span class="operator">=</span><span class="string">&quot;BH&quot;</span><span class="punctuation">,</span>qvalueCutoff<span class="operator">=</span><span class="number">0.05</span><span class="punctuation">,</span>ontology<span class="operator">=</span><span class="string">&quot;BP&quot;</span><span class="punctuation">,</span>keytype<span class="operator">=</span><span class="string">&quot;GID&quot;</span><span class="punctuation">,</span>universe<span class="operator">=</span><span class="string">&#x27;Unknown&#x27;</span><span class="punctuation">,</span>geneSets<span class="operator">=</span><span class="built_in">list</span><span class="punctuation">(</span><span class="punctuation">)</span><span class="punctuation">,</span>organism<span class="operator">=</span><span class="string">&quot;Unknown&quot;</span><span class="punctuation">,</span>readable<span class="operator">=</span><span class="literal">FALSE</span><span class="punctuation">)</span> <span class="comment">#把data内容赋值给ego的result，geneID_all赋值给gene，每个富集到的GO对应的gene集应该赋值给geneSets(数据是字典(键值对是GOID和geneIDs)组成的列表，这里直接给了空的)，ontology与enrichGO分析的ont参数一致，这里的pvalueCutoff=0.01,pAdjustMethod=&quot;BH&quot;,qvalueCutoff=0.05根据富集分析参数的设置，或者随意设置或者不设置也不会影响可视化。</span></span><br></pre></td></tr></table></figure></li>
+</ul>
+<ol start="3">
+<li>其他来源富集分析结果可视化<br>如果是其他软件的富集分析结果，可以根据ego的result变量格式进行修改格式，改成go_enrich.csv相同的格式的文件，再按照上面的步骤导入文件，并保存到新建的ego对象。即可用clusterProfiler的可视化包可视化其他软件的富集分析结果了。</li>
+</ol>
+<h1 id="2-功能富集结果可视化"><a href="#2-功能富集结果可视化" class="headerlink" title="2. 功能富集结果可视化"></a>2. 功能富集结果可视化</h1><p>下面的可视化大多基于在R中已获得富集分析的结果ego。</p>
+<h2 id="2-1-enrichplot包"><a href="#2-1-enrichplot包" class="headerlink" title="2.1. enrichplot包"></a>2.1. enrichplot包</h2><p>enrichplot包有几种可视化方法来解释富集结果，支持clusterProfiler获得的ORA和GSEA富集结果。</p>
+<h3 id="2-1-1-安装和载入"><a href="#2-1-1-安装和载入" class="headerlink" title="2.1.1. 安装和载入"></a>2.1.1. 安装和载入</h3><p>安装和载入enrichplot包</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">BiocManager<span class="operator">::</span>install<span class="punctuation">(</span><span class="string">&quot;enrichplot&quot;</span><span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>enrichplot<span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<h3 id="2-1-2-可视化包"><a href="#2-1-2-可视化包" class="headerlink" title="2.1.2. 可视化包"></a>2.1.2. 可视化包</h3><ul>
+<li>推荐dotplot或barplot可视化前10个GO Terms条目。</li>
+<li>推荐goplot有向无环图查看富集的GO Terms间的关系。</li>
+</ul>
+<ol>
+<li>可视化barplot —— 条形图<br>将富集分数（例如p 值）和基因计数或比率描述为条形高度和颜色。横轴为该GO term下的差异基因个数，纵轴为富集到的GO Terms的描述信息， showCategory指定展示的GO Terms的个数为20个，默认展示显著富集的top10个，即p.adjust最小的10个。</li>
+</ol>
+<p><code>barplot(ego, showCategory=20, title=&quot;EnrichmentGO_MF&quot;)</code></p>
+<p>使用mutate导出的其他变量也可以用作条形高度或颜色。</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">mutate<span class="punctuation">(</span>ego<span class="punctuation">,</span> qscore <span class="operator">=</span> <span class="operator">-</span><span class="built_in">log</span><span class="punctuation">(</span>p.adjust<span class="punctuation">,</span> base<span class="operator">=</span><span class="number">10</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="operator">%&gt;%</span> </span><br><span class="line">    barplot<span class="punctuation">(</span>x<span class="operator">=</span><span class="string">&quot;qscore&quot;</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Barplot-1.png" title="Bar plot of enriched terms" width="90%"/>
+
+<p><strong><p align="center">Figure 1. Bar plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="2">
+<li>可视化dotplot —— 点阵图<br><code>dotplot(edo, showCategory=30) + ggtitle(&quot;dotplot for ORA&quot;)</code></li>
+</ol>
+<p><code>dotplot(edo2, showCategory=30) + ggtitle(&quot;dotplot for GSEA&quot;)</code></p>
+<p>散点图，横坐标为GeneRatio，纵坐标为富集到的GO Terms的描述信息，showCategory指定展示的GO Terms的个数，默认展示显著富集的top10个，即p.adjust最小的10个。</p>
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Dotplotcap-1.png" title="Dot plot of enriched terms" width="90%"/>
+
+<p><strong><p align="center">Figure 2. Dot plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="3">
+<li>可视化cnetplot —— 类别网络图<br>cnetplot 将基因和生物学概念（例如 GO 术语或 KEGG 通路）的联系描述为一个网络（有助于查看哪些基因涉及富集通路和可能属于多个注释类别的基因）。对于基因和富集的GO terms之间的对应关系进行展示，如果一个基因位于一个GO Terms下，则将该基因与GO连线。图中灰色的点代表基因，黄色的点代表富集到的GO terms, 默认画top5富集到的GO terms, GO 节点的大小对应富集到的基因个数。</li>
+</ol>
+<p><code>cnetplot(ego, categorySize = &quot;pvalue&quot;, foldChange = gene_list</code></p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line"><span class="comment">## convert gene ID to Symbol</span></span><br><span class="line">edox <span class="operator">&lt;-</span> setReadable<span class="punctuation">(</span>ego<span class="punctuation">,</span> <span class="string">&#x27;org.Hs.eg.db&#x27;</span><span class="punctuation">,</span> <span class="string">&#x27;ENTREZID&#x27;</span><span class="punctuation">)</span></span><br><span class="line">p1 <span class="operator">&lt;-</span> cnetplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">)</span></span><br><span class="line"><span class="comment">## categorySize can be scaled by &#x27;pvalue&#x27; or &#x27;geneNum&#x27;</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> cnetplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> categorySize<span class="operator">=</span><span class="string">&quot;pvalue&quot;</span><span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">)</span></span><br><span class="line">p3 <span class="operator">&lt;-</span> cnetplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">,</span> circular <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span> colorEdge <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">)</span> </span><br><span class="line">cowplot<span class="operator">::</span>plot_grid<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> p3<span class="punctuation">,</span> ncol<span class="operator">=</span><span class="number">3</span><span class="punctuation">,</span> labels<span class="operator">=</span><span class="built_in">LETTERS</span><span class="punctuation">[</span><span class="number">1</span><span class="operator">:</span><span class="number">3</span><span class="punctuation">]</span><span class="punctuation">,</span> rel_widths<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">.8</span><span class="punctuation">,</span> <span class="number">.8</span><span class="punctuation">,</span> <span class="number">1.2</span><span class="punctuation">)</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Networkplot-1.png" title="Network plot of enriched terms" width="90%"/>
+
+<p><strong><p align="center">Figure 3. Network plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="4">
+<li>可视化heatplot —— 类热图功能分类<br>同样使用edox。<br>heatplot类似cnetplot，而显示为热图的关系。<br>如果用户想要显示大量重要术语，那么类别网络图可能会过于复杂。在heatplot能够简化结果和更容易识别的表达模式。</li>
+</ol>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">p1 <span class="operator">&lt;-</span> heatplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> showCategory<span class="operator">=</span><span class="number">5</span><span class="punctuation">)</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> heatplot<span class="punctuation">(</span>edox<span class="punctuation">,</span> foldChange<span class="operator">=</span>geneList<span class="punctuation">,</span> showCategory<span class="operator">=</span><span class="number">5</span><span class="punctuation">)</span></span><br><span class="line">cowplot<span class="operator">::</span>plot_grid<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> ncol<span class="operator">=</span><span class="number">1</span><span class="punctuation">,</span> labels<span class="operator">=</span><span class="built_in">LETTERS</span><span class="punctuation">[</span><span class="number">1</span><span class="operator">:</span><span class="number">2</span><span class="punctuation">]</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Heatplot-1.png" title="Heatmap plot of enriched terms" width="90%"/>
+
+<p><strong><p align="center">Figure 4. Heatmap plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="5">
+<li>可视化treeplot —— 树状图<br>treeplot()函数执行丰富术语的层次聚类。它依赖于pairwise_termsim()函数计算的丰富项的成对相似性，默认情况下使用 Jaccard 的相似性指数 (JC)。如果支持，用户还可以使用语义相似度值（例如，GO、DO和MeSH）。</li>
+</ol>
+<p>默认聚合方法treeplot()是ward.D，用户可以通过hclust_method参数指定其他方法（例如，’average’、’complete’、’median’、’centroid’等。</p>
+<p>treeplot()函数会将树切割成几个子树（由nCluster参数指定（默认为 5））并使用高频词标记子树。</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">edox2 <span class="operator">&lt;-</span> pairwise_termsim<span class="punctuation">(</span>edox<span class="punctuation">)</span></span><br><span class="line">p1 <span class="operator">&lt;-</span> treeplot<span class="punctuation">(</span>edox2<span class="punctuation">)</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> treeplot<span class="punctuation">(</span>edox2<span class="punctuation">,</span> hclust_method <span class="operator">=</span> <span class="string">&quot;average&quot;</span><span class="punctuation">)</span></span><br><span class="line">aplot<span class="operator">::</span>plot_list<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> tag_levels<span class="operator">=</span><span class="string">&#x27;A&#x27;</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/treeplot-1.png" title="Tree plot of enriched terms" width="90%"/>
+
+<p><strong><p align="center">Figure 5. Tree plot of enriched terms</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="6">
+<li>可视化emapplot —— 富集图<br>对于富集到的GO terms之间的基因重叠关系进行展示，如果两个GO terms系的差异基因存在重叠，说明这两个节点存在overlap关系，在图中用线条连接起来。每个节点是一个富集到的GO term, 默认画top30个富集到的GO terms, 节点大小对应该GO terms下富集到的差异基因个数，节点的颜色对应p.adjust的值，从小到大，对应蓝色到红色。</li>
+</ol>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">ego2 <span class="operator">&lt;-</span> pairwise_termsim<span class="punctuation">(</span>ego<span class="punctuation">)</span></span><br><span class="line">p1 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">)</span></span><br><span class="line">p2 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">,</span> cex_category<span class="operator">=</span><span class="number">1.5</span><span class="punctuation">)</span></span><br><span class="line">p3 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">,</span> layout<span class="operator">=</span><span class="string">&quot;kk&quot;</span><span class="punctuation">)</span></span><br><span class="line">p4 <span class="operator">&lt;-</span> emapplot<span class="punctuation">(</span>ego2<span class="punctuation">,</span> cex_category<span class="operator">=</span><span class="number">1.5</span><span class="punctuation">,</span>layout<span class="operator">=</span><span class="string">&quot;kk&quot;</span><span class="punctuation">)</span> </span><br><span class="line">cowplot<span class="operator">::</span>plot_grid<span class="punctuation">(</span>p1<span class="punctuation">,</span> p2<span class="punctuation">,</span> p3<span class="punctuation">,</span> p4<span class="punctuation">,</span> ncol<span class="operator">=</span><span class="number">2</span><span class="punctuation">,</span> labels<span class="operator">=</span><span class="built_in">LETTERS</span><span class="punctuation">[</span><span class="number">1</span><span class="operator">:</span><span class="number">4</span><span class="punctuation">]</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/Enrichment-1.png" title="Plot for results obtained from hypergeometric test and gene set enrichment analysis" width="90%"/>
+
+<p><strong><p align="center">Figure 6. Plot for results obtained from hypergeometric test and gene set enrichment analysis. default (A), cex_category&#x3D;1.5 (B), layout&#x3D;”kk” (C) and cex_category&#x3D;1.5,layout&#x3D;”kk” (D).</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="7">
+<li>可视化upsetplot —— upset图<br>upsetplot是cnetplot可视化基因和基因集之间复杂关联的替代方法。它强调不同基因集之间的基因重叠。</li>
+</ol>
+<p><code>upsetplot(ego)</code></p>
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/upsetORA-1.png" title=" Upsetplot for over-representation analysis" width="90%"/>
+
+<p><strong><p align="center">Figure 7. Upsetplot for over-representation analysis.</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<ol start="8">
+<li>可视化ridgeplot —— 脊线图<br>ridgeplot将可视化核心富集基因的表达分布为GSEA富集类别。它帮助用户解释上调&#x2F;下调的途径。</li>
+</ol>
+<p><code>ridgeplot(ego)</code></p>
+<img src="http://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/ridgeplot-1.png" title=" Ridgeplot for gene set enrichment analysis" width="90%"/>
+
+<p><strong><p align="center">Figure 8. Ridgeplot for gene set enrichment analysis.</strong><br>from <a href="http://yulab-smu.top/biomedical-knowledge-mining-book/enrichplot.html">clusterProfiler book</a></p></p>
+<h2 id="2-2-可视化plotGOgraph-x2F-goplot-——-有向无环图"><a href="#2-2-可视化plotGOgraph-x2F-goplot-——-有向无环图" class="headerlink" title="2.2. 可视化plotGOgraph&#x2F;goplot —— 有向无环图"></a>2.2. 可视化plotGOgraph&#x2F;goplot —— 有向无环图</h2><ol>
+<li><code>plotGOgraph(ego, firstSigNodes=10)</code></li>
+</ol>
+<ul>
+<li>有向无环图(Directed acyclic graph, DAG)，矩形代表富集到的top10个GO Terms，颜色从黄到红，对应p值从大到小。和<a href="https://yanzhongsino.github.io/2021/11/13/bioinfo_GSEA_topGO/">topGO做富集分析</a>的DAG图一样。</li>
+</ul>
+<p>当enrichGO富集分析时ont参数选了ALL时，结果文件会在第一列前增加一列ONTOLOGY为子类，这时直接用于plotGOgraph画图会报错。<br><strong>试了下，下面两种方案还是会报错Error in if (!ont %in% c(“BP”, “MF”, “CC”)) { :argument is of length zero。</strong>。还是尽量在enrichGO分析时就用ont&#x3D;”BP”吧。</p>
+<ul>
+<li>可以在结果文件中筛选出特定子类(比如BP)的结果行，并删除第一列ONTOLOGY后保存文件，再读进R用于plotGOgraph画图。</li>
+<li>也可以在R内用命令<code>ego2&lt;-ego%&gt;%filter(ONTOLOGY== &quot;BP&quot;)</code>筛选BP子类，接着用<code>ego3&lt;-ego2%&gt;%select(!ONTOLOGY)</code>或者<code>ego3&lt;-ego2[,-1]</code>删除第一列(即ONTOLOGY列)，然后用<code>plotGOgraph(ego3)</code>作图。</li>
+</ul>
+<img src="http://guangchuangyu.github.io/blog_images/Bioconductor/clusterProfiler/2016_GO_analysis_using_clusterProfiler_files/figure-markdown_strict/unnamed-chunk-7-4.png" title=" DAG图" width="90%"/>
+
+<p><strong><p align="center">Figure 9. DAG图</strong><br>from <a href="https://guangchuangyu.github.io/2016/01/go-analysis-using-clusterprofiler/">clusterProfiler blog</a></p></p>
+<ol start="2">
+<li><code>goplot(ego, showCategory = 10)</code></li>
+</ol>
+<ul>
+<li>igraph布局方式的有向无环图</li>
+</ul>
+<img src="https://yulab-smu.top/biomedical-knowledge-mining-book/biomedicalKnowledge_files/figure-html/goplot-1.png" title=" goplot的DAG图" width="90%"/>
+
+<p><strong><p align="center">Figure 10. goplot的DAG图</strong><br>from <a href="https://yulab-smu.top/biomedical-knowledge-mining-book/clusterprofiler-go.html">clusterProfiler book</a></p></p>
+<h2 id="2-3-可视化-——-wordcloud"><a href="#2-3-可视化-——-wordcloud" class="headerlink" title="2.3. 可视化 —— wordcloud"></a>2.3. 可视化 —— wordcloud</h2><p>词云的方式显示结果</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">install.packages<span class="punctuation">(</span><span class="string">&quot;wordcloud&quot;</span><span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>wordcloud<span class="punctuation">)</span></span><br><span class="line">wcdf <span class="operator">&lt;-</span> read.table<span class="punctuation">(</span>text <span class="operator">=</span> ego<span class="operator">$</span>GeneRatio<span class="punctuation">,</span> sep <span class="operator">=</span> <span class="string">&quot;/&quot;</span><span class="punctuation">)</span><span class="punctuation">[</span><span class="number">1</span><span class="punctuation">]</span></span><br><span class="line">wcdf<span class="operator">$</span>term <span class="operator">&lt;-</span>  ego<span class="punctuation">[</span><span class="punctuation">,</span><span class="number">2</span><span class="punctuation">]</span></span><br><span class="line">wordcloud<span class="punctuation">(</span>words <span class="operator">=</span> wcdf<span class="operator">$</span>term<span class="punctuation">,</span> freq <span class="operator">=</span> wcdf<span class="operator">$</span>V1<span class="punctuation">,</span> scale<span class="operator">=</span><span class="punctuation">(</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">4</span><span class="punctuation">,</span> <span class="number">.1</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">,</span> colors<span class="operator">=</span>brewer.pal<span class="punctuation">(</span><span class="number">8</span><span class="punctuation">,</span> <span class="string">&quot;Dark2&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span> max.words <span class="operator">=</span> <span class="number">25</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
+
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/images/bioinfo_GSEA_clusterProfiler_wordcloud.png?raw=true" title="wordcloud词云图" width="60%"/>
+
+<p><strong><p align="center">Figure 11. wordcloud词云图</strong><br>from <a href="https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/">NGS Analysis ebook</a></p></p>
+<h1 id="3-导出可视化结果"><a href="#3-导出可视化结果" class="headerlink" title="3. 导出可视化结果"></a>3. 导出可视化结果</h1><ol>
+<li>Rstudio</li>
+</ol>
+<p>如果是在Rstudio中，可以直接看到绘图结果，导出需要的文件格式即可。</p>
+<ol start="2">
+<li>代码导出<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">pdf<span class="punctuation">(</span><span class="string">&quot;ego.pdf&quot;</span><span class="punctuation">)</span> <span class="comment">#如果保存png，就改成png(&quot;ego.png&quot;)</span></span><br><span class="line">ego_fig<span class="operator">&lt;-</span>barplot<span class="punctuation">(</span>x<span class="punctuation">)</span> <span class="comment">#画图函数</span></span><br><span class="line">print<span class="punctuation">(</span>ego_fig<span class="punctuation">)</span> <span class="comment">#画到pdf文件</span></span><br><span class="line">dev.off<span class="punctuation">(</span><span class="punctuation">)</span> <span class="comment">#关闭pdf画板</span></span><br></pre></td></tr></table></figure></li>
+</ol>
+<h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
+<li>clusterProfiler github：<a href="https://github.com/YuLab-SMU/clusterProfiler">https://github.com/YuLab-SMU/clusterProfiler</a></li>
 <li>clusterProfiler paper：<a href="https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00066-7?_returnURL=https://linkinghub.elsevier.com/retrieve/pii/S2666675821000667?showall=true">https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00066-7?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS2666675821000667%3Fshowall%3Dtrue</a></li>
+<li>clusterProfiler book：<a href="http://yulab-smu.top/biomedical-knowledge-mining-book/index.html">http://yulab-smu.top/biomedical-knowledge-mining-book/index.html</a></li>
+<li>clusterProfiler manual：<a href="https://bioconductor.org/packages/devel/bioc/manuals/clusterProfiler/man/clusterProfiler.pdf">https://bioconductor.org/packages/devel/bioc/manuals/clusterProfiler/man/clusterProfiler.pdf</a></li>
+<li>clusterProfiler ducumentation：<a href="https://guangchuangyu.github.io/software/clusterProfiler/documentation/">https://guangchuangyu.github.io/software/clusterProfiler/documentation/</a></li>
+<li>其他来源结果可视化：<a href="https://cloud.tencent.com/developer/article/1613815">https://cloud.tencent.com/developer/article/1613815</a></li>
+<li>wordcloud：<a href="https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/">https://learn.gencore.bio.nyu.edu/rna-seq-analysis/over-representation-analysis/</a></li>
 </ol>
 <hr>
 <ul>
 <li>欢迎关注微信公众号：<strong>生信技工</strong></li>
 <li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
 </ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>
+]]></content>
       <categories>
         <category>bioinfo</category>
         <category>enrichment</category>
@@ -2443,13 +2445,11 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
       <tags>
         <tag>gene set enrichment analysis</tag>
         <tag>GSEA</tag>
-        <tag>topGO</tag>
         <tag>enrichment analysis</tag>
         <tag>over representation analysis</tag>
         <tag>ORA</tag>
         <tag>clusterProfiler</tag>
-        <tag>KOBAS-i</tag>
-        <tag>GOEAST</tag>
+        <tag>visualization</tag>
       </tags>
   </entry>
   <entry>
@@ -2821,6 +2821,86 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>GFF3toolkit</tag>
       </tags>
   </entry>
+  <entry>
+    <title>软件mitogenomics用于线粒体基因组相关格式转换</title>
+    <url>/2022/06/30/bioinfo_fileformat_mitogenomics/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=27901965&auto=1&height=32"></iframe></div>
+
+<h1 id="mitogenomics简介"><a href="#mitogenomics简介" class="headerlink" title="mitogenomics简介"></a>mitogenomics简介</h1><ul>
+<li>无意中发现的一个软件。</li>
+<li>基于已有线粒体基因组序列和基因序列，通过比对获取注释tbl格式文件，所以只适用于线粒体的基因。</li>
+<li>包括两个转化格式的脚本mitos2fasta.py，aln2tbl.py（和python2版本）。</li>
+</ul>
+<h1 id="软件安装"><a href="#软件安装" class="headerlink" title="软件安装"></a>软件安装</h1><ol>
+<li><p>git下载<br><code>git clone https://github.com/IMEDEA/mitogenomics</code></p>
+</li>
+<li><p>脚本</p>
+</li>
+</ol>
+<ul>
+<li>因为软件是三个脚本组成，可以直接使用脚本。</li>
+</ul>
+<ol start="3">
+<li>依赖</li>
+</ol>
+<ul>
+<li>python3的Biopython和argparse模块。</li>
+<li>可以用pip安装<code>pip install biopython argparse</code>。</li>
+</ul>
+<h1 id="软件mitogenomics"><a href="#软件mitogenomics" class="headerlink" title="软件mitogenomics"></a>软件mitogenomics</h1><h2 id="脚本mitos2fasta-py"><a href="#脚本mitos2fasta-py" class="headerlink" title="脚本mitos2fasta.py"></a>脚本mitos2fasta.py</h2><p>python 3 版本，用于转化基因序列为比对到线粒体基因组序列的格式。</p>
+<ol>
+<li><p>命令<br><code>mitos2fasta.py -m mito.fa -g genes.fa -c Y &gt; assembly.fa</code></p>
+</li>
+<li><p>输入输出</p>
+</li>
+</ol>
+<ul>
+<li>-m mito.fa：线粒体基因组序列，fasta格式。</li>
+<li>-g genes.fa：基因序列，fasta格式。可以是软件MITOS2的输出。</li>
+<li>-c Y：是否简化基因名字（genes.fa文件的序列ID）并适应aln2tbl.py，Y&#x2F;N。</li>
+<li>assembly.fa：输出保存到assembly.fa，即将线粒体基因组序列和基因序列比对好的序列格式，基因没比对的位置用-代替。</li>
+</ul>
+<h2 id="aln2tbl-py"><a href="#aln2tbl-py" class="headerlink" title="aln2tbl.py"></a>aln2tbl.py</h2><p>python 3 版本，用于转化比对到线粒体基因组序列的基因序列（即mitos2fasta.py的输出）为tbl格式。</p>
+<p>aln2tbl-legacy.py是aln2tbl.py的python2版本，功能一样。</p>
+<ol>
+<li><p>命令<br><code>aln2tbl.py -f assembly.fa -g genes.txt -c 1 &gt; sample.tbl</code></p>
+</li>
+<li><p>输入输出</p>
+</li>
+</ol>
+<ul>
+<li>-f assembly.fa：输入文件是线粒体基因组和基因序列的比对文件，mitos2fasta.py的输出。</li>
+<li>-g genes.txt：保存了基因名称的文本文件，单行，多个基因名称间逗号分隔。</li>
+<li>-c number_genetic_code：用数字指定线粒体编码方式，植物线粒体是一般的编码方式 (1)。此外还有脊椎动物vertebrate (2), 酵母菌yeast (3), 霉菌mold, 原生动物protozoan and 腔肠动物coelenterate (4), 无脊椎动物invertebrate (5), 棘皮动物echinoderm and 扁形虫flatworm (9), 海鞘类ascidian (13)。</li>
+<li><blockquote>
+<p>sample.tbl：输出到tbl格式文件。</p>
+</blockquote>
+</li>
+</ul>
+<h1 id="references"><a href="#references" class="headerlink" title="references"></a>references</h1><ol>
+<li><a href="https://github.com/IMEDEA/mitogenomics">https://github.com/IMEDEA/mitogenomics</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>bioinfo</category>
+        <category>fileformat</category>
+        <category>mitogenome</category>
+      </categories>
+      <tags>
+        <tag>mitogenome</tag>
+        <tag>organelle</tag>
+        <tag>mitogenomics</tag>
+        <tag>aln2tbl.py</tag>
+        <tag>aln2tbl-legacy.py</tag>
+        <tag>mitos2fasta.py</tag>
+        <tag>tbl</tag>
+      </tags>
+  </entry>
   <entry>
     <title>转换GenBank文件为tbl格式，为提交注释做准备</title>
     <url>/2022/06/16/bioinfo_fileformat_gb2tbl/</url>
@@ -2956,8 +3036,8 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <category>fileformat</category>
       </categories>
       <tags>
-        <tag>GenBank</tag>
         <tag>tbl</tag>
+        <tag>GenBank</tag>
         <tag>organellar genome</tag>
         <tag>genome annotation</tag>
         <tag>genome submit</tag>
@@ -2969,86 +3049,6 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>Genbank2Sequin.py</tag>
       </tags>
   </entry>
-  <entry>
-    <title>软件mitogenomics用于线粒体基因组相关格式转换</title>
-    <url>/2022/06/30/bioinfo_fileformat_mitogenomics/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=27901965&auto=1&height=32"></iframe></div>
-
-<h1 id="mitogenomics简介"><a href="#mitogenomics简介" class="headerlink" title="mitogenomics简介"></a>mitogenomics简介</h1><ul>
-<li>无意中发现的一个软件。</li>
-<li>基于已有线粒体基因组序列和基因序列，通过比对获取注释tbl格式文件，所以只适用于线粒体的基因。</li>
-<li>包括两个转化格式的脚本mitos2fasta.py，aln2tbl.py（和python2版本）。</li>
-</ul>
-<h1 id="软件安装"><a href="#软件安装" class="headerlink" title="软件安装"></a>软件安装</h1><ol>
-<li><p>git下载<br><code>git clone https://github.com/IMEDEA/mitogenomics</code></p>
-</li>
-<li><p>脚本</p>
-</li>
-</ol>
-<ul>
-<li>因为软件是三个脚本组成，可以直接使用脚本。</li>
-</ul>
-<ol start="3">
-<li>依赖</li>
-</ol>
-<ul>
-<li>python3的Biopython和argparse模块。</li>
-<li>可以用pip安装<code>pip install biopython argparse</code>。</li>
-</ul>
-<h1 id="软件mitogenomics"><a href="#软件mitogenomics" class="headerlink" title="软件mitogenomics"></a>软件mitogenomics</h1><h2 id="脚本mitos2fasta-py"><a href="#脚本mitos2fasta-py" class="headerlink" title="脚本mitos2fasta.py"></a>脚本mitos2fasta.py</h2><p>python 3 版本，用于转化基因序列为比对到线粒体基因组序列的格式。</p>
-<ol>
-<li><p>命令<br><code>mitos2fasta.py -m mito.fa -g genes.fa -c Y &gt; assembly.fa</code></p>
-</li>
-<li><p>输入输出</p>
-</li>
-</ol>
-<ul>
-<li>-m mito.fa：线粒体基因组序列，fasta格式。</li>
-<li>-g genes.fa：基因序列，fasta格式。可以是软件MITOS2的输出。</li>
-<li>-c Y：是否简化基因名字（genes.fa文件的序列ID）并适应aln2tbl.py，Y&#x2F;N。</li>
-<li>assembly.fa：输出保存到assembly.fa，即将线粒体基因组序列和基因序列比对好的序列格式，基因没比对的位置用-代替。</li>
-</ul>
-<h2 id="aln2tbl-py"><a href="#aln2tbl-py" class="headerlink" title="aln2tbl.py"></a>aln2tbl.py</h2><p>python 3 版本，用于转化比对到线粒体基因组序列的基因序列（即mitos2fasta.py的输出）为tbl格式。</p>
-<p>aln2tbl-legacy.py是aln2tbl.py的python2版本，功能一样。</p>
-<ol>
-<li><p>命令<br><code>aln2tbl.py -f assembly.fa -g genes.txt -c 1 &gt; sample.tbl</code></p>
-</li>
-<li><p>输入输出</p>
-</li>
-</ol>
-<ul>
-<li>-f assembly.fa：输入文件是线粒体基因组和基因序列的比对文件，mitos2fasta.py的输出。</li>
-<li>-g genes.txt：保存了基因名称的文本文件，单行，多个基因名称间逗号分隔。</li>
-<li>-c number_genetic_code：用数字指定线粒体编码方式，植物线粒体是一般的编码方式 (1)。此外还有脊椎动物vertebrate (2), 酵母菌yeast (3), 霉菌mold, 原生动物protozoan and 腔肠动物coelenterate (4), 无脊椎动物invertebrate (5), 棘皮动物echinoderm and 扁形虫flatworm (9), 海鞘类ascidian (13)。</li>
-<li><blockquote>
-<p>sample.tbl：输出到tbl格式文件。</p>
-</blockquote>
-</li>
-</ul>
-<h1 id="references"><a href="#references" class="headerlink" title="references"></a>references</h1><ol>
-<li><a href="https://github.com/IMEDEA/mitogenomics">https://github.com/IMEDEA/mitogenomics</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>bioinfo</category>
-        <category>fileformat</category>
-        <category>mitogenome</category>
-      </categories>
-      <tags>
-        <tag>mitogenome</tag>
-        <tag>organelle</tag>
-        <tag>tbl</tag>
-        <tag>mitogenomics</tag>
-        <tag>aln2tbl.py</tag>
-        <tag>aln2tbl-legacy.py</tag>
-        <tag>mitos2fasta.py</tag>
-      </tags>
-  </entry>
   <entry>
     <title>分析基因家族扩张和收缩 —— CAFE5</title>
     <url>/2021/10/29/bioinfo_gene.family_CAFE5/</url>
@@ -4845,98 +4845,29 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
 </ol>
 <figure class="highlight r"><table><tr><td class="code"><pre><span class="line">list.files<span class="punctuation">(</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line">library<span class="punctuation">(</span>ggtree<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>treeio<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>ggplot2<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>ape<span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line">qc <span class="operator">&lt;-</span> read.tree<span class="punctuation">(</span><span class="string">&quot;RESULT.labeled.tre.qc&quot;</span><span class="punctuation">)</span></span><br><span class="line">qd <span class="operator">&lt;-</span> read.tree<span class="punctuation">(</span><span class="string">&quot;RESULT.labeled.tre.qd&quot;</span><span class="punctuation">)</span></span><br><span class="line">qi <span class="operator">&lt;-</span> read.tree<span class="punctuation">(</span><span class="string">&quot;RESULT.labeled.tre.qi&quot;</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"></span><br><span class="line"><span class="comment"># process node labels of above three labeled trees</span></span><br><span class="line"><span class="comment"># qc tree</span></span><br><span class="line">tree <span class="operator">&lt;-</span> qc</span><br><span class="line">tree<span class="operator">$</span>node.label <span class="operator">&lt;-</span> gsub<span class="punctuation">(</span><span class="string">&quot;qc=&quot;</span><span class="punctuation">,</span><span class="string">&quot;&quot;</span><span class="punctuation">,</span>tree<span class="operator">$</span>node.label<span class="punctuation">)</span></span><br><span class="line">View<span class="punctuation">(</span>tree<span class="operator">$</span>node.label<span class="punctuation">)</span></span><br><span class="line">write.tree<span class="punctuation">(</span>tree<span class="punctuation">,</span><span class="string">&quot;tree_qc.tre&quot;</span><span class="punctuation">)</span></span><br><span class="line"><span class="comment"># qd tree</span></span><br><span class="line">tree <span class="operator">&lt;-</span> qd</span><br><span class="line">tree<span class="operator">$</span>node.label <span class="operator">&lt;-</span> gsub<span class="punctuation">(</span><span class="string">&quot;qd=&quot;</span><span class="punctuation">,</span><span class="string">&quot;&quot;</span><span class="punctuation">,</span>tree<span class="operator">$</span>node.label<span class="punctuation">)</span></span><br><span class="line">View<span class="punctuation">(</span>tree<span class="operator">$</span>node.label<span class="punctuation">)</span></span><br><span class="line">write.tree<span class="punctuation">(</span>tree<span class="punctuation">,</span><span class="string">&quot;tree_qd.tre&quot;</span><span class="punctuation">)</span></span><br><span class="line"><span class="comment"># qi tree</span></span><br><span class="line">tree <span class="operator">&lt;-</span> qi</span><br><span class="line">tree<span class="operator">$</span>node.label <span class="operator">&lt;-</span> gsub<span class="punctuation">(</span><span class="string">&quot;qi=&quot;</span><span class="punctuation">,</span><span class="string">&quot;&quot;</span><span class="punctuation">,</span>tree<span class="operator">$</span>node.label<span class="punctuation">)</span></span><br><span class="line">View<span class="punctuation">(</span>tree<span class="operator">$</span>node.label<span class="punctuation">)</span></span><br><span class="line">write.tree<span class="punctuation">(</span>tree<span class="punctuation">,</span><span class="string">&quot;tree_qi.tre&quot;</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"></span><br><span class="line"><span class="comment"># read 3 modified tree files for QC/QD/QI</span></span><br><span class="line">tree_qc <span class="operator">&lt;-</span> read.newick<span class="punctuation">(</span><span class="string">&quot;tree_qc.tre&quot;</span><span class="punctuation">,</span> node.label<span class="operator">=</span><span class="string">&#x27;support&#x27;</span><span class="punctuation">)</span></span><br><span class="line">tree_qd <span class="operator">&lt;-</span> read.newick<span class="punctuation">(</span><span class="string">&quot;tree_qd.tre&quot;</span><span class="punctuation">,</span> node.label<span class="operator">=</span><span class="string">&#x27;support&#x27;</span><span class="punctuation">)</span></span><br><span class="line">tree_qi <span class="operator">&lt;-</span> read.newick<span class="punctuation">(</span><span class="string">&quot;tree_qi.tre&quot;</span><span class="punctuation">,</span> node.label<span class="operator">=</span><span class="string">&#x27;support&#x27;</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"></span><br><span class="line"><span class="comment"># add a customized label for internode or inter-branch, i.e., qc/qd/qI</span></span><br><span class="line">score_raw <span class="operator">=</span> paste<span class="punctuation">(</span>tree_qc<span class="operator">@</span>data<span class="operator">$</span>support<span class="punctuation">,</span><span class="string">&quot;/&quot;</span><span class="punctuation">,</span>tree_qd<span class="operator">@</span>data<span class="operator">$</span>support<span class="punctuation">,</span><span class="string">&quot;/&quot;</span><span class="punctuation">,</span>tree_qi<span class="operator">@</span>data<span class="operator">$</span>support<span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span></span><br><span class="line">score <span class="operator">=</span> gsub<span class="punctuation">(</span><span class="string">&quot;NA/NA/NA&quot;</span><span class="punctuation">,</span><span class="string">&quot;&quot;</span><span class="punctuation">,</span>score_raw<span class="punctuation">)</span></span><br><span class="line">score <span class="operator">=</span> gsub<span class="punctuation">(</span><span class="string">&quot;NA&quot;</span><span class="punctuation">,</span><span class="string">&quot;-&quot;</span><span class="punctuation">,</span>score<span class="punctuation">)</span></span><br><span class="line">View<span class="punctuation">(</span>score<span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"></span><br><span class="line"><span class="comment"># set labeled QC tree as the main plot tree</span></span><br><span class="line">tree <span class="operator">&lt;-</span> tree_qc</span><br><span class="line">tree<span class="operator">@</span>data<span class="operator">$</span>score <span class="operator">&lt;-</span> score</span><br><span class="line"></span><br><span class="line"></span><br><span class="line"><span class="comment">#####################################################</span></span><br><span class="line"><span class="comment"># Partitioning quartet concordance. QC values were divided into four categories and this</span></span><br><span class="line"><span class="comment"># information was used to color circle points. </span></span><br><span class="line"></span><br><span class="line"><span class="comment"># drop the internodes without QC vaule</span></span><br><span class="line">root <span class="operator">&lt;-</span> tree<span class="operator">@</span>data<span class="operator">$</span>node<span class="punctuation">[</span><span class="built_in">is.na</span><span class="punctuation">(</span>tree<span class="operator">@</span>data<span class="operator">$</span>support<span class="punctuation">)</span><span class="punctuation">]</span></span><br><span class="line"></span><br><span class="line">pdf<span class="punctuation">(</span>file<span class="operator">=</span><span class="string">&quot;00.treeQC_rect_circ.pdf&quot;</span><span class="punctuation">,</span> width <span class="operator">=</span> <span class="number">16</span><span class="punctuation">,</span> height <span class="operator">=</span> <span class="number">18</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"><span class="comment"># (1)color circle points</span></span><br><span class="line">ggtree<span class="punctuation">(</span>tree<span class="punctuation">,</span> size<span class="operator">=</span><span class="number">0.5</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  geom_tiplab<span class="punctuation">(</span>size<span class="operator">=</span><span class="number">2</span><span class="punctuation">)</span> <span class="operator">+</span> xlim<span class="punctuation">(</span><span class="number">0</span><span class="punctuation">,</span> <span class="number">0.12</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  geom_nodepoint<span class="punctuation">(</span>aes<span class="punctuation">(</span>subset<span class="operator">=</span><span class="operator">!</span>isTip <span class="operator">&amp;</span> node <span class="operator">!=</span> root<span class="punctuation">,</span> fill<span class="operator">=</span>cut<span class="punctuation">(</span>support<span class="punctuation">,</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="number">1</span><span class="punctuation">,</span> <span class="number">0.2</span><span class="punctuation">,</span> <span class="number">0</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">0.05</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">1</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                 shape<span class="operator">=</span><span class="number">21</span><span class="punctuation">,</span> size<span class="operator">=</span><span class="number">4</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  theme_tree<span class="punctuation">(</span>legend.position<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">0.9</span><span class="punctuation">,</span> <span class="number">0.18</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  scale_fill_manual<span class="punctuation">(</span>values<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;#2F4F4F&quot;</span><span class="punctuation">,</span> <span class="string">&quot;#98F898&quot;</span><span class="punctuation">,</span> <span class="string">&quot;#FFCC99&quot;</span><span class="punctuation">,</span><span class="string">&quot;#FF6600&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                    guide<span class="operator">=</span><span class="string">&quot;legend&quot;</span><span class="punctuation">,</span> name<span class="operator">=</span><span class="string">&quot;Quartet Concordance(QC)&quot;</span><span class="punctuation">,</span></span><br><span class="line">                    breaks<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;(0.2,1]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(0,0.2]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(-0.05,0]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(-1,-0.05]&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                    labels<span class="operator">=</span><span class="built_in">expression</span><span class="punctuation">(</span>QC<span class="operator">&gt;</span><span class="number">0.2</span><span class="punctuation">,</span> <span class="number">0</span> <span class="operator">&lt;</span> QC <span class="operator">*</span> <span class="string">&quot; &lt;= 0.2&quot;</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">0.05</span> <span class="operator">&lt;</span> QC <span class="operator">*</span> <span class="string">&quot; &lt;= 0&quot;</span><span class="punctuation">,</span> QC <span class="operator">&lt;=</span> <span class="operator">-</span><span class="number">0.05</span><span class="punctuation">)</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"><span class="comment"># (2)color branch</span></span><br><span class="line">ggtree<span class="punctuation">(</span>tree<span class="punctuation">,</span> aes<span class="punctuation">(</span>color<span class="operator">=</span>cut<span class="punctuation">(</span>support<span class="punctuation">,</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="number">1</span><span class="punctuation">,</span> <span class="number">0.2</span><span class="punctuation">,</span> <span class="number">0</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">0.05</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">1</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">,</span> layout<span class="operator">=</span><span class="string">&quot;circular&quot;</span><span class="punctuation">,</span> size<span class="operator">=</span><span class="number">1</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  theme_tree<span class="punctuation">(</span>legend.position<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">0.85</span><span class="punctuation">,</span> <span class="number">0.24</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  scale_colour_manual<span class="punctuation">(</span>values<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;#2F4F4F&quot;</span><span class="punctuation">,</span> <span class="string">&quot;#98F898&quot;</span><span class="punctuation">,</span> <span class="string">&quot;#FFCC99&quot;</span><span class="punctuation">,</span><span class="string">&quot;#FF6600&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                      breaks<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;(0.2,1]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(0,0.2]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(-0.05,0]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(-1,-0.05]&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                      na.translate<span class="operator">=</span><span class="built_in">T</span><span class="punctuation">,</span> na.value<span class="operator">=</span><span class="string">&quot;gray&quot;</span><span class="punctuation">,</span></span><br><span class="line">                      guide<span class="operator">=</span><span class="string">&quot;legend&quot;</span><span class="punctuation">,</span> name<span class="operator">=</span><span class="string">&quot;Quartet Concordance(QC)&quot;</span><span class="punctuation">,</span></span><br><span class="line">                      labels<span class="operator">=</span><span class="built_in">expression</span><span class="punctuation">(</span>QC<span class="operator">&gt;</span><span class="number">0.2</span><span class="punctuation">,</span> <span class="number">0</span> <span class="operator">&lt;</span> QC <span class="operator">*</span> <span class="string">&quot; &lt;= 0.2&quot;</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">0.05</span> <span class="operator">&lt;</span> QC <span class="operator">*</span> <span class="string">&quot; &lt;= 0&quot;</span><span class="punctuation">,</span> QC <span class="operator">&lt;=</span> <span class="operator">-</span><span class="number">0.05</span><span class="punctuation">)</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line"><span class="comment"># (3)color circle points and label each internode with QC/QD/QI</span></span><br><span class="line">ggtree<span class="punctuation">(</span>tree<span class="punctuation">,</span> size<span class="operator">=</span><span class="number">0.5</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  geom_tiplab<span class="punctuation">(</span>size<span class="operator">=</span><span class="number">2</span><span class="punctuation">)</span> <span class="operator">+</span> xlim<span class="punctuation">(</span><span class="number">0</span><span class="punctuation">,</span> <span class="number">0.12</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  geom_nodepoint<span class="punctuation">(</span>aes<span class="punctuation">(</span>subset<span class="operator">=</span><span class="operator">!</span>isTip <span class="operator">&amp;</span> node <span class="operator">!=</span> root<span class="punctuation">,</span> fill<span class="operator">=</span>cut<span class="punctuation">(</span>support<span class="punctuation">,</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="number">1</span><span class="punctuation">,</span> <span class="number">0.2</span><span class="punctuation">,</span> <span class="number">0</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">0.05</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">1</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                 shape<span class="operator">=</span><span class="number">21</span><span class="punctuation">,</span> size<span class="operator">=</span><span class="number">4</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  theme_tree<span class="punctuation">(</span>legend.position<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="number">0.9</span><span class="punctuation">,</span> <span class="number">0.18</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="operator">+</span></span><br><span class="line">  scale_fill_manual<span class="punctuation">(</span>values<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;#2F4F4F&quot;</span><span class="punctuation">,</span> <span class="string">&quot;#98F898&quot;</span><span class="punctuation">,</span> <span class="string">&quot;#FFCC99&quot;</span><span class="punctuation">,</span><span class="string">&quot;#FF6600&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                    guide<span class="operator">=</span><span class="string">&quot;legend&quot;</span><span class="punctuation">,</span> name<span class="operator">=</span><span class="string">&quot;Quartet Concordance(QC)&quot;</span><span class="punctuation">,</span></span><br><span class="line">                    breaks<span class="operator">=</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;(0.2,1]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(0,0.2]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(-0.05,0]&quot;</span><span class="punctuation">,</span><span class="string">&quot;(-1,-0.05]&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span></span><br><span class="line">                    labels<span class="operator">=</span><span class="built_in">expression</span><span class="punctuation">(</span>QC<span class="operator">&gt;</span><span class="number">0.2</span><span class="punctuation">,</span> <span class="number">0</span> <span class="operator">&lt;</span> QC <span class="operator">*</span> <span class="string">&quot; &lt;= 0.2&quot;</span><span class="punctuation">,</span> <span class="operator">-</span><span class="number">0.05</span> <span class="operator">&lt;</span> QC <span class="operator">*</span> <span class="string">&quot; &lt;= 0&quot;</span><span class="punctuation">,</span> QC <span class="operator">&lt;=</span> <span class="operator">-</span><span class="number">0.05</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="operator">+</span></span><br><span class="line">  geom_text<span class="punctuation">(</span>aes<span class="punctuation">(</span>label<span class="operator">=</span>score<span class="punctuation">,</span> x<span class="operator">=</span>branch<span class="punctuation">)</span><span class="punctuation">,</span> size<span class="operator">=</span><span class="number">2</span><span class="punctuation">,</span> vjust<span class="operator">=</span><span class="operator">-</span><span class="number">.5</span><span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line">dev.off<span class="punctuation">(</span><span class="punctuation">)</span></span><br></pre></td></tr></table></figure>
 
-<h1 id="3-案例"><a href="#3-案例" class="headerlink" title="3. 案例"></a>3. 案例</h1><ul>
-<li>蜂斗草族的系统文章用到这个方法评估系统发育树的不一致：Out of chaos: Phylogenomics of Asian Sonerileae：<a href="https://www.sciencedirect.com/science/article/pii/S1055790322001944#b0290">https://www.sciencedirect.com/science/article/pii/S1055790322001944#b0290</a></li>
-</ul>
-<h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
-<li>Quartet Sampling软件github：<a href="https://github.com/fephyfofum/quartetsampling">https://github.com/fephyfofum/quartetsampling</a></li>
-<li>paper：<a href="https://bsapubs.onlinelibrary.wiley.com/doi/full/10.1002/ajb2.1016">https://bsapubs.onlinelibrary.wiley.com/doi/full/10.1002/ajb2.1016</a></li>
-<li><a href="https://github.com/ShuiyinLIU/QS_visualization">https://github.com/ShuiyinLIU/QS_visualization</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>bioinfo</category>
-        <category>phylogeny</category>
-      </categories>
-      <tags>
-        <tag>phylogeny</tag>
-        <tag>phylogenomics</tag>
-        <tag>phylogenetic discordance</tag>
-        <tag>Quartet Sampling</tag>
-      </tags>
-  </entry>
-  <entry>
-    <title>用R包castor的get_subtree_with_tips函数提取子树</title>
-    <url>/2023/03/13/bioinfo_phylogeny_castor_extract.subtrees/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=27646786&auto=1&height=32"></iframe></div>
-
-<h1 id="1-R包castor"><a href="#1-R包castor" class="headerlink" title="1. R包castor"></a>1. R包castor</h1><p>R包castor是一个可以对包含超百万类群（tips）的系统发育树进行操作的程序，功能包括修剪、重新定根、计算最近共同祖先、计算tips与树根的距离、计算成对距离等等。</p>
-<p>系统发育信号和平均性状深度（性状保守性）的计算，离散性状的祖先状态重建和隐藏性状预测，性状进化的模拟和拟合模型，拟合和模拟多样化模型，以Newick格式树的标定时间，比较树，读取和写入树。</p>
-<p>安装R包castor：<code>install.packages(&quot;castor&quot;)</code></p>
-<h1 id="2-R包castor的get-subtree-with-tips函数"><a href="#2-R包castor的get-subtree-with-tips函数" class="headerlink" title="2. R包castor的get_subtree_with_tips函数"></a>2. R包castor的get_subtree_with_tips函数</h1><p>R包castor的get_subtree_with_tips函数用于根据子集类群列表从一棵大树中提取子树。</p>
-<h2 id="2-1-介绍get-subtree-with-tips函数"><a href="#2-1-介绍get-subtree-with-tips函数" class="headerlink" title="2.1. 介绍get_subtree_with_tips函数"></a>2.1. 介绍get_subtree_with_tips函数</h2><ol>
-<li><p><code>get_subtree_with_tips(tree,only_tips=NULL,omit_tips=NULL,collapse_monofurcations = TRUE,force_keep_root = FALSE))</code></p>
-</li>
-<li><p>参数说明</p>
-</li>
-</ol>
-<ul>
-<li>tree : “phylo”类的有根树。假定根是唯一的节点，没有传入的边。</li>
-<li>only_tips : 列出要保留的提示名称的字符向量，或列出要保留的提示索引的整数向量（介于1和Ntips之间）。也可以为空。在树中找不到的filename_edges_strength中列出的提示将被悄悄忽略。</li>
-<li>omit_tips : 列出要忽略的提示名称的字符向量，或列出要忽略的提示索引的整数向量（介于1和Ntips之间）。也可以为空。在树中找不到的filename_edges_strength中列出的提示将被悄悄忽略。</li>
-<li>collapse_monofurcations : 指定是否应折叠（删除）剩余单个传出边缘的节点的逻辑。此类节点的传入和传出边缘将连接到单个边缘，连接节点的父级（或更早）和子级（或更高）。在这种情况下，返回的树将具有反映连接边的边长度。</li>
-<li>force_keep_root : 逻辑值，指定是否保留根，即使filename_points_covered_by_landmarks和子树的根只剩下一个子树。如果为FALSE和filename_points_covered_by_landmarks，则可以删除根，并且它的一个后代可以成为根。</li>
-</ul>
-<h2 id="2-2-get-subtree-with-tips函数的使用"><a href="#2-2-get-subtree-with-tips函数的使用" class="headerlink" title="2.2. get_subtree_with_tips函数的使用"></a>2.2. get_subtree_with_tips函数的使用</h2><ol>
-<li>输入</li>
-</ol>
-<ul>
-<li>species.tre：物种树</li>
-<li>subtree.list：待提取的类群名称列表，每个名称一行</li>
-</ul>
-<ol start="2">
-<li>提取子树</li>
-</ol>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>treeio<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>castor<span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line">tree<span class="operator">&lt;-</span>read.newick<span class="punctuation">(</span><span class="string">&quot;species.tre&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取物种树</span></span><br><span class="line">sub_list<span class="operator">&lt;-</span>scan<span class="punctuation">(</span><span class="string">&quot;subtree.list&quot;</span><span class="punctuation">,</span>what<span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取类群列表，保存为字符向量</span></span><br><span class="line">sub<span class="operator">&lt;-</span>get_subtree_with_tips<span class="punctuation">(</span>tree<span class="punctuation">,</span>only_tips <span class="operator">=</span> sub_list<span class="punctuation">)</span> <span class="comment"># 提取子树</span></span><br><span class="line">write.tree<span class="punctuation">(</span>sub<span class="operator">$</span>subtree<span class="punctuation">,</span>file<span class="operator">=</span><span class="string">&quot;species_subtree.tre&quot;</span><span class="punctuation">)</span> <span class="comment"># 把提取的子树写入species_subtree.tre文件，newick格式</span></span><br></pre></td></tr></table></figure>
-
-<h2 id="2-3-批量提取子树"><a href="#2-3-批量提取子树" class="headerlink" title="2.3. 批量提取子树"></a>2.3. 批量提取子树</h2><p>由于get_subtree_with_tips函数只接受单棵树的phylo数据类群作为输入，如果需要从multiphylo的多棵树中统一提取子集则需要借助get_subtrees.R脚本。</p>
-<ol>
-<li>批量提取</li>
-</ol>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>treeio<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>castor<span class="punctuation">)</span></span><br><span class="line">trees<span class="operator">&lt;-</span>read.newick<span class="punctuation">(</span><span class="string">&quot;genes.trees&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取多棵树的genes.trees文件，trees为multiphylo。</span></span><br><span class="line">sub_list<span class="operator">&lt;-</span>scan<span class="punctuation">(</span><span class="string">&quot;subtree.list&quot;</span><span class="punctuation">,</span>what<span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取类群列表，保存为字符向量</span></span><br><span class="line">source<span class="punctuation">(</span><span class="string">&quot;get_subtrees.R&quot;</span><span class="punctuation">)</span> <span class="comment"># 运行get_subtrees.R脚本，子树保存在genes_subtree.tre文件中</span></span><br></pre></td></tr></table></figure>
-
-<ol start="2">
-<li>get_subtrees.R脚本，这里设定共有2700棵树</li>
-</ol>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line"><span class="keyword">for</span> <span class="punctuation">(</span> i <span class="keyword">in</span> <span class="number">1</span><span class="operator">:</span><span class="number">2700</span><span class="punctuation">)</span> <span class="punctuation">&#123;</span></span><br><span class="line">   tree<span class="operator">&lt;-</span>trees<span class="punctuation">[[</span>i<span class="punctuation">]</span><span class="punctuation">]</span></span><br><span class="line">   sub<span class="operator">&lt;-</span>get_subtree_with_tips<span class="punctuation">(</span>tree<span class="punctuation">,</span>only_tips <span class="operator">=</span> sub_list<span class="punctuation">)</span></span><br><span class="line">   write.tree<span class="punctuation">(</span>sub<span class="operator">$</span>subtree<span class="punctuation">,</span>file<span class="operator">=</span><span class="string">&quot;genes_subtree.tre&quot;</span><span class="punctuation">,</span>append <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">)</span></span><br><span class="line"><span class="punctuation">&#125;</span></span><br></pre></td></tr></table></figure>
-
-<h1 id="3-提取后"><a href="#3-提取后" class="headerlink" title="3. 提取后"></a>3. 提取后</h1><p>提取子树生成的species_subtree.tre文件中的枝长有时会有<code>:NaN</code>符号，用子树跑PhyloNetworks的时候会报错<code>LoadError: Expected right parenthesis after left parenthesis 6 but readN</code>是因为识别不了NaN，需要把子树中的这个符号<code>:NaN</code>删除。</p>
-<p>建议用<code>sed -i -E &quot;s/:[0-9.Na]+//g&quot; species_subtree.tre</code>命令把枝长信息都删除。</p>
+<h1 id="3-案例"><a href="#3-案例" class="headerlink" title="3. 案例"></a>3. 案例</h1><ul>
+<li>蜂斗草族的系统文章用到这个方法评估系统发育树的不一致：Out of chaos: Phylogenomics of Asian Sonerileae：<a href="https://www.sciencedirect.com/science/article/pii/S1055790322001944#b0290">https://www.sciencedirect.com/science/article/pii/S1055790322001944#b0290</a></li>
+</ul>
 <h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
-<li>castor包的manual：<a href="https://cran.r-project.org/web/packages/castor/castor.pdf">https://cran.r-project.org/web/packages/castor/castor.pdf</a></li>
-<li>castor包的paper：<a href="https://academic.oup.com/bioinformatics/article/34/6/1053/4582279?login=true">https://academic.oup.com/bioinformatics/article/34/6/1053/4582279?login=true</a></li>
+<li>Quartet Sampling软件github：<a href="https://github.com/fephyfofum/quartetsampling">https://github.com/fephyfofum/quartetsampling</a></li>
+<li>paper：<a href="https://bsapubs.onlinelibrary.wiley.com/doi/full/10.1002/ajb2.1016">https://bsapubs.onlinelibrary.wiley.com/doi/full/10.1002/ajb2.1016</a></li>
+<li><a href="https://github.com/ShuiyinLIU/QS_visualization">https://github.com/ShuiyinLIU/QS_visualization</a></li>
 </ol>
 <hr>
 <ul>
 <li>欢迎关注微信公众号：<strong>生信技工</strong></li>
 <li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
 </ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=30% title="wechat_public_QRcode.png" align=center/>]]></content>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
       <categories>
         <category>bioinfo</category>
         <category>phylogeny</category>
       </categories>
       <tags>
-        <tag>R package</tag>
         <tag>phylogeny</tag>
-        <tag>evolutionary tree</tag>
-        <tag>castor</tag>
-        <tag>get_subtree_with_tips</tag>
+        <tag>phylogenomics</tag>
+        <tag>phylogenetic discordance</tag>
+        <tag>Quartet Sampling</tag>
       </tags>
   </entry>
   <entry>
@@ -5188,6 +5119,75 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>r8s</tag>
       </tags>
   </entry>
+  <entry>
+    <title>用R包castor的get_subtree_with_tips函数提取子树</title>
+    <url>/2023/03/13/bioinfo_phylogeny_castor_extract.subtrees/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=27646786&auto=1&height=32"></iframe></div>
+
+<h1 id="1-R包castor"><a href="#1-R包castor" class="headerlink" title="1. R包castor"></a>1. R包castor</h1><p>R包castor是一个可以对包含超百万类群（tips）的系统发育树进行操作的程序，功能包括修剪、重新定根、计算最近共同祖先、计算tips与树根的距离、计算成对距离等等。</p>
+<p>系统发育信号和平均性状深度（性状保守性）的计算，离散性状的祖先状态重建和隐藏性状预测，性状进化的模拟和拟合模型，拟合和模拟多样化模型，以Newick格式树的标定时间，比较树，读取和写入树。</p>
+<p>安装R包castor：<code>install.packages(&quot;castor&quot;)</code></p>
+<h1 id="2-R包castor的get-subtree-with-tips函数"><a href="#2-R包castor的get-subtree-with-tips函数" class="headerlink" title="2. R包castor的get_subtree_with_tips函数"></a>2. R包castor的get_subtree_with_tips函数</h1><p>R包castor的get_subtree_with_tips函数用于根据子集类群列表从一棵大树中提取子树。</p>
+<h2 id="2-1-介绍get-subtree-with-tips函数"><a href="#2-1-介绍get-subtree-with-tips函数" class="headerlink" title="2.1. 介绍get_subtree_with_tips函数"></a>2.1. 介绍get_subtree_with_tips函数</h2><ol>
+<li><p><code>get_subtree_with_tips(tree,only_tips=NULL,omit_tips=NULL,collapse_monofurcations = TRUE,force_keep_root = FALSE))</code></p>
+</li>
+<li><p>参数说明</p>
+</li>
+</ol>
+<ul>
+<li>tree : “phylo”类的有根树。假定根是唯一的节点，没有传入的边。</li>
+<li>only_tips : 列出要保留的提示名称的字符向量，或列出要保留的提示索引的整数向量（介于1和Ntips之间）。也可以为空。在树中找不到的filename_edges_strength中列出的提示将被悄悄忽略。</li>
+<li>omit_tips : 列出要忽略的提示名称的字符向量，或列出要忽略的提示索引的整数向量（介于1和Ntips之间）。也可以为空。在树中找不到的filename_edges_strength中列出的提示将被悄悄忽略。</li>
+<li>collapse_monofurcations : 指定是否应折叠（删除）剩余单个传出边缘的节点的逻辑。此类节点的传入和传出边缘将连接到单个边缘，连接节点的父级（或更早）和子级（或更高）。在这种情况下，返回的树将具有反映连接边的边长度。</li>
+<li>force_keep_root : 逻辑值，指定是否保留根，即使filename_points_covered_by_landmarks和子树的根只剩下一个子树。如果为FALSE和filename_points_covered_by_landmarks，则可以删除根，并且它的一个后代可以成为根。</li>
+</ul>
+<h2 id="2-2-get-subtree-with-tips函数的使用"><a href="#2-2-get-subtree-with-tips函数的使用" class="headerlink" title="2.2. get_subtree_with_tips函数的使用"></a>2.2. get_subtree_with_tips函数的使用</h2><ol>
+<li>输入</li>
+</ol>
+<ul>
+<li>species.tre：物种树</li>
+<li>subtree.list：待提取的类群名称列表，每个名称一行</li>
+</ul>
+<ol start="2">
+<li>提取子树</li>
+</ol>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>treeio<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>castor<span class="punctuation">)</span></span><br><span class="line"></span><br><span class="line">tree<span class="operator">&lt;-</span>read.newick<span class="punctuation">(</span><span class="string">&quot;species.tre&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取物种树</span></span><br><span class="line">sub_list<span class="operator">&lt;-</span>scan<span class="punctuation">(</span><span class="string">&quot;subtree.list&quot;</span><span class="punctuation">,</span>what<span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取类群列表，保存为字符向量</span></span><br><span class="line">sub<span class="operator">&lt;-</span>get_subtree_with_tips<span class="punctuation">(</span>tree<span class="punctuation">,</span>only_tips <span class="operator">=</span> sub_list<span class="punctuation">)</span> <span class="comment"># 提取子树</span></span><br><span class="line">write.tree<span class="punctuation">(</span>sub<span class="operator">$</span>subtree<span class="punctuation">,</span>file<span class="operator">=</span><span class="string">&quot;species_subtree.tre&quot;</span><span class="punctuation">)</span> <span class="comment"># 把提取的子树写入species_subtree.tre文件，newick格式</span></span><br></pre></td></tr></table></figure>
+
+<h2 id="2-3-批量提取子树"><a href="#2-3-批量提取子树" class="headerlink" title="2.3. 批量提取子树"></a>2.3. 批量提取子树</h2><p>由于get_subtree_with_tips函数只接受单棵树的phylo数据类群作为输入，如果需要从multiphylo的多棵树中统一提取子集则需要借助get_subtrees.R脚本。</p>
+<ol>
+<li>批量提取</li>
+</ol>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">library<span class="punctuation">(</span>treeio<span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>castor<span class="punctuation">)</span></span><br><span class="line">trees<span class="operator">&lt;-</span>read.newick<span class="punctuation">(</span><span class="string">&quot;genes.trees&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取多棵树的genes.trees文件，trees为multiphylo。</span></span><br><span class="line">sub_list<span class="operator">&lt;-</span>scan<span class="punctuation">(</span><span class="string">&quot;subtree.list&quot;</span><span class="punctuation">,</span>what<span class="operator">=</span><span class="string">&quot;&quot;</span><span class="punctuation">)</span> <span class="comment"># 读取类群列表，保存为字符向量</span></span><br><span class="line">source<span class="punctuation">(</span><span class="string">&quot;get_subtrees.R&quot;</span><span class="punctuation">)</span> <span class="comment"># 运行get_subtrees.R脚本，子树保存在genes_subtree.tre文件中</span></span><br></pre></td></tr></table></figure>
+
+<ol start="2">
+<li>get_subtrees.R脚本，这里设定共有2700棵树</li>
+</ol>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line"><span class="keyword">for</span> <span class="punctuation">(</span> i <span class="keyword">in</span> <span class="number">1</span><span class="operator">:</span><span class="number">2700</span><span class="punctuation">)</span> <span class="punctuation">&#123;</span></span><br><span class="line">   tree<span class="operator">&lt;-</span>trees<span class="punctuation">[[</span>i<span class="punctuation">]</span><span class="punctuation">]</span></span><br><span class="line">   sub<span class="operator">&lt;-</span>get_subtree_with_tips<span class="punctuation">(</span>tree<span class="punctuation">,</span>only_tips <span class="operator">=</span> sub_list<span class="punctuation">)</span></span><br><span class="line">   write.tree<span class="punctuation">(</span>sub<span class="operator">$</span>subtree<span class="punctuation">,</span>file<span class="operator">=</span><span class="string">&quot;genes_subtree.tre&quot;</span><span class="punctuation">,</span>append <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">)</span></span><br><span class="line"><span class="punctuation">&#125;</span></span><br></pre></td></tr></table></figure>
+
+<h1 id="3-提取后"><a href="#3-提取后" class="headerlink" title="3. 提取后"></a>3. 提取后</h1><p>提取子树生成的species_subtree.tre文件中的枝长有时会有<code>:NaN</code>符号，用子树跑PhyloNetworks的时候会报错<code>LoadError: Expected right parenthesis after left parenthesis 6 but readN</code>是因为识别不了NaN，需要把子树中的这个符号<code>:NaN</code>删除。</p>
+<p>建议用<code>sed -i -E &quot;s/:[0-9.Na]+//g&quot; species_subtree.tre</code>命令把枝长信息都删除。</p>
+<h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
+<li>castor包的manual：<a href="https://cran.r-project.org/web/packages/castor/castor.pdf">https://cran.r-project.org/web/packages/castor/castor.pdf</a></li>
+<li>castor包的paper：<a href="https://academic.oup.com/bioinformatics/article/34/6/1053/4582279?login=true">https://academic.oup.com/bioinformatics/article/34/6/1053/4582279?login=true</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=30% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>bioinfo</category>
+        <category>phylogeny</category>
+      </categories>
+      <tags>
+        <tag>R package</tag>
+        <tag>phylogeny</tag>
+        <tag>evolutionary tree</tag>
+        <tag>castor</tag>
+        <tag>get_subtree_with_tips</tag>
+      </tags>
+  </entry>
   <entry>
     <title>绘制进化树 —— R包treeio+ggtree</title>
     <url>/2022/01/24/bioinfo_phylogeny_ggtree/</url>
@@ -6414,10 +6414,10 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
       <tags>
         <tag>biosoft</tag>
         <tag>ggplot2</tag>
+        <tag>WGD</tag>
         <tag>Ks</tag>
         <tag>ParaAT</tag>
         <tag>KaKs_Calculator</tag>
-        <tag>WGD</tag>
         <tag>divergence time</tag>
         <tag>paml</tag>
         <tag>synteny</tag>
@@ -6559,6 +6559,177 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>jcvi</tag>
       </tags>
   </entry>
+  <entry>
+    <title>使用Rldeogram的ideogram函数画两物种的同线性图</title>
+    <url>/2022/08/03/bioinfo_synteny_plot_Rldeogram/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=20707476&auto=1&height=32"></iframe><music URL></div>
+
+<h1 id="1-使用Rldeogram的ideogram函数画两物种的共线性图"><a href="#1-使用Rldeogram的ideogram函数画两物种的共线性图" class="headerlink" title="1. 使用Rldeogram的ideogram函数画两物种的共线性图"></a>1. 使用Rldeogram的ideogram函数画两物种的共线性图</h1><h2 id="1-1-输入文件"><a href="#1-1-输入文件" class="headerlink" title="1.1. 输入文件"></a>1.1. 输入文件</h2><ol>
+<li>karyotype.txt</li>
+</ol>
+<ul>
+<li>Chr: 染色体号</li>
+<li>Start: 起始</li>
+<li>End: 终止</li>
+<li>fill: 染色体填充色</li>
+<li>species：物种名</li>
+<li>size: 物种名字体大小</li>
+<li>color: 物种名字体颜色</li>
+</ul>
+<p>文件示例：</p>
+<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line">Chr Start      End   fill species size  color</span><br><span class="line">1   1 23037639  FF8C00   Grape   12 252525</span><br><span class="line">2   1 18779884  FF8C00   Grape   12 252525</span><br><span class="line">3   1 17934068  FF8C00   Grape   12 252525</span><br><span class="line">4   1 17349521  FF8C00   Grape   12 252525</span><br><span class="line">1   1 22042719  4682B4   Populus   12 252525</span><br><span class="line">2   1 19858802  4682B4   Populus   12 252525</span><br><span class="line">3   1 19278319  4682B4   Populus   12 252525</span><br></pre></td></tr></table></figure>
+
+<ol start="2">
+<li>synteny.txt</li>
+</ol>
+<ul>
+<li>Species_1：物种1染色体号</li>
+<li>Start_1，End_1：物种1染色体区域位置</li>
+<li>Species_2：物种2染色体号</li>
+<li>Start_2，End_2：物种2染色体区域位置</li>
+</ul>
+<p>文件示例：</p>
+<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line">Species_1  Start_1    End_1 Species_2 Start_2   End_2   fill</span><br><span class="line">1   12226377    12267836    1   5900307 5827251 cccccc</span><br><span class="line">1  5635667 5667377 2 4459512  4393226 cccccc</span><br><span class="line">1   7916366 7945659 3 8618518   8486865 cccccc</span><br><span class="line">2   8214553 8242202 1 5964233  6027199 cccccc</span><br><span class="line">3  2330522 2356593 1 6224069  6138821 cccccc</span><br><span class="line">3  10861038    10886821    2  8099058 8011502 cccccc</span><br><span class="line">4  9487312    9540261    3  7657579 7701112 cccccc</span><br></pre></td></tr></table></figure>
+
+<h2 id="1-2-运行"><a href="#1-2-运行" class="headerlink" title="1.2. 运行"></a>1.2. 运行</h2><figure class="highlight r"><table><tr><td class="code"><pre><span class="line">install.packages<span class="punctuation">(</span><span class="string">&#x27;RIdeogram&#x27;</span><span class="punctuation">)</span> <span class="comment">#安装RIdeogram</span></span><br><span class="line">library<span class="punctuation">(</span><span class="string">&#x27;RIdeogram&#x27;</span><span class="punctuation">)</span> <span class="comment">#载入RIdeogram</span></span><br><span class="line">ka <span class="operator">&lt;-</span> read.table<span class="punctuation">(</span><span class="string">&quot;karyotype.txt&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;\t&quot;</span><span class="punctuation">,</span>header <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span>stringsAsFactors <span class="operator">=</span> <span class="built_in">F</span><span class="punctuation">)</span> <span class="comment">#读取karyotype.txt文件</span></span><br><span class="line">sy <span class="operator">&lt;-</span> read.table<span class="punctuation">(</span><span class="string">&quot;synteny.txt&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;\t&quot;</span><span class="punctuation">,</span>header <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span>stringsAsFactors <span class="operator">=</span> <span class="built_in">F</span><span class="punctuation">)</span> <span class="comment">#读取synteny.txt文件</span></span><br><span class="line">ideogram<span class="punctuation">(</span>karyotype <span class="operator">=</span> ka<span class="punctuation">,</span> synteny <span class="operator">=</span> sy<span class="punctuation">)</span> <span class="comment">#使用ideogram函数，生成chromosome.svg文件用于绘图</span></span><br><span class="line">convertSVG<span class="punctuation">(</span><span class="string">&quot;chromosome.svg&quot;</span><span class="punctuation">,</span> device <span class="operator">=</span> <span class="string">&quot;pdf&quot;</span><span class="punctuation">,</span>dpi<span class="operator">=</span><span class="number">1600</span><span class="punctuation">)</span> <span class="comment">#转化成chromosome.pdf文件，还可选择转化的格式：tiff，png，jpg，分辨率1600。</span></span><br></pre></td></tr></table></figure>
+
+<h2 id="1-3-结果"><a href="#1-3-结果" class="headerlink" title="1.3. 结果"></a>1.3. 结果</h2><p>结果如下图：</p>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/images/ideogram.png?raw=true" title="Rldeogram绘制的同线性图" width="80%" />
+
+<p><strong><p align="center">Figure 1. Rldeogram绘制的同线性图</p></strong></p>
+<h1 id="2-references"><a href="#2-references" class="headerlink" title="2. references"></a>2. references</h1><ol>
+<li><a href="https://www.jianshu.com/p/07ae1fe18071">https://www.jianshu.com/p/07ae1fe18071</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>bioinfo</category>
+        <category>synteny</category>
+        <category>plot</category>
+      </categories>
+      <tags>
+        <tag>R package</tag>
+        <tag>R</tag>
+        <tag>plot</tag>
+        <tag>synteny</tag>
+        <tag>Rldeogram</tag>
+        <tag>ideogram</tag>
+      </tags>
+  </entry>
+  <entry>
+    <title>转录因子（transcription factor，TF）基础及WGD后保留的TF分析</title>
+    <url>/2022/10/18/bioinfo_transcriptionFactor/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=105140&auto=1&height=32"></iframe></div>
+
+
+<h1 id="1-转录因子（transcription-factor）"><a href="#1-转录因子（transcription-factor）" class="headerlink" title="1. 转录因子（transcription factor）"></a>1. 转录因子（transcription factor）</h1><p>转录因子（transcription factor，TF）是一种蛋白质，它通过与特定DNA序列结合来控制遗传信息从DNA到信使RNA的转录速率。</p>
+<p>TFs 的功能是调节——打开和关闭——基因，以确保它们在所需的细胞中在正确的时间和正确的数量表达。TF 组以协调的方式发挥作用，在整个生命过程中指导细胞分裂、细胞生长和细胞死亡；胚胎发育过程中的细胞迁移和组织；并且间歇性地响应来自细胞外的信号，例如激素。人类基因组中有多达 1600 个 TF 。转录因子是蛋白质组和调节组的成员。</p>
+<h1 id="2-植物转录因子数据库PlantTFDB"><a href="#2-植物转录因子数据库PlantTFDB" class="headerlink" title="2. 植物转录因子数据库PlantTFDB"></a>2. 植物转录因子数据库PlantTFDB</h1><p>植物转录因子数据库PlantTFDB是北京大学生物信息学中心研发的数据库和网站，目前包括165个植物物种的转录因子。</p>
+<p>目前数据库已更新到v5.0，在网站<a href="http://planttfdb.gao-lab.org/index.php%E5%8F%AF%E4%BB%A5%E6%9F%A5%E7%9C%8B%E3%80%81%E4%B8%8B%E8%BD%BD%E5%92%8C%E4%BD%BF%E7%94%A8%E6%A4%8D%E7%89%A9%E8%BD%AC%E5%BD%95%E5%9B%A0%E5%AD%90%E6%95%B0%E6%8D%AE%E5%BA%93%E3%80%82">http://planttfdb.gao-lab.org/index.php可以查看、下载和使用植物转录因子数据库。</a></p>
+<p>网站的功能包括：</p>
+<ol>
+<li>上传核酸或蛋白质的fasta序列，在线做转录因子的注释。</li>
+<li>上传核酸或蛋白质的fasta序列，在线与数据库做blastx或blastp比对。</li>
+<li>下载特定植物的TF列表，CDS或蛋白质序列。</li>
+<li>查询特定TF和TF家族的功能描述。</li>
+</ol>
+<h1 id="3-转录因子相关分析"><a href="#3-转录因子相关分析" class="headerlink" title="3. 转录因子相关分析"></a>3. 转录因子相关分析</h1><p>转录因子分析可以应用的场景很多，这里介绍全基因组复制事件（WGD）后转录因子保留的分析。</p>
+<h2 id="3-1-WGD后保留TF的分析"><a href="#3-1-WGD后保留TF的分析" class="headerlink" title="3.1. WGD后保留TF的分析"></a>3.1. WGD后保留TF的分析</h2><h3 id="3-1-1-思路"><a href="#3-1-1-思路" class="headerlink" title="3.1.1. 思路"></a>3.1.1. 思路</h3><p>除了直接看WGD后保留的基因中包含了什么种类和多少数量的TF外，还可以通过利用转录因子数据库PlantTFDB来做WGD后保留的每种TF的保留模式的进一步分析。</p>
+<ol>
+<li>参考</li>
+</ol>
+<ul>
+<li>paper: <a href="https://www.sciencedirect.com/science/article/pii/S1674205219303594">https://www.sciencedirect.com/science/article/pii/S1674205219303594</a> 的 Retention Analysis of Transcription Factors部分。</li>
+<li>在博客<strong>鉴定全基因复制事件(WGD)后保留的复制基因</strong> <a href="https://yanzhongsino.github.io/2022/10/18/bioinfo_WGD_geneRetention/">https://yanzhongsino.github.io/2022/10/18/bioinfo_WGD_geneRetention/</a> 的基础上完成WGD后保留TF的分析</li>
+</ul>
+<ol start="2">
+<li>基本思路</li>
+</ol>
+<ul>
+<li>从PlantTFDB数据库下载已有物种（比如拟南芥）的TF家族，用下载的TF家族注释orthogroups。对每个WGD事件，确认每个TF家族的保留的orthogroups的数量。</li>
+<li>有些TF家族可能会被分到几个orthogroups，为了消除一个TF家族的orthogroups的大小不均的影响，文章通过标准化计算一个保留参数R值（retention value），R值用来反映WGD事件后每个TF的保留模式。</li>
+</ul>
+<ol start="3">
+<li>R值的计算公式：$$Rvalue&#x3D;(Rs⁄Ts)&#x2F;(Ra⁄Ta)&#x3D;Rs<em>Ta&#x2F;Ts</em>Ra$$，其中：</li>
+</ol>
+<ul>
+<li>Rs: Number of orthogroups with retention in specific TF</li>
+<li>Ts: Total number of orthogroups in specific TF</li>
+<li>Ra: Number of all TF orthogroups with retention</li>
+<li>Ta: Total number of TF orthogroups</li>
+<li>Rs&#x2F;Ts: 代表在WGD后特定TF家族保留的可能性</li>
+<li>Ra&#x2F;Ta: 代表在WGD后所有TF家族保留的可能性</li>
+<li>Rvalue: 用Rs&#x2F;Ts比上Ra&#x2F;Ta，代表相较TF家族平均水平，特定TF家族保留的可能性的高低。Rvalue越大，特定TF家族的保留率越高。</li>
+</ul>
+<h3 id="3-1-2-准备文件"><a href="#3-1-2-准备文件" class="headerlink" title="3.1.2. 准备文件"></a>3.1.2. 准备文件</h3><ol>
+<li>Orthogroups.txt</li>
+</ol>
+<ul>
+<li>Orthofinder的结果文件&#x2F;path&#x2F;to&#x2F;OrthoFinder&#x2F;Results_xx&#x2F;Orthogroups&#x2F;Orthogroups.txt</li>
+<li>Orthofinder运行时需要包含了下载TF的物种</li>
+</ul>
+<ol start="2">
+<li>dup_wgd.og</li>
+</ol>
+<ul>
+<li>dup_wgd.og包含了前期分析的基因复制的、涉及特定WGD保留的那些orthogroups的ID列表。</li>
+<li>可以从WGD后保留基因的分析的结果文件<code>N5_filter_OG_dup.tsv</code>中提取第二列来获取：<code>cat N5_filter_OG_dup.tsv|cut -f2 &gt;dup_wgd.og</code>。</li>
+</ul>
+<ol start="3">
+<li>下载Ath_TF_list.txt并转化成Ath_TF_list.og</li>
+</ol>
+<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cat Ath_TF_list.txt|sed &#x27;1d&#x27;|cut -f2 &gt;ath_2.tem # 提取第二列geneID</span><br><span class="line">cat Ath_TF_list.txt |sed &#x27;1d&#x27;|cut -f3|sort|uniq &gt;ath.tf # 提取第三列Family</span><br><span class="line">for i in $(cat ath_2.tem); do echo $i &gt;&gt;ath.og &amp;&amp; grep $i /path/to/OrthoFinder/Results_xx/Orthogroups/Orthogroups.txt|cut -d &quot;:&quot; -f1 &gt;&gt;ath.og ; done # 根据geneID提取orthogroups</span><br><span class="line">sed -i -e &#x27;1i\Gene_ID\torthogroups_ID&#x27; -e &quot;s/ /\t/g&quot; ath.og # 在ath.og文件首行前插入标题行，并把列间分隔的空格改成tab分隔。</span><br><span class="line">paste Ath_TF_list.txt ath.og &gt;Ath_TF_list.og # 横向拼接Ath_TF_list.txt和ath.og两个文件</span><br><span class="line">head Ath_TF_list.og &amp;&amp; tail Ath_TF_list.og # 检查一下首尾的第二列和第四列是不是一样，看有没有拼接错误</span><br></pre></td></tr></table></figure>
+
+<h3 id="3-1-3-统计R相关参数"><a href="#3-1-3-统计R相关参数" class="headerlink" title="3.1.3. 统计R相关参数"></a>3.1.3. 统计R相关参数</h3><ol>
+<li>这里的Ta、Ra、Ts、Rs可以用两种数量来代表，一种是统计TF_ID的数量，另一种是统计Orthogroups的数量。</li>
+</ol>
+<ul>
+<li>下面的是统计TF_ID的数量，如果想要统计Orthogroups的数量，则需要在每一个值统计命令<code>wc -l</code>前面加上<code>cut -f5|sort|uniq|</code>来提取Orthogroups并去重。</li>
+</ul>
+<ol start="2">
+<li>对每一个ath.tf里的Family，统计Ta,Ra,Rs和Ts值</li>
+</ol>
+<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">for i in $(cat ath.tf);</span><br><span class="line">do</span><br><span class="line">    ta = $(($(cat Ath_TF_list.ogs|wc -l)-1)) # 统计Ta值（有标题行，结果需要减1）</span><br><span class="line">    ra = $(grep -f dup_wgd.og Ath_TF_list.ogs|wc -l) # 统计Ra值</span><br><span class="line">	rs=$(grep -f dup_wgd.og Ath_TF_list.ogs |awk -v awka=&quot;$i&quot; &#x27;$3 == awka &#123;print$0&#125;&#x27;|wc -l);</span><br><span class="line">	ts=$(awk -v awka=&quot;$i&quot; &#x27;$3 == awka &#123;print $0&#125;&#x27; Ath_TF_list.ogs |wc -l);</span><br><span class="line">	echo &quot;$&#123;i&#125; $&#123;rs&#125; $&#123;ts&#125; $&#123;ra&#125; $&#123;ta&#125;&quot; &gt;&gt; ath_r.tem</span><br><span class="line">done</span><br></pre></td></tr></table></figure>
+
+<ol start="3">
+<li>有了Ta,Ra,Rs和Ts值，接下来就可以计算Rvalue&#x3D;(Rs⁄Ts)&#x2F;(Ra⁄Ta)了。</li>
+</ol>
+<ul>
+<li><code>cat ath_r.tem|sed &quot;s/ /\t/g&quot;|awk -F&quot;\t&quot; &#39;&#123;print $0,($1*$4)/($2*$3)&#125;&#39;|sed &#39;1i\TF\tRs\tTs\tRa\tTa\tRvalue&#39; &gt;ath_r.txt</code> 待检查是否有效</li>
+</ul>
+<h3 id="3-1-4-绘制热图"><a href="#3-1-4-绘制热图" class="headerlink" title="3.1.4. 绘制热图"></a>3.1.4. 绘制热图</h3><p>热图绘制可以参考博客<a href="https://yanzhongsino.github.io/2022/11/06/R_plot_heatmap">https://yanzhongsino.github.io/2022/11/06/R_plot_heatmap</a></p>
+<ul>
+<li>如果只有一次WGD的TF保留结果，可以直接根据Rvalue判断哪些TF家族保留率高。</li>
+<li>如果有多次WGD的TF保留结果，或者做了多个物种的TF数据库保留结果，可以绘制热图相互比较。</li>
+</ul>
+<p>用R包pheatmap绘制热图，简单快捷。(notes: 画热图这里的代码还需根据数据格式调整)</p>
+<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">df<span class="operator">&lt;-</span>read.table<span class="punctuation">(</span><span class="string">&quot;tf_rvalue.txt&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span> <span class="string">&quot; &quot;</span><span class="punctuation">,</span> header <span class="operator">=</span> <span class="built_in">T</span><span class="punctuation">,</span>row.names <span class="operator">=</span> <span class="number">1</span><span class="punctuation">)</span></span><br><span class="line">df_row <span class="operator">&lt;-</span> hclust<span class="punctuation">(</span>dist<span class="punctuation">(</span>df<span class="punctuation">)</span><span class="punctuation">)</span> <span class="comment">#对行聚类</span></span><br><span class="line">df <span class="operator">&lt;-</span> df<span class="punctuation">[</span>df_row<span class="operator">$</span>order<span class="punctuation">,</span><span class="punctuation">]</span> <span class="comment">#按行聚类结果排序</span></span><br><span class="line">df_column <span class="operator">&lt;-</span> hclust<span class="punctuation">(</span>dist<span class="punctuation">(</span>t<span class="punctuation">(</span>df<span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="comment">#对列聚类</span></span><br><span class="line">df <span class="operator">&lt;-</span> df<span class="punctuation">[</span><span class="punctuation">,</span>df_column<span class="operator">$</span>order<span class="punctuation">]</span> <span class="comment">#按列聚类结果排序</span></span><br><span class="line"></span><br><span class="line">BiocManager<span class="operator">::</span>install<span class="punctuation">(</span><span class="string">&quot;pheatmap&quot;</span><span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>pheatmap<span class="punctuation">)</span></span><br><span class="line">pheatmap<span class="punctuation">(</span>df<span class="punctuation">,</span>color <span class="operator">=</span> colorRampPalette<span class="punctuation">(</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;lightgreen&quot;</span><span class="punctuation">,</span> <span class="string">&quot;yellow&quot;</span><span class="punctuation">,</span><span class="string">&quot;orange&quot;</span><span class="punctuation">,</span><span class="string">&quot;red&quot;</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">(</span><span class="number">20</span><span class="punctuation">)</span><span class="punctuation">,</span>legend_breaks <span class="operator">=</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="number">1</span><span class="operator">:</span><span class="number">4</span><span class="punctuation">)</span><span class="punctuation">,</span> legend_labels <span class="operator">=</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;1.0&quot;</span><span class="punctuation">,</span><span class="string">&quot;2.0&quot;</span><span class="punctuation">,</span><span class="string">&quot;3.0&quot;</span><span class="punctuation">,</span><span class="string">&quot;4.0&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span> border_color<span class="operator">=</span><span class="string">&quot;white&quot;</span><span class="punctuation">,</span>treeheight_row <span class="operator">=</span> <span class="number">50</span><span class="punctuation">,</span> treeheight_col <span class="operator">=</span> <span class="number">8</span><span class="punctuation">,</span> display_numbers <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span> number_color <span class="operator">=</span> <span class="string">&quot;black&quot;</span><span class="punctuation">,</span>main <span class="operator">=</span> <span class="string">&quot;TF heatmap&quot;</span><span class="punctuation">,</span>cellwidth <span class="operator">=</span> <span class="number">50</span><span class="punctuation">,</span> cellheight <span class="operator">=</span> <span class="number">10</span><span class="punctuation">)</span></span><br><span class="line"><span class="comment"># 其中color = colorRampPalette(c(&quot;lightgreen&quot;, &quot;yellow&quot;,&quot;orange&quot;,&quot;red&quot;))(20) #设置颜色渐变，值从低到高依次是浅绿色-黄色-橙色-红色，共20个颜色。</span></span><br></pre></td></tr></table></figure>
+
+<h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
+<li>wiki:transcription factor: <a href="https://en.wikipedia.org/wiki/Transcription_factor">https://en.wikipedia.org/wiki/Transcription_factor</a></li>
+<li>PlantTFDB: <a href="http://planttfdb.gao-lab.org/index.php">http://planttfdb.gao-lab.org/index.php</a></li>
+<li>paper: <a href="https://www.sciencedirect.com/science/article/pii/S1674205219303594">https://www.sciencedirect.com/science/article/pii/S1674205219303594</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>bioinfo</category>
+        <category>transcription factor</category>
+      </categories>
+      <tags>
+        <tag>WGD</tag>
+        <tag>transcription factor</tag>
+        <tag>PlantTFDB</tag>
+      </tags>
+  </entry>
   <entry>
     <title>分析基因组共线性、计算Ks和鉴定WGD —— WGDI</title>
     <url>/2021/09/11/bioinfo_synteny_WGDI/</url>
@@ -6895,184 +7066,13 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
       </categories>
       <tags>
         <tag>biosoft</tag>
-        <tag>Ks</tag>
         <tag>WGD</tag>
+        <tag>Ks</tag>
         <tag>synteny</tag>
         <tag>colinearity</tag>
         <tag>WGDI</tag>
       </tags>
   </entry>
-  <entry>
-    <title>使用Rldeogram的ideogram函数画两物种的同线性图</title>
-    <url>/2022/08/03/bioinfo_synteny_plot_Rldeogram/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=20707476&auto=1&height=32"></iframe><music URL></div>
-
-<h1 id="1-使用Rldeogram的ideogram函数画两物种的共线性图"><a href="#1-使用Rldeogram的ideogram函数画两物种的共线性图" class="headerlink" title="1. 使用Rldeogram的ideogram函数画两物种的共线性图"></a>1. 使用Rldeogram的ideogram函数画两物种的共线性图</h1><h2 id="1-1-输入文件"><a href="#1-1-输入文件" class="headerlink" title="1.1. 输入文件"></a>1.1. 输入文件</h2><ol>
-<li>karyotype.txt</li>
-</ol>
-<ul>
-<li>Chr: 染色体号</li>
-<li>Start: 起始</li>
-<li>End: 终止</li>
-<li>fill: 染色体填充色</li>
-<li>species：物种名</li>
-<li>size: 物种名字体大小</li>
-<li>color: 物种名字体颜色</li>
-</ul>
-<p>文件示例：</p>
-<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line">Chr Start      End   fill species size  color</span><br><span class="line">1   1 23037639  FF8C00   Grape   12 252525</span><br><span class="line">2   1 18779884  FF8C00   Grape   12 252525</span><br><span class="line">3   1 17934068  FF8C00   Grape   12 252525</span><br><span class="line">4   1 17349521  FF8C00   Grape   12 252525</span><br><span class="line">1   1 22042719  4682B4   Populus   12 252525</span><br><span class="line">2   1 19858802  4682B4   Populus   12 252525</span><br><span class="line">3   1 19278319  4682B4   Populus   12 252525</span><br></pre></td></tr></table></figure>
-
-<ol start="2">
-<li>synteny.txt</li>
-</ol>
-<ul>
-<li>Species_1：物种1染色体号</li>
-<li>Start_1，End_1：物种1染色体区域位置</li>
-<li>Species_2：物种2染色体号</li>
-<li>Start_2，End_2：物种2染色体区域位置</li>
-</ul>
-<p>文件示例：</p>
-<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line">Species_1  Start_1    End_1 Species_2 Start_2   End_2   fill</span><br><span class="line">1   12226377    12267836    1   5900307 5827251 cccccc</span><br><span class="line">1  5635667 5667377 2 4459512  4393226 cccccc</span><br><span class="line">1   7916366 7945659 3 8618518   8486865 cccccc</span><br><span class="line">2   8214553 8242202 1 5964233  6027199 cccccc</span><br><span class="line">3  2330522 2356593 1 6224069  6138821 cccccc</span><br><span class="line">3  10861038    10886821    2  8099058 8011502 cccccc</span><br><span class="line">4  9487312    9540261    3  7657579 7701112 cccccc</span><br></pre></td></tr></table></figure>
-
-<h2 id="1-2-运行"><a href="#1-2-运行" class="headerlink" title="1.2. 运行"></a>1.2. 运行</h2><figure class="highlight r"><table><tr><td class="code"><pre><span class="line">install.packages<span class="punctuation">(</span><span class="string">&#x27;RIdeogram&#x27;</span><span class="punctuation">)</span> <span class="comment">#安装RIdeogram</span></span><br><span class="line">library<span class="punctuation">(</span><span class="string">&#x27;RIdeogram&#x27;</span><span class="punctuation">)</span> <span class="comment">#载入RIdeogram</span></span><br><span class="line">ka <span class="operator">&lt;-</span> read.table<span class="punctuation">(</span><span class="string">&quot;karyotype.txt&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;\t&quot;</span><span class="punctuation">,</span>header <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span>stringsAsFactors <span class="operator">=</span> <span class="built_in">F</span><span class="punctuation">)</span> <span class="comment">#读取karyotype.txt文件</span></span><br><span class="line">sy <span class="operator">&lt;-</span> read.table<span class="punctuation">(</span><span class="string">&quot;synteny.txt&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span><span class="string">&quot;\t&quot;</span><span class="punctuation">,</span>header <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span>stringsAsFactors <span class="operator">=</span> <span class="built_in">F</span><span class="punctuation">)</span> <span class="comment">#读取synteny.txt文件</span></span><br><span class="line">ideogram<span class="punctuation">(</span>karyotype <span class="operator">=</span> ka<span class="punctuation">,</span> synteny <span class="operator">=</span> sy<span class="punctuation">)</span> <span class="comment">#使用ideogram函数，生成chromosome.svg文件用于绘图</span></span><br><span class="line">convertSVG<span class="punctuation">(</span><span class="string">&quot;chromosome.svg&quot;</span><span class="punctuation">,</span> device <span class="operator">=</span> <span class="string">&quot;pdf&quot;</span><span class="punctuation">,</span>dpi<span class="operator">=</span><span class="number">1600</span><span class="punctuation">)</span> <span class="comment">#转化成chromosome.pdf文件，还可选择转化的格式：tiff，png，jpg，分辨率1600。</span></span><br></pre></td></tr></table></figure>
-
-<h2 id="1-3-结果"><a href="#1-3-结果" class="headerlink" title="1.3. 结果"></a>1.3. 结果</h2><p>结果如下图：</p>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/images/ideogram.png?raw=true" title="Rldeogram绘制的同线性图" width="80%" />
-
-<p><strong><p align="center">Figure 1. Rldeogram绘制的同线性图</p></strong></p>
-<h1 id="2-references"><a href="#2-references" class="headerlink" title="2. references"></a>2. references</h1><ol>
-<li><a href="https://www.jianshu.com/p/07ae1fe18071">https://www.jianshu.com/p/07ae1fe18071</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>bioinfo</category>
-        <category>synteny</category>
-        <category>plot</category>
-      </categories>
-      <tags>
-        <tag>R package</tag>
-        <tag>R</tag>
-        <tag>plot</tag>
-        <tag>synteny</tag>
-        <tag>Rldeogram</tag>
-        <tag>ideogram</tag>
-      </tags>
-  </entry>
-  <entry>
-    <title>转录因子（transcription factor，TF）基础及WGD后保留的TF分析</title>
-    <url>/2022/10/18/bioinfo_transcriptionFactor/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=105140&auto=1&height=32"></iframe></div>
-
-
-<h1 id="1-转录因子（transcription-factor）"><a href="#1-转录因子（transcription-factor）" class="headerlink" title="1. 转录因子（transcription factor）"></a>1. 转录因子（transcription factor）</h1><p>转录因子（transcription factor，TF）是一种蛋白质，它通过与特定DNA序列结合来控制遗传信息从DNA到信使RNA的转录速率。</p>
-<p>TFs 的功能是调节——打开和关闭——基因，以确保它们在所需的细胞中在正确的时间和正确的数量表达。TF 组以协调的方式发挥作用，在整个生命过程中指导细胞分裂、细胞生长和细胞死亡；胚胎发育过程中的细胞迁移和组织；并且间歇性地响应来自细胞外的信号，例如激素。人类基因组中有多达 1600 个 TF 。转录因子是蛋白质组和调节组的成员。</p>
-<h1 id="2-植物转录因子数据库PlantTFDB"><a href="#2-植物转录因子数据库PlantTFDB" class="headerlink" title="2. 植物转录因子数据库PlantTFDB"></a>2. 植物转录因子数据库PlantTFDB</h1><p>植物转录因子数据库PlantTFDB是北京大学生物信息学中心研发的数据库和网站，目前包括165个植物物种的转录因子。</p>
-<p>目前数据库已更新到v5.0，在网站<a href="http://planttfdb.gao-lab.org/index.php%E5%8F%AF%E4%BB%A5%E6%9F%A5%E7%9C%8B%E3%80%81%E4%B8%8B%E8%BD%BD%E5%92%8C%E4%BD%BF%E7%94%A8%E6%A4%8D%E7%89%A9%E8%BD%AC%E5%BD%95%E5%9B%A0%E5%AD%90%E6%95%B0%E6%8D%AE%E5%BA%93%E3%80%82">http://planttfdb.gao-lab.org/index.php可以查看、下载和使用植物转录因子数据库。</a></p>
-<p>网站的功能包括：</p>
-<ol>
-<li>上传核酸或蛋白质的fasta序列，在线做转录因子的注释。</li>
-<li>上传核酸或蛋白质的fasta序列，在线与数据库做blastx或blastp比对。</li>
-<li>下载特定植物的TF列表，CDS或蛋白质序列。</li>
-<li>查询特定TF和TF家族的功能描述。</li>
-</ol>
-<h1 id="3-转录因子相关分析"><a href="#3-转录因子相关分析" class="headerlink" title="3. 转录因子相关分析"></a>3. 转录因子相关分析</h1><p>转录因子分析可以应用的场景很多，这里介绍全基因组复制事件（WGD）后转录因子保留的分析。</p>
-<h2 id="3-1-WGD后保留TF的分析"><a href="#3-1-WGD后保留TF的分析" class="headerlink" title="3.1. WGD后保留TF的分析"></a>3.1. WGD后保留TF的分析</h2><h3 id="3-1-1-思路"><a href="#3-1-1-思路" class="headerlink" title="3.1.1. 思路"></a>3.1.1. 思路</h3><p>除了直接看WGD后保留的基因中包含了什么种类和多少数量的TF外，还可以通过利用转录因子数据库PlantTFDB来做WGD后保留的每种TF的保留模式的进一步分析。</p>
-<ol>
-<li>参考</li>
-</ol>
-<ul>
-<li>paper: <a href="https://www.sciencedirect.com/science/article/pii/S1674205219303594">https://www.sciencedirect.com/science/article/pii/S1674205219303594</a> 的 Retention Analysis of Transcription Factors部分。</li>
-<li>在博客<strong>鉴定全基因复制事件(WGD)后保留的复制基因</strong> <a href="https://yanzhongsino.github.io/2022/10/18/bioinfo_WGD_geneRetention/">https://yanzhongsino.github.io/2022/10/18/bioinfo_WGD_geneRetention/</a> 的基础上完成WGD后保留TF的分析</li>
-</ul>
-<ol start="2">
-<li>基本思路</li>
-</ol>
-<ul>
-<li>从PlantTFDB数据库下载已有物种（比如拟南芥）的TF家族，用下载的TF家族注释orthogroups。对每个WGD事件，确认每个TF家族的保留的orthogroups的数量。</li>
-<li>有些TF家族可能会被分到几个orthogroups，为了消除一个TF家族的orthogroups的大小不均的影响，文章通过标准化计算一个保留参数R值（retention value），R值用来反映WGD事件后每个TF的保留模式。</li>
-</ul>
-<ol start="3">
-<li>R值的计算公式：$$Rvalue&#x3D;(Rs⁄Ts)&#x2F;(Ra⁄Ta)&#x3D;Rs<em>Ta&#x2F;Ts</em>Ra$$，其中：</li>
-</ol>
-<ul>
-<li>Rs: Number of orthogroups with retention in specific TF</li>
-<li>Ts: Total number of orthogroups in specific TF</li>
-<li>Ra: Number of all TF orthogroups with retention</li>
-<li>Ta: Total number of TF orthogroups</li>
-<li>Rs&#x2F;Ts: 代表在WGD后特定TF家族保留的可能性</li>
-<li>Ra&#x2F;Ta: 代表在WGD后所有TF家族保留的可能性</li>
-<li>Rvalue: 用Rs&#x2F;Ts比上Ra&#x2F;Ta，代表相较TF家族平均水平，特定TF家族保留的可能性的高低。Rvalue越大，特定TF家族的保留率越高。</li>
-</ul>
-<h3 id="3-1-2-准备文件"><a href="#3-1-2-准备文件" class="headerlink" title="3.1.2. 准备文件"></a>3.1.2. 准备文件</h3><ol>
-<li>Orthogroups.txt</li>
-</ol>
-<ul>
-<li>Orthofinder的结果文件&#x2F;path&#x2F;to&#x2F;OrthoFinder&#x2F;Results_xx&#x2F;Orthogroups&#x2F;Orthogroups.txt</li>
-<li>Orthofinder运行时需要包含了下载TF的物种</li>
-</ul>
-<ol start="2">
-<li>dup_wgd.og</li>
-</ol>
-<ul>
-<li>dup_wgd.og包含了前期分析的基因复制的、涉及特定WGD保留的那些orthogroups的ID列表。</li>
-<li>可以从WGD后保留基因的分析的结果文件<code>N5_filter_OG_dup.tsv</code>中提取第二列来获取：<code>cat N5_filter_OG_dup.tsv|cut -f2 &gt;dup_wgd.og</code>。</li>
-</ul>
-<ol start="3">
-<li>下载Ath_TF_list.txt并转化成Ath_TF_list.og</li>
-</ol>
-<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">cat Ath_TF_list.txt|sed &#x27;1d&#x27;|cut -f2 &gt;ath_2.tem # 提取第二列geneID</span><br><span class="line">cat Ath_TF_list.txt |sed &#x27;1d&#x27;|cut -f3|sort|uniq &gt;ath.tf # 提取第三列Family</span><br><span class="line">for i in $(cat ath_2.tem); do echo $i &gt;&gt;ath.og &amp;&amp; grep $i /path/to/OrthoFinder/Results_xx/Orthogroups/Orthogroups.txt|cut -d &quot;:&quot; -f1 &gt;&gt;ath.og ; done # 根据geneID提取orthogroups</span><br><span class="line">sed -i -e &#x27;1i\Gene_ID\torthogroups_ID&#x27; -e &quot;s/ /\t/g&quot; ath.og # 在ath.og文件首行前插入标题行，并把列间分隔的空格改成tab分隔。</span><br><span class="line">paste Ath_TF_list.txt ath.og &gt;Ath_TF_list.og # 横向拼接Ath_TF_list.txt和ath.og两个文件</span><br><span class="line">head Ath_TF_list.og &amp;&amp; tail Ath_TF_list.og # 检查一下首尾的第二列和第四列是不是一样，看有没有拼接错误</span><br></pre></td></tr></table></figure>
-
-<h3 id="3-1-3-统计R相关参数"><a href="#3-1-3-统计R相关参数" class="headerlink" title="3.1.3. 统计R相关参数"></a>3.1.3. 统计R相关参数</h3><ol>
-<li>这里的Ta、Ra、Ts、Rs可以用两种数量来代表，一种是统计TF_ID的数量，另一种是统计Orthogroups的数量。</li>
-</ol>
-<ul>
-<li>下面的是统计TF_ID的数量，如果想要统计Orthogroups的数量，则需要在每一个值统计命令<code>wc -l</code>前面加上<code>cut -f5|sort|uniq|</code>来提取Orthogroups并去重。</li>
-</ul>
-<ol start="2">
-<li>对每一个ath.tf里的Family，统计Ta,Ra,Rs和Ts值</li>
-</ol>
-<figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">for i in $(cat ath.tf);</span><br><span class="line">do</span><br><span class="line">    ta = $(($(cat Ath_TF_list.ogs|wc -l)-1)) # 统计Ta值（有标题行，结果需要减1）</span><br><span class="line">    ra = $(grep -f dup_wgd.og Ath_TF_list.ogs|wc -l) # 统计Ra值</span><br><span class="line">	rs=$(grep -f dup_wgd.og Ath_TF_list.ogs |awk -v awka=&quot;$i&quot; &#x27;$3 == awka &#123;print$0&#125;&#x27;|wc -l);</span><br><span class="line">	ts=$(awk -v awka=&quot;$i&quot; &#x27;$3 == awka &#123;print $0&#125;&#x27; Ath_TF_list.ogs |wc -l);</span><br><span class="line">	echo &quot;$&#123;i&#125; $&#123;rs&#125; $&#123;ts&#125; $&#123;ra&#125; $&#123;ta&#125;&quot; &gt;&gt; ath_r.tem</span><br><span class="line">done</span><br></pre></td></tr></table></figure>
-
-<ol start="3">
-<li>有了Ta,Ra,Rs和Ts值，接下来就可以计算Rvalue&#x3D;(Rs⁄Ts)&#x2F;(Ra⁄Ta)了。</li>
-</ol>
-<ul>
-<li><code>cat ath_r.tem|sed &quot;s/ /\t/g&quot;|awk -F&quot;\t&quot; &#39;&#123;print $0,($1*$4)/($2*$3)&#125;&#39;|sed &#39;1i\TF\tRs\tTs\tRa\tTa\tRvalue&#39; &gt;ath_r.txt</code> 待检查是否有效</li>
-</ul>
-<h3 id="3-1-4-绘制热图"><a href="#3-1-4-绘制热图" class="headerlink" title="3.1.4. 绘制热图"></a>3.1.4. 绘制热图</h3><p>热图绘制可以参考博客<a href="https://yanzhongsino.github.io/2022/11/06/R_plot_heatmap">https://yanzhongsino.github.io/2022/11/06/R_plot_heatmap</a></p>
-<ul>
-<li>如果只有一次WGD的TF保留结果，可以直接根据Rvalue判断哪些TF家族保留率高。</li>
-<li>如果有多次WGD的TF保留结果，或者做了多个物种的TF数据库保留结果，可以绘制热图相互比较。</li>
-</ul>
-<p>用R包pheatmap绘制热图，简单快捷。(notes: 画热图这里的代码还需根据数据格式调整)</p>
-<figure class="highlight r"><table><tr><td class="code"><pre><span class="line">df<span class="operator">&lt;-</span>read.table<span class="punctuation">(</span><span class="string">&quot;tf_rvalue.txt&quot;</span><span class="punctuation">,</span>sep<span class="operator">=</span> <span class="string">&quot; &quot;</span><span class="punctuation">,</span> header <span class="operator">=</span> <span class="built_in">T</span><span class="punctuation">,</span>row.names <span class="operator">=</span> <span class="number">1</span><span class="punctuation">)</span></span><br><span class="line">df_row <span class="operator">&lt;-</span> hclust<span class="punctuation">(</span>dist<span class="punctuation">(</span>df<span class="punctuation">)</span><span class="punctuation">)</span> <span class="comment">#对行聚类</span></span><br><span class="line">df <span class="operator">&lt;-</span> df<span class="punctuation">[</span>df_row<span class="operator">$</span>order<span class="punctuation">,</span><span class="punctuation">]</span> <span class="comment">#按行聚类结果排序</span></span><br><span class="line">df_column <span class="operator">&lt;-</span> hclust<span class="punctuation">(</span>dist<span class="punctuation">(</span>t<span class="punctuation">(</span>df<span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">)</span> <span class="comment">#对列聚类</span></span><br><span class="line">df <span class="operator">&lt;-</span> df<span class="punctuation">[</span><span class="punctuation">,</span>df_column<span class="operator">$</span>order<span class="punctuation">]</span> <span class="comment">#按列聚类结果排序</span></span><br><span class="line"></span><br><span class="line">BiocManager<span class="operator">::</span>install<span class="punctuation">(</span><span class="string">&quot;pheatmap&quot;</span><span class="punctuation">)</span></span><br><span class="line">library<span class="punctuation">(</span>pheatmap<span class="punctuation">)</span></span><br><span class="line">pheatmap<span class="punctuation">(</span>df<span class="punctuation">,</span>color <span class="operator">=</span> colorRampPalette<span class="punctuation">(</span><span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;lightgreen&quot;</span><span class="punctuation">,</span> <span class="string">&quot;yellow&quot;</span><span class="punctuation">,</span><span class="string">&quot;orange&quot;</span><span class="punctuation">,</span><span class="string">&quot;red&quot;</span><span class="punctuation">)</span><span class="punctuation">)</span><span class="punctuation">(</span><span class="number">20</span><span class="punctuation">)</span><span class="punctuation">,</span>legend_breaks <span class="operator">=</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="number">1</span><span class="operator">:</span><span class="number">4</span><span class="punctuation">)</span><span class="punctuation">,</span> legend_labels <span class="operator">=</span> <span class="built_in">c</span><span class="punctuation">(</span><span class="string">&quot;1.0&quot;</span><span class="punctuation">,</span><span class="string">&quot;2.0&quot;</span><span class="punctuation">,</span><span class="string">&quot;3.0&quot;</span><span class="punctuation">,</span><span class="string">&quot;4.0&quot;</span><span class="punctuation">)</span><span class="punctuation">,</span> border_color<span class="operator">=</span><span class="string">&quot;white&quot;</span><span class="punctuation">,</span>treeheight_row <span class="operator">=</span> <span class="number">50</span><span class="punctuation">,</span> treeheight_col <span class="operator">=</span> <span class="number">8</span><span class="punctuation">,</span> display_numbers <span class="operator">=</span> <span class="literal">TRUE</span><span class="punctuation">,</span> number_color <span class="operator">=</span> <span class="string">&quot;black&quot;</span><span class="punctuation">,</span>main <span class="operator">=</span> <span class="string">&quot;TF heatmap&quot;</span><span class="punctuation">,</span>cellwidth <span class="operator">=</span> <span class="number">50</span><span class="punctuation">,</span> cellheight <span class="operator">=</span> <span class="number">10</span><span class="punctuation">)</span></span><br><span class="line"><span class="comment"># 其中color = colorRampPalette(c(&quot;lightgreen&quot;, &quot;yellow&quot;,&quot;orange&quot;,&quot;red&quot;))(20) #设置颜色渐变，值从低到高依次是浅绿色-黄色-橙色-红色，共20个颜色。</span></span><br></pre></td></tr></table></figure>
-
-<h1 id="4-references"><a href="#4-references" class="headerlink" title="4. references"></a>4. references</h1><ol>
-<li>wiki:transcription factor: <a href="https://en.wikipedia.org/wiki/Transcription_factor">https://en.wikipedia.org/wiki/Transcription_factor</a></li>
-<li>PlantTFDB: <a href="http://planttfdb.gao-lab.org/index.php">http://planttfdb.gao-lab.org/index.php</a></li>
-<li>paper: <a href="https://www.sciencedirect.com/science/article/pii/S1674205219303594">https://www.sciencedirect.com/science/article/pii/S1674205219303594</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>bioinfo</category>
-        <category>transcription factor</category>
-      </categories>
-      <tags>
-        <tag>WGD</tag>
-        <tag>transcription factor</tag>
-        <tag>PlantTFDB</tag>
-      </tags>
-  </entry>
   <entry>
     <title>结构变异分析软件：Assemblytics</title>
     <url>/2022/08/02/bioinfo_variation_SV_Assemblytics/</url>
@@ -7471,47 +7471,6 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>404 page</tag>
       </tags>
   </entry>
-  <entry>
-    <title>博客日常撰写和备份</title>
-    <url>/2021/04/20/blog_maintenance/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=20707476&auto=1&height=32"></iframe><music URL></div>
-
-<p>在根据博客<a href="https://yanzhongsino.github.io/2018/06/05/blog_hexo.github/">hexo建站，github.io发布，多终端同步</a>配置了hexo网站（使用next主题）的基础上，记录了博客日常撰写、备份。</p>
-<h1 id="1-blog的categories和tags"><a href="#1-blog的categories和tags" class="headerlink" title="1. blog的categories和tags"></a>1. blog的categories和tags</h1><p>categories和tags的记录</p>
-<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line">---</span><br><span class="line">title: blog</span><br><span class="line">date: 2021-04-20 16:50:00</span><br><span class="line">categories: </span><br><span class="line"></span><br><span class="line">- bio</span><br><span class="line">	- concept</span><br><span class="line">	- taxon</span><br><span class="line">	- bioinfo</span><br><span class="line">	- experiment</span><br><span class="line">	- theory</span><br><span class="line">	- knowledge</span><br><span class="line"></span><br><span class="line">- biosoft</span><br><span class="line"></span><br><span class="line">- omics</span><br><span class="line">	- genome</span><br><span class="line">	- transcriptome</span><br><span class="line">	- plastome</span><br><span class="line">	- mitochondrion</span><br><span class="line"></span><br><span class="line">- plot</span><br><span class="line">	- R</span><br><span class="line"></span><br><span class="line">- computer</span><br><span class="line">	- system</span><br><span class="line">		- windows</span><br><span class="line">		- linux</span><br><span class="line">	- program language</span><br><span class="line">		- python</span><br><span class="line">		- R</span><br><span class="line">		- perl</span><br><span class="line">		- java</span><br><span class="line">		- C</span><br><span class="line">	- IDE</span><br><span class="line">		- vim</span><br><span class="line">		- VScode</span><br><span class="line">		- git</span><br><span class="line">	- script</span><br><span class="line">	- web</span><br><span class="line"></span><br><span class="line">- linux</span><br><span class="line">	- basics</span><br><span class="line">	- shell</span><br><span class="line">	- text processing</span><br><span class="line">	- operation and maintenance</span><br><span class="line"></span><br><span class="line">- blog</span><br><span class="line"></span><br><span class="line"></span><br><span class="line">tags: </span><br><span class="line">- genome assemble</span><br><span class="line">- genome annotation</span><br><span class="line">- phylogeny</span><br><span class="line">- divergence time</span><br><span class="line">- WGD</span><br><span class="line">- HGT</span><br><span class="line">- molecular experiment</span><br><span class="line">- homolog</span><br><span class="line">- ortholog</span><br><span class="line">- paralog</span><br><span class="line">- xenolog</span><br><span class="line">- analog</span><br><span class="line">- orthology</span><br><span class="line">- orthogroup</span><br><span class="line">- gene family</span><br><span class="line">---  </span><br></pre></td></tr></table></figure>
-
-<h1 id="2-日常blog撰写和备份操作"><a href="#2-日常blog撰写和备份操作" class="headerlink" title="2. 日常blog撰写和备份操作"></a>2. 日常blog撰写和备份操作</h1><p>在做好blog搭建后，blog撰写和日常管理可参考这部分内容。</p>
-<h2 id="2-1-blog同步"><a href="#2-1-blog同步" class="headerlink" title="2.1. blog同步"></a>2.1. blog同步</h2><p>养成习惯，每次开始撰写blog前都通过git bash进入工作区，进行<code>git pull</code>命令把github端的hexo分支的更新（更新可能是其他终端上提交的）同步到本地，实现多终端的内容完全同步。<br>但如果本地有未提交的更新，则千万不要用<code>git pull</code>，否则会覆盖本地更新；直接进入下一步；直到使用<code>git add .</code>，<code>git commit -m &quot;submit&quot;</code>，<code>git push origin hexo</code>提交备份本地更新到github端的hexo分支后才可以使用<code>git pull</code>(一般是在其他终端，把github的hexo分支更新拉到其他终端设备使用)。</p>
-<h2 id="2-2-blog撰写"><a href="#2-2-blog撰写" class="headerlink" title="2.2. blog撰写"></a>2.2. blog撰写</h2><p>在本地source&#x2F;_posts下添加和修改md文档实现blog的日常撰写和修改。</p>
-<p>使用命令<code>hexo new &quot;newpostname&quot;</code>可以在hexo&#x2F;source&#x2F;_posts下新建一个newpostname.md的文件，这个文件以scaffolds&#x2F;post.md为模板，修改scaffolds&#x2F;post.md文件可以修改hexo new命令生成的新blog文件样式。</p>
-<h2 id="2-3-blog备份"><a href="#2-3-blog备份" class="headerlink" title="2.3. blog备份"></a>2.3. blog备份</h2><p>只要blog有更改或者新增，或者配置文件有修改，即工作区（即本地的hexo目录或github.io目录）有文件修改，则建议对文件进行备份到GitHub端的hexo分支。<br>用三条命令<code>git add .</code>，<code>git commit -m &quot;submit&quot;</code>，<code>git push origin hexo</code>备份工作区，包括md博客源文件和hexo部署到github端的hexo分支。三条命令执行前建议通过<code>hexo clean</code>清除缓存和public目录，以免备份不需要的文件。</p>
-<h2 id="2-4-blog发布"><a href="#2-4-blog发布" class="headerlink" title="2.4. blog发布"></a>2.4. blog发布</h2><p>可根据自身需求决定是否发布blog到github.io网站，一般写的blog完整程度比较高时可以发布。使用<code>hexo clean &amp; hexo g -d</code>命令，根据source&#x2F;_posts下的博客源文件生成public目录（网站html并同步到github端的master分支，即发布blog到github.io网站。</p>
-<p>总结一下，在配置好写作环境后的任意一台终端的日常工作流应该是：</p>
-<ol>
-<li><code>git pull</code>同步远程github库的hexo更新到本地</li>
-<li><code>hexo new &quot;newblog&quot;</code>在source&#x2F;_posts&#x2F;下添加md格式的blog，或者修改已有的blog</li>
-<li><code>git add .</code>,<code>git commit -m &quot;commit notes&quot;</code>,<code>git push</code>把修改备份到github端</li>
-<li>下次写作重复以上三个步骤</li>
-<li>直至blog完善成熟后，用命令<code>hexo clean &amp; hexo g -d</code>生成网站并部署到github.io</li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>blog</category>
-      </categories>
-      <tags>
-        <tag>blog</tag>
-        <tag>hexo</tag>
-        <tag>github</tag>
-        <tag>markdown</tag>
-        <tag>sync</tag>
-        <tag>website maintenance</tag>
-      </tags>
-  </entry>
   <entry>
     <title>hexo建站，github.io发布，多终端同步</title>
     <url>/2018/06/05/blog_hexo.github/</url>
@@ -7785,6 +7744,47 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>deploy website</tag>
       </tags>
   </entry>
+  <entry>
+    <title>博客日常撰写和备份</title>
+    <url>/2021/04/20/blog_maintenance/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=20707476&auto=1&height=32"></iframe><music URL></div>
+
+<p>在根据博客<a href="https://yanzhongsino.github.io/2018/06/05/blog_hexo.github/">hexo建站，github.io发布，多终端同步</a>配置了hexo网站（使用next主题）的基础上，记录了博客日常撰写、备份。</p>
+<h1 id="1-blog的categories和tags"><a href="#1-blog的categories和tags" class="headerlink" title="1. blog的categories和tags"></a>1. blog的categories和tags</h1><p>categories和tags的记录</p>
+<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line">---</span><br><span class="line">title: blog</span><br><span class="line">date: 2021-04-20 16:50:00</span><br><span class="line">categories: </span><br><span class="line"></span><br><span class="line">- bio</span><br><span class="line">	- concept</span><br><span class="line">	- taxon</span><br><span class="line">	- bioinfo</span><br><span class="line">	- experiment</span><br><span class="line">	- theory</span><br><span class="line">	- knowledge</span><br><span class="line"></span><br><span class="line">- biosoft</span><br><span class="line"></span><br><span class="line">- omics</span><br><span class="line">	- genome</span><br><span class="line">	- transcriptome</span><br><span class="line">	- plastome</span><br><span class="line">	- mitochondrion</span><br><span class="line"></span><br><span class="line">- plot</span><br><span class="line">	- R</span><br><span class="line"></span><br><span class="line">- computer</span><br><span class="line">	- system</span><br><span class="line">		- windows</span><br><span class="line">		- linux</span><br><span class="line">	- program language</span><br><span class="line">		- python</span><br><span class="line">		- R</span><br><span class="line">		- perl</span><br><span class="line">		- java</span><br><span class="line">		- C</span><br><span class="line">	- IDE</span><br><span class="line">		- vim</span><br><span class="line">		- VScode</span><br><span class="line">		- git</span><br><span class="line">	- script</span><br><span class="line">	- web</span><br><span class="line"></span><br><span class="line">- linux</span><br><span class="line">	- basics</span><br><span class="line">	- shell</span><br><span class="line">	- text processing</span><br><span class="line">	- operation and maintenance</span><br><span class="line"></span><br><span class="line">- blog</span><br><span class="line"></span><br><span class="line"></span><br><span class="line">tags: </span><br><span class="line">- genome assemble</span><br><span class="line">- genome annotation</span><br><span class="line">- phylogeny</span><br><span class="line">- divergence time</span><br><span class="line">- WGD</span><br><span class="line">- HGT</span><br><span class="line">- molecular experiment</span><br><span class="line">- homolog</span><br><span class="line">- ortholog</span><br><span class="line">- paralog</span><br><span class="line">- xenolog</span><br><span class="line">- analog</span><br><span class="line">- orthology</span><br><span class="line">- orthogroup</span><br><span class="line">- gene family</span><br><span class="line">---  </span><br></pre></td></tr></table></figure>
+
+<h1 id="2-日常blog撰写和备份操作"><a href="#2-日常blog撰写和备份操作" class="headerlink" title="2. 日常blog撰写和备份操作"></a>2. 日常blog撰写和备份操作</h1><p>在做好blog搭建后，blog撰写和日常管理可参考这部分内容。</p>
+<h2 id="2-1-blog同步"><a href="#2-1-blog同步" class="headerlink" title="2.1. blog同步"></a>2.1. blog同步</h2><p>养成习惯，每次开始撰写blog前都通过git bash进入工作区，进行<code>git pull</code>命令把github端的hexo分支的更新（更新可能是其他终端上提交的）同步到本地，实现多终端的内容完全同步。<br>但如果本地有未提交的更新，则千万不要用<code>git pull</code>，否则会覆盖本地更新；直接进入下一步；直到使用<code>git add .</code>，<code>git commit -m &quot;submit&quot;</code>，<code>git push origin hexo</code>提交备份本地更新到github端的hexo分支后才可以使用<code>git pull</code>(一般是在其他终端，把github的hexo分支更新拉到其他终端设备使用)。</p>
+<h2 id="2-2-blog撰写"><a href="#2-2-blog撰写" class="headerlink" title="2.2. blog撰写"></a>2.2. blog撰写</h2><p>在本地source&#x2F;_posts下添加和修改md文档实现blog的日常撰写和修改。</p>
+<p>使用命令<code>hexo new &quot;newpostname&quot;</code>可以在hexo&#x2F;source&#x2F;_posts下新建一个newpostname.md的文件，这个文件以scaffolds&#x2F;post.md为模板，修改scaffolds&#x2F;post.md文件可以修改hexo new命令生成的新blog文件样式。</p>
+<h2 id="2-3-blog备份"><a href="#2-3-blog备份" class="headerlink" title="2.3. blog备份"></a>2.3. blog备份</h2><p>只要blog有更改或者新增，或者配置文件有修改，即工作区（即本地的hexo目录或github.io目录）有文件修改，则建议对文件进行备份到GitHub端的hexo分支。<br>用三条命令<code>git add .</code>，<code>git commit -m &quot;submit&quot;</code>，<code>git push origin hexo</code>备份工作区，包括md博客源文件和hexo部署到github端的hexo分支。三条命令执行前建议通过<code>hexo clean</code>清除缓存和public目录，以免备份不需要的文件。</p>
+<h2 id="2-4-blog发布"><a href="#2-4-blog发布" class="headerlink" title="2.4. blog发布"></a>2.4. blog发布</h2><p>可根据自身需求决定是否发布blog到github.io网站，一般写的blog完整程度比较高时可以发布。使用<code>hexo clean &amp; hexo g -d</code>命令，根据source&#x2F;_posts下的博客源文件生成public目录（网站html并同步到github端的master分支，即发布blog到github.io网站。</p>
+<p>总结一下，在配置好写作环境后的任意一台终端的日常工作流应该是：</p>
+<ol>
+<li><code>git pull</code>同步远程github库的hexo更新到本地</li>
+<li><code>hexo new &quot;newblog&quot;</code>在source&#x2F;_posts&#x2F;下添加md格式的blog，或者修改已有的blog</li>
+<li><code>git add .</code>,<code>git commit -m &quot;commit notes&quot;</code>,<code>git push</code>把修改备份到github端</li>
+<li>下次写作重复以上三个步骤</li>
+<li>直至blog完善成熟后，用命令<code>hexo clean &amp; hexo g -d</code>生成网站并部署到github.io</li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>blog</category>
+      </categories>
+      <tags>
+        <tag>blog</tag>
+        <tag>hexo</tag>
+        <tag>github</tag>
+        <tag>markdown</tag>
+        <tag>sync</tag>
+        <tag>website maintenance</tag>
+      </tags>
+  </entry>
   <entry>
     <title>博客撰写的语法和技巧</title>
     <url>/2022/04/15/blog_markdown_grammer/</url>
@@ -9099,133 +9099,6 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>awk</tag>
       </tags>
   </entry>
-  <entry>
-    <title>基因组注释（四）：非编码RNA的注释-用Infernal软件对Rfam 12进行RNA注释</title>
-    <url>/2022/04/22/omics_genome.annotation_ncRNA/</url>
-    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=283100&auto=1&height=32"></iframe></div>
-
-<h1 id="1-ncRNA"><a href="#1-ncRNA" class="headerlink" title="1. ncRNA"></a>1. ncRNA</h1><p>非编码RNA(Non-coding RNA, ncRNA) 包括rRNA，tRNA，snRNA，snoRNA 和microRNA 等不编码蛋白质的RNA，它们转录后直接在RNA 水平上就能行使各自的生物学功能，并不需要翻译成蛋白质。</p>
-<h1 id="2-注释软件"><a href="#2-注释软件" class="headerlink" title="2. 注释软件"></a>2. 注释软件</h1><ul>
-<li>非编码RNA种类繁多，且结构特征各不相同，所以开发出了许多注释特定某一类RNA的软件，比如tRNAScan-SE预测tRNA，rnammer预测rRNA，snoScan 搜索带C&#x2F;D盒的snoRNAs，SnoGps 搜索带H&#x2F;ACA盒的snoRNAs，mirScan搜索microRNA等。</li>
-<li>Sanger实验室开发了Infernal软件，建立了1600多个RNA家族，并对每个家族建立了一致性二级结构和协方差模型，形成了Rfam数据库。采用Rfam数据库中的每个RNA的协方差模型，结合Infernal软件可以预测出已有RNA家族的新成员，只是特异性比较差。</li>
-</ul>
-<p>如果不是专门研究ncRNA，可以用Infernal注释所有ncRNA。如果需要更精细的注释，则可以选择特定软件注释特定RNA。</p>
-<p>这篇博客是介绍用Infernal程序与Rfam数据库一起用来注释与数据库中已知ncRNA同源的序列（这里用来注释完整的基因组）。注释结果包括tRNA，rRNA，snRNA，snoRNA和miRNA等。</p>
-<h1 id="3-Infernal"><a href="#3-Infernal" class="headerlink" title="3. Infernal"></a>3. Infernal</h1><p><a href="http://eddylab.org/infernal/">Infernal</a>全称是”INFERence of RNA ALignment”，是一个用来检索DNA序列数据库中RNA序列和结构相似性的软件，通过协方差模型covariance models (CMs)来实现。</p>
-<h2 id="3-1-安装Infernal"><a href="#3-1-安装Infernal" class="headerlink" title="3.1. 安装Infernal"></a>3.1. 安装Infernal</h2><p><code>conda install -c bioconda infernal</code><br>现在安装的是v1.1.4</p>
-<p>安装后可使用的命令包括：</p>
-<ul>
-<li>cmpress：对cm文件进行压缩并建立索引。</li>
-<li>cmscan：用提交的序列在cm数据库中进行检索。</li>
-<li>cmalign：将RNA序列同协方差模型进行比对，并输出为stockholm格式。</li>
-<li>cmbuild：通过多序列比对结果建立一个协方差模型，并保存在新文件中。</li>
-<li>cmcalibrate：对协方差模型(CM)进行校准，在使用cmsearch和cmscan前CM模型需要先经过这个程序的处理。</li>
-<li>cmconvert：用于格式转换，是将infernal 1.0以后的CM转化为当前版本需要的CM。但对1.0之前的版本无效。</li>
-<li>cmemit：一个采样程序，从CM中进行采样并输出。</li>
-<li>cmfetch：从一个大的CM文件中获取一个或多个CM。</li>
-<li>cmsearch：用提交的CM模型在序列数据库中进行检索。</li>
-<li>cmstat：对CM文件中的CM模型进行统计汇总。</li>
-</ul>
-<h1 id="4-Rfam"><a href="#4-Rfam" class="headerlink" title="4. Rfam"></a>4. Rfam</h1><p><a href="http://rfam.xfam.org/">Rfam</a>是RNA family数据库，包括ncRNA序列和ncRNA的二级结构，每个family用多序列比对和协方差模型covariance model (CM)来表示。</p>
-<ol>
-<li>下载Rfam数据库</li>
-</ol>
-<ul>
-<li><code>wget http://ftp.ebi.ac.uk/pub/databases/Rfam/CURRENT/Rfam.cm.gz</code><br>在<a href="http://rfam.xfam.org/">Rfam</a>网站下载Rfam最新版本的CM数据库（目前是Rfam 14.7）</li>
-<li><code>gunzip Rfam.cm.gz</code><br>解压数据库</li>
-</ul>
-<ol start="2">
-<li>下载clanin</li>
-</ol>
-<ul>
-<li><code>wget http://ftp.ebi.ac.uk/pub/databases/Rfam/CURRENT/Rfam.clanin</code><br>在<a href="http://rfam.xfam.org/">Rfam</a>网站下载Rfam数据库配套的clanin文件。</li>
-</ul>
-<h1 id="5-注释ncRNA"><a href="#5-注释ncRNA" class="headerlink" title="5. 注释ncRNA"></a>5. 注释ncRNA</h1><h2 id="5-1-建库"><a href="#5-1-建库" class="headerlink" title="5.1. 建库"></a>5.1. 建库</h2><ul>
-<li><code>cmpress Rfam.cm</code><br>使用cmpress压缩并建立索引，生成Rfam.cm.i1f, Rfam.cm.i1i, Rfam.cm.i1m, Rfam.cm.i1p。</li>
-</ul>
-<h2 id="5-2-注释"><a href="#5-2-注释" class="headerlink" title="5.2. 注释"></a>5.2. 注释</h2><ol>
-<li>序列索引<br>推荐的参数：</li>
-</ol>
-<p><code>nohup cmscan -Z 512 --cut_ga --rfam --nohmmonly --fmt 2 --tblout sample.tblout -o sample.result --clanin Rfam.clanin Rfam.cm genome.fa &amp;</code></p>
-<ul>
-<li>-Z：根据基因组大小来定，基因组大小的2倍，Mb单位，选一个整数。比如256Mb的基因组，-Z 512。</li>
-<li><code>--cut_ga --rfam --nohmmonly --fmt 2</code>：推荐使用</li>
-<li>–tblout sample.tblout：指定table格式输出文件</li>
-<li>-o sample.result：指定比对结果输出文件</li>
-<li>–clanin Rfam.clanin：指定clanin文件</li>
-<li>Rfam.cm genome.fa：指定数据库Rfam.cm和基因组genome.fa</li>
-</ul>
-<p>note：-o sample.result要放在Rfam.cm genome.fa前面，否则报错。</p>
-<p>此步骤<strong>耗时</strong>参考：250Mb基因组，默认线程，耗时2.5h。</p>
-<ol start="2">
-<li>结果文件</li>
-</ol>
-<ul>
-<li>sample.result：比对结果</li>
-<li>sample.tblout：table格式结果</li>
-</ul>
-<h2 id="5-3-整理结果"><a href="#5-3-整理结果" class="headerlink" title="5.3. 整理结果"></a>5.3. 整理结果</h2><h3 id="5-3-1-将注释结果整理成gff3文件"><a href="#5-3-1-将注释结果整理成gff3文件" class="headerlink" title="5.3.1. 将注释结果整理成gff3文件"></a>5.3.1. 将注释结果整理成gff3文件</h3><p>gff3文件可用于提交注释到数据库。</p>
-<p>用perl脚本<a href="https://github.com/yanzhongsino/bioscripts/blob/main/saved_scripts/infernal-tblout2gff.pl">infernal-tblout2gff.pl</a>实现，脚本来自<a href="https://www.cnblogs.com/jessepeng/p/15392809.html%E3%80%82">https://www.cnblogs.com/jessepeng/p/15392809.html。</a></p>
-<p><code>perl infernal-tblout2gff.pl --cmscan --fmt2 sample.tblout &gt;sample.infernal.ncRNA.gff3</code></p>
-<h3 id="5-3-2-统计各类ncRNA总数"><a href="#5-3-2-统计各类ncRNA总数" class="headerlink" title="5.3.2. 统计各类ncRNA总数"></a>5.3.2. 统计各类ncRNA总数</h3><ol>
-<li><p>整理注释结果文件sample.tblout<br>提取必需的列，非重叠区域或重叠区域得分高的区域<br><code>awk &#39;BEGIN&#123;OFS=&quot;\t&quot;;&#125;&#123;if(FNR==1) print &quot;target_name\taccession\tquery_name\tquery_start\tquery_end\tstrand\tscore\tEvalue&quot;; if(FNR&gt;2 &amp;&amp; $20!=&quot;=&quot; &amp;&amp; $0!~/^#/) print $2,$3,$4,$10,$11,$12,$17,$18; &#125;&#39; sample.tblout &gt;sample.tblout.xls</code></p>
-</li>
-<li><p>下载rfam注释</p>
-</li>
-</ol>
-<ul>
-<li>在<a href="https://rfam.xfam.org/">rfam官网</a>，选择【SEARCH】-【Entry type】</li>
-<li>然后选中所有的Entry types（包括Gene，Intron，Cis-regulatory element），点击【Submit】，会列出所有RNA family的注释信息。</li>
-<li>手动选择所有注释信息，复制，粘贴到新建的空白文本文件rfam.txt并保存。</li>
-<li>把rfam.txt传输到服务器，最好用<code>dos2unix rfam.txt</code>转换文件格式为unix版本。</li>
-<li>拆分第三列<code>cat rfam.txt | awk &#39;BEGIN &#123;FS=OFS=&quot;\t&quot;&#125;&#123;split($3,x,&quot;;&quot;);class=x[2];print $1,$2,$3,$4,class&#125;&#39; &gt; rfam_anno.txt</code></li>
-</ul>
-<p>rfam注释文件rfam_anno.txt包含了所有rfam的类型type和功能描述description信息。</p>
-<ol start="3">
-<li>统计ncRNA注释结果<br><code>awk &#39;BEGIN&#123;OFS=FS=&quot;\t&quot;&#125;ARGIND==1&#123;a[$2]=$5;&#125;ARGIND==2&#123;type=a[$1]; if(type==&quot;&quot;) type=&quot;Others&quot;; count[type]+=1;&#125;END&#123;for(type in count) print type, count[type];&#125;&#39; rfam_anno.txt sample.tblout.xls &gt;sample.ncRNA.statistic</code></li>
-</ol>
-<p>sample.ncRNA.statistic输出示例：</p>
-<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line"> riboswitch	1</span><br><span class="line"> ribozyme	1</span><br><span class="line"> tRNA	699</span><br><span class="line">Others	41</span><br><span class="line"> miRNA	188</span><br><span class="line"> antisense	4</span><br><span class="line"> rRNA	233</span><br><span class="line"> snRNA	698</span><br></pre></td></tr></table></figure>
-
-<ol start="4">
-<li>统计细分分类</li>
-</ol>
-<ul>
-<li>也可以根据细分分类分别统计，细分分类参考<a href="https://rfam.xfam.org/">rfam官网</a>，【SEARCH】-【Entry type】。</li>
-<li>可参考的统计值包括每个细分ncRNA的数量(copy)，平均长度(average length)，总长(total length)，总长占基因组的比例（Percent of the genome）等</li>
-<li>统计后整理成发表文章用的表格。</li>
-</ul>
-<p>比如：snRNA包括snoRNA和splicing，snoRNA包括CD-box，HACA-box和scaRNA。下面用统计CD-box这个细分分类的ncRNA举例。</p>
-<ul>
-<li>提取CD-box的Accession(RF00000格式)：<code>grep &quot;CD-box&quot; rfam_anno.txt |cut -f1 &gt;cdbox.tem</code></li>
-<li>提取注释到的CD-box信息：<code>grep -f cdbox.tem mc.tblout.xls &gt;cdbox.txt</code></li>
-<li>cdbox.txt的行数就是CD-box的数量；利用第四五列的位置信息，即可统计平均长度(average length)，总长(total length)，<strong>注意正反链</strong>。</li>
-</ul>
-<h1 id="6-references"><a href="#6-references" class="headerlink" title="6. references"></a>6. references</h1><ol>
-<li><a href="https://www.cnblogs.com/jessepeng/p/15392809.html">https://www.cnblogs.com/jessepeng/p/15392809.html</a></li>
-<li><a href="http://www.360doc.com/content/18/1119/05/52645714_795799901.shtml">http://www.360doc.com/content/18/1119/05/52645714_795799901.shtml</a></li>
-<li><a href="https://genehub.wordpress.com/2019/08/08/%E6%A4%8D%E7%89%A9%E5%9F%BA%E5%9B%A0%E7%BB%84ncrna%E9%A2%84%E6%B5%8B%EF%BC%88trna%E3%80%81rrna%E3%80%81snrna%E3%80%81mirna%EF%BC%89/">https://genehub.wordpress.com/2019/08/08/%E6%A4%8D%E7%89%A9%E5%9F%BA%E5%9B%A0%E7%BB%84ncrna%E9%A2%84%E6%B5%8B%EF%BC%88trna%E3%80%81rrna%E3%80%81snrna%E3%80%81mirna%EF%BC%89/</a></li>
-<li><a href="http://embracethesky.cn/2018/07/08/%e4%bd%bf%e7%94%a8infernal%e5%af%b9rfam-12%e8%bf%9b%e8%a1%8crna%e6%b3%a8%e9%87%8a/#more-99">http://embracethesky.cn/2018/07/08/%e4%bd%bf%e7%94%a8infernal%e5%af%b9rfam-12%e8%bf%9b%e8%a1%8crna%e6%b3%a8%e9%87%8a/#more-99</a></li>
-</ol>
-<hr>
-<ul>
-<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
-<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
-</ul>
-<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
-      <categories>
-        <category>omics</category>
-        <category>genome</category>
-        <category>annotation</category>
-      </categories>
-      <tags>
-        <tag>genome</tag>
-        <tag>genome annotation</tag>
-        <tag>ncRNA</tag>
-        <tag>Infernal</tag>
-        <tag>Rfam</tag>
-      </tags>
-  </entry>
   <entry>
     <title>基因组注释（三）：基因功能注释</title>
     <url>/2021/05/17/omics_genome.annotation_function/</url>
@@ -9597,6 +9470,133 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
         <tag>GFAP</tag>
       </tags>
   </entry>
+  <entry>
+    <title>基因组注释（四）：非编码RNA的注释-用Infernal软件对Rfam 12进行RNA注释</title>
+    <url>/2022/04/22/omics_genome.annotation_ncRNA/</url>
+    <content><![CDATA[<div align="middle"><iframe frameborder="no" border="0" marginwidth="0" marginheight="0" width=298 height=52 src="//music.163.com/outchain/player?type=2&id=283100&auto=1&height=32"></iframe></div>
+
+<h1 id="1-ncRNA"><a href="#1-ncRNA" class="headerlink" title="1. ncRNA"></a>1. ncRNA</h1><p>非编码RNA(Non-coding RNA, ncRNA) 包括rRNA，tRNA，snRNA，snoRNA 和microRNA 等不编码蛋白质的RNA，它们转录后直接在RNA 水平上就能行使各自的生物学功能，并不需要翻译成蛋白质。</p>
+<h1 id="2-注释软件"><a href="#2-注释软件" class="headerlink" title="2. 注释软件"></a>2. 注释软件</h1><ul>
+<li>非编码RNA种类繁多，且结构特征各不相同，所以开发出了许多注释特定某一类RNA的软件，比如tRNAScan-SE预测tRNA，rnammer预测rRNA，snoScan 搜索带C&#x2F;D盒的snoRNAs，SnoGps 搜索带H&#x2F;ACA盒的snoRNAs，mirScan搜索microRNA等。</li>
+<li>Sanger实验室开发了Infernal软件，建立了1600多个RNA家族，并对每个家族建立了一致性二级结构和协方差模型，形成了Rfam数据库。采用Rfam数据库中的每个RNA的协方差模型，结合Infernal软件可以预测出已有RNA家族的新成员，只是特异性比较差。</li>
+</ul>
+<p>如果不是专门研究ncRNA，可以用Infernal注释所有ncRNA。如果需要更精细的注释，则可以选择特定软件注释特定RNA。</p>
+<p>这篇博客是介绍用Infernal程序与Rfam数据库一起用来注释与数据库中已知ncRNA同源的序列（这里用来注释完整的基因组）。注释结果包括tRNA，rRNA，snRNA，snoRNA和miRNA等。</p>
+<h1 id="3-Infernal"><a href="#3-Infernal" class="headerlink" title="3. Infernal"></a>3. Infernal</h1><p><a href="http://eddylab.org/infernal/">Infernal</a>全称是”INFERence of RNA ALignment”，是一个用来检索DNA序列数据库中RNA序列和结构相似性的软件，通过协方差模型covariance models (CMs)来实现。</p>
+<h2 id="3-1-安装Infernal"><a href="#3-1-安装Infernal" class="headerlink" title="3.1. 安装Infernal"></a>3.1. 安装Infernal</h2><p><code>conda install -c bioconda infernal</code><br>现在安装的是v1.1.4</p>
+<p>安装后可使用的命令包括：</p>
+<ul>
+<li>cmpress：对cm文件进行压缩并建立索引。</li>
+<li>cmscan：用提交的序列在cm数据库中进行检索。</li>
+<li>cmalign：将RNA序列同协方差模型进行比对，并输出为stockholm格式。</li>
+<li>cmbuild：通过多序列比对结果建立一个协方差模型，并保存在新文件中。</li>
+<li>cmcalibrate：对协方差模型(CM)进行校准，在使用cmsearch和cmscan前CM模型需要先经过这个程序的处理。</li>
+<li>cmconvert：用于格式转换，是将infernal 1.0以后的CM转化为当前版本需要的CM。但对1.0之前的版本无效。</li>
+<li>cmemit：一个采样程序，从CM中进行采样并输出。</li>
+<li>cmfetch：从一个大的CM文件中获取一个或多个CM。</li>
+<li>cmsearch：用提交的CM模型在序列数据库中进行检索。</li>
+<li>cmstat：对CM文件中的CM模型进行统计汇总。</li>
+</ul>
+<h1 id="4-Rfam"><a href="#4-Rfam" class="headerlink" title="4. Rfam"></a>4. Rfam</h1><p><a href="http://rfam.xfam.org/">Rfam</a>是RNA family数据库，包括ncRNA序列和ncRNA的二级结构，每个family用多序列比对和协方差模型covariance model (CM)来表示。</p>
+<ol>
+<li>下载Rfam数据库</li>
+</ol>
+<ul>
+<li><code>wget http://ftp.ebi.ac.uk/pub/databases/Rfam/CURRENT/Rfam.cm.gz</code><br>在<a href="http://rfam.xfam.org/">Rfam</a>网站下载Rfam最新版本的CM数据库（目前是Rfam 14.7）</li>
+<li><code>gunzip Rfam.cm.gz</code><br>解压数据库</li>
+</ul>
+<ol start="2">
+<li>下载clanin</li>
+</ol>
+<ul>
+<li><code>wget http://ftp.ebi.ac.uk/pub/databases/Rfam/CURRENT/Rfam.clanin</code><br>在<a href="http://rfam.xfam.org/">Rfam</a>网站下载Rfam数据库配套的clanin文件。</li>
+</ul>
+<h1 id="5-注释ncRNA"><a href="#5-注释ncRNA" class="headerlink" title="5. 注释ncRNA"></a>5. 注释ncRNA</h1><h2 id="5-1-建库"><a href="#5-1-建库" class="headerlink" title="5.1. 建库"></a>5.1. 建库</h2><ul>
+<li><code>cmpress Rfam.cm</code><br>使用cmpress压缩并建立索引，生成Rfam.cm.i1f, Rfam.cm.i1i, Rfam.cm.i1m, Rfam.cm.i1p。</li>
+</ul>
+<h2 id="5-2-注释"><a href="#5-2-注释" class="headerlink" title="5.2. 注释"></a>5.2. 注释</h2><ol>
+<li>序列索引<br>推荐的参数：</li>
+</ol>
+<p><code>nohup cmscan -Z 512 --cut_ga --rfam --nohmmonly --fmt 2 --tblout sample.tblout -o sample.result --clanin Rfam.clanin Rfam.cm genome.fa &amp;</code></p>
+<ul>
+<li>-Z：根据基因组大小来定，基因组大小的2倍，Mb单位，选一个整数。比如256Mb的基因组，-Z 512。</li>
+<li><code>--cut_ga --rfam --nohmmonly --fmt 2</code>：推荐使用</li>
+<li>–tblout sample.tblout：指定table格式输出文件</li>
+<li>-o sample.result：指定比对结果输出文件</li>
+<li>–clanin Rfam.clanin：指定clanin文件</li>
+<li>Rfam.cm genome.fa：指定数据库Rfam.cm和基因组genome.fa</li>
+</ul>
+<p>note：-o sample.result要放在Rfam.cm genome.fa前面，否则报错。</p>
+<p>此步骤<strong>耗时</strong>参考：250Mb基因组，默认线程，耗时2.5h。</p>
+<ol start="2">
+<li>结果文件</li>
+</ol>
+<ul>
+<li>sample.result：比对结果</li>
+<li>sample.tblout：table格式结果</li>
+</ul>
+<h2 id="5-3-整理结果"><a href="#5-3-整理结果" class="headerlink" title="5.3. 整理结果"></a>5.3. 整理结果</h2><h3 id="5-3-1-将注释结果整理成gff3文件"><a href="#5-3-1-将注释结果整理成gff3文件" class="headerlink" title="5.3.1. 将注释结果整理成gff3文件"></a>5.3.1. 将注释结果整理成gff3文件</h3><p>gff3文件可用于提交注释到数据库。</p>
+<p>用perl脚本<a href="https://github.com/yanzhongsino/bioscripts/blob/main/saved_scripts/infernal-tblout2gff.pl">infernal-tblout2gff.pl</a>实现，脚本来自<a href="https://www.cnblogs.com/jessepeng/p/15392809.html%E3%80%82">https://www.cnblogs.com/jessepeng/p/15392809.html。</a></p>
+<p><code>perl infernal-tblout2gff.pl --cmscan --fmt2 sample.tblout &gt;sample.infernal.ncRNA.gff3</code></p>
+<h3 id="5-3-2-统计各类ncRNA总数"><a href="#5-3-2-统计各类ncRNA总数" class="headerlink" title="5.3.2. 统计各类ncRNA总数"></a>5.3.2. 统计各类ncRNA总数</h3><ol>
+<li><p>整理注释结果文件sample.tblout<br>提取必需的列，非重叠区域或重叠区域得分高的区域<br><code>awk &#39;BEGIN&#123;OFS=&quot;\t&quot;;&#125;&#123;if(FNR==1) print &quot;target_name\taccession\tquery_name\tquery_start\tquery_end\tstrand\tscore\tEvalue&quot;; if(FNR&gt;2 &amp;&amp; $20!=&quot;=&quot; &amp;&amp; $0!~/^#/) print $2,$3,$4,$10,$11,$12,$17,$18; &#125;&#39; sample.tblout &gt;sample.tblout.xls</code></p>
+</li>
+<li><p>下载rfam注释</p>
+</li>
+</ol>
+<ul>
+<li>在<a href="https://rfam.xfam.org/">rfam官网</a>，选择【SEARCH】-【Entry type】</li>
+<li>然后选中所有的Entry types（包括Gene，Intron，Cis-regulatory element），点击【Submit】，会列出所有RNA family的注释信息。</li>
+<li>手动选择所有注释信息，复制，粘贴到新建的空白文本文件rfam.txt并保存。</li>
+<li>把rfam.txt传输到服务器，最好用<code>dos2unix rfam.txt</code>转换文件格式为unix版本。</li>
+<li>拆分第三列<code>cat rfam.txt | awk &#39;BEGIN &#123;FS=OFS=&quot;\t&quot;&#125;&#123;split($3,x,&quot;;&quot;);class=x[2];print $1,$2,$3,$4,class&#125;&#39; &gt; rfam_anno.txt</code></li>
+</ul>
+<p>rfam注释文件rfam_anno.txt包含了所有rfam的类型type和功能描述description信息。</p>
+<ol start="3">
+<li>统计ncRNA注释结果<br><code>awk &#39;BEGIN&#123;OFS=FS=&quot;\t&quot;&#125;ARGIND==1&#123;a[$2]=$5;&#125;ARGIND==2&#123;type=a[$1]; if(type==&quot;&quot;) type=&quot;Others&quot;; count[type]+=1;&#125;END&#123;for(type in count) print type, count[type];&#125;&#39; rfam_anno.txt sample.tblout.xls &gt;sample.ncRNA.statistic</code></li>
+</ol>
+<p>sample.ncRNA.statistic输出示例：</p>
+<figure class="highlight plaintext"><table><tr><td class="code"><pre><span class="line"> riboswitch	1</span><br><span class="line"> ribozyme	1</span><br><span class="line"> tRNA	699</span><br><span class="line">Others	41</span><br><span class="line"> miRNA	188</span><br><span class="line"> antisense	4</span><br><span class="line"> rRNA	233</span><br><span class="line"> snRNA	698</span><br></pre></td></tr></table></figure>
+
+<ol start="4">
+<li>统计细分分类</li>
+</ol>
+<ul>
+<li>也可以根据细分分类分别统计，细分分类参考<a href="https://rfam.xfam.org/">rfam官网</a>，【SEARCH】-【Entry type】。</li>
+<li>可参考的统计值包括每个细分ncRNA的数量(copy)，平均长度(average length)，总长(total length)，总长占基因组的比例（Percent of the genome）等</li>
+<li>统计后整理成发表文章用的表格。</li>
+</ul>
+<p>比如：snRNA包括snoRNA和splicing，snoRNA包括CD-box，HACA-box和scaRNA。下面用统计CD-box这个细分分类的ncRNA举例。</p>
+<ul>
+<li>提取CD-box的Accession(RF00000格式)：<code>grep &quot;CD-box&quot; rfam_anno.txt |cut -f1 &gt;cdbox.tem</code></li>
+<li>提取注释到的CD-box信息：<code>grep -f cdbox.tem mc.tblout.xls &gt;cdbox.txt</code></li>
+<li>cdbox.txt的行数就是CD-box的数量；利用第四五列的位置信息，即可统计平均长度(average length)，总长(total length)，<strong>注意正反链</strong>。</li>
+</ul>
+<h1 id="6-references"><a href="#6-references" class="headerlink" title="6. references"></a>6. references</h1><ol>
+<li><a href="https://www.cnblogs.com/jessepeng/p/15392809.html">https://www.cnblogs.com/jessepeng/p/15392809.html</a></li>
+<li><a href="http://www.360doc.com/content/18/1119/05/52645714_795799901.shtml">http://www.360doc.com/content/18/1119/05/52645714_795799901.shtml</a></li>
+<li><a href="https://genehub.wordpress.com/2019/08/08/%E6%A4%8D%E7%89%A9%E5%9F%BA%E5%9B%A0%E7%BB%84ncrna%E9%A2%84%E6%B5%8B%EF%BC%88trna%E3%80%81rrna%E3%80%81snrna%E3%80%81mirna%EF%BC%89/">https://genehub.wordpress.com/2019/08/08/%E6%A4%8D%E7%89%A9%E5%9F%BA%E5%9B%A0%E7%BB%84ncrna%E9%A2%84%E6%B5%8B%EF%BC%88trna%E3%80%81rrna%E3%80%81snrna%E3%80%81mirna%EF%BC%89/</a></li>
+<li><a href="http://embracethesky.cn/2018/07/08/%e4%bd%bf%e7%94%a8infernal%e5%af%b9rfam-12%e8%bf%9b%e8%a1%8crna%e6%b3%a8%e9%87%8a/#more-99">http://embracethesky.cn/2018/07/08/%e4%bd%bf%e7%94%a8infernal%e5%af%b9rfam-12%e8%bf%9b%e8%a1%8crna%e6%b3%a8%e9%87%8a/#more-99</a></li>
+</ol>
+<hr>
+<ul>
+<li>欢迎关注微信公众号：<strong>生信技工</strong></li>
+<li>公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容，包括生物信息学工具的基本原理、操作步骤和学习心得。</li>
+</ul>
+<img src="https://github.com/yanzhongsino/yanzhongsino.github.io/blob/hexo/source/wechat/Wechat_public_qrcode.jpg?raw=true" width=50% title="wechat_public_QRcode.png" align=center/>]]></content>
+      <categories>
+        <category>omics</category>
+        <category>genome</category>
+        <category>annotation</category>
+      </categories>
+      <tags>
+        <tag>genome</tag>
+        <tag>genome annotation</tag>
+        <tag>ncRNA</tag>
+        <tag>Infernal</tag>
+        <tag>Rfam</tag>
+      </tags>
+  </entry>
   <entry>
     <title>基因组注释（一）：重复序列注释</title>
     <url>/2021/08/02/omics_genome.annotation_repeat/</url>
@@ -12666,7 +12666,7 @@ BiocManager的版本与R版本一一对应，安装时如果版本不对会有
 </li>
 <li><strong>SEQ_FEAT.TransLen</strong><ul>
 <li>表示蛋白质长度与预测的蛋白质长度不匹配，运行错误</li>
-<li>建议重跑table2asn，报错持续存在就写邮件把sample.sqn和运行的命令行发给NCBI(<a href="mailto:&#x67;&#101;&#x6e;&#111;&#x6d;&#x65;&#115;&#64;&#110;&#99;&#x62;&#105;&#x2e;&#110;&#x6c;&#109;&#46;&#110;&#x69;&#104;&#x2e;&#103;&#111;&#118;">&#x67;&#101;&#x6e;&#111;&#x6d;&#x65;&#115;&#64;&#110;&#99;&#x62;&#105;&#x2e;&#110;&#x6c;&#109;&#46;&#110;&#x69;&#104;&#x2e;&#103;&#111;&#118;</a>)让帮忙修改这个错误。</li>
+<li>建议重跑table2asn，报错持续存在就写邮件把sample.sqn和运行的命令行发给NCBI(<a href="mailto:&#x67;&#101;&#110;&#111;&#109;&#x65;&#115;&#x40;&#x6e;&#x63;&#98;&#105;&#46;&#110;&#108;&#x6d;&#46;&#110;&#105;&#x68;&#x2e;&#103;&#x6f;&#118;">&#x67;&#101;&#110;&#111;&#109;&#x65;&#115;&#x40;&#x6e;&#x63;&#98;&#105;&#46;&#110;&#108;&#x6d;&#46;&#110;&#105;&#x68;&#x2e;&#103;&#x6f;&#118;</a>)让帮忙修改这个错误。</li>
 </ul>
 </li>
 <li><strong>SEQ_FEAT.BadInternalCharacter</strong><ul>
diff --git a/tags/HiSat2/index.html b/tags/HiSat2/index.html
index 7ee3a5f63a..76ba31495e 100644
--- a/tags/HiSat2/index.html
+++ b/tags/HiSat2/index.html
@@ -23,7 +23,7 @@
   <meta name="description" content="学习生物信息学的笔记本">
 <meta property="og:type" content="website">
 <meta property="og:title" content="生信技工">
-<meta property="og:url" content="http://example.com/tags/HiSat2/index.html">
+<meta property="og:url" content="http://example.com/tags/HISAT2/index.html">
 <meta property="og:site_name" content="生信技工">
 <meta property="og:description" content="学习生物信息学的笔记本">
 <meta property="og:locale" content="en_US">
@@ -33,7 +33,7 @@
 <meta property="article:tag" content="tools">
 <meta name="twitter:card" content="summary">
 
-<link rel="canonical" href="http://example.com/tags/HiSat2/">
+<link rel="canonical" href="http://example.com/tags/HISAT2/">
 
 
 <script id="page-configurations">
@@ -46,7 +46,7 @@
   };
 </script>
 
-  <title>Tag: HiSat2 | 生信技工</title>
+  <title>Tag: HISAT2 | 生信技工</title>
   
 
 
@@ -214,14 +214,14 @@ <h1 class="site-title">生信技工</h1>
   <div class="post-block">
     <div class="posts-collapse">
       <div class="collection-title">
-        <h2 class="collection-header">HiSat2
+        <h2 class="collection-header">HISAT2
           <small>Tag</small>
         </h2>
       </div>
 
       
     <div class="collection-year">
-      <span class="collection-header">2022</span>
+      <span class="collection-header">2021</span>
     </div>
 
   <article itemscope itemtype="http://schema.org/Article">
@@ -229,35 +229,15 @@ <h2 class="collection-header">HiSat2
 
       <div class="post-meta">
         <time itemprop="dateCreated"
-              datetime="2022-07-23T00:00:00+08:00"
-              content="2022-07-23">
-          07-23
+              datetime="2021-11-19T20:50:00+08:00"
+              content="2021-11-19">
+          11-19
         </time>
       </div>
 
       <div class="post-title">
-          <a class="post-title-link" href="/2022/07/23/omics_genome_quality.assessment_mapping_intro/" itemprop="url">
-            <span itemprop="name">基因组质量评估：（五）mapping法：1. 简介</span>
-          </a>
-      </div>
-
-    </header>
-  </article>
-
-  <article itemscope itemtype="http://schema.org/Article">
-    <header class="post-header">
-
-      <div class="post-meta">
-        <time itemprop="dateCreated"
-              datetime="2022-07-23T00:00:00+08:00"
-              content="2022-07-23">
-          07-23
-        </time>
-      </div>
-
-      <div class="post-title">
-          <a class="post-title-link" href="/2022/07/23/omics_genome_quality.assessment_mapping_rate_samtools/" itemprop="url">
-            <span itemprop="name">基因组质量评估：（五）mapping法：2. samtools计算mapping rate</span>
+          <a class="post-title-link" href="/2021/11/19/omics_transcriptome.RNA-seq/" itemprop="url">
+            <span itemprop="name">RNA-sequencing数据分析工具比较</span>
           </a>
       </div>
 
@@ -484,6 +464,60 @@ <h2 class="collection-header">HiSat2
 
   
 
+<script>
+  function loadCount() {
+    var d = document, s = d.createElement('script');
+    s.src = 'https://yanzhongsino.disqus.com/count.js';
+    s.id = 'dsq-count-scr';
+    (d.head || d.body).appendChild(s);
+  }
+  // defer loading until the whole page loading is completed
+  window.addEventListener('load', loadCount, false);
+</script>
+
+</body>
+</html>
+lib/velocity/velocity.ui.min.js"></script>
+
+<script src="/js/utils.js"></script>
+
+<script src="/js/motion.js"></script>
+
+
+<script src="/js/schemes/pisces.js"></script>
+
+
+<script src="/js/next-boot.js"></script>
+
+
+
+
+  
+
+
+
+
+  
+<script src="/js/local-search.js"></script>
+
+
+
+
+
+
+
+
+
+
+
+
+
+  
+
+  
+
+  
+
 <script>
   function loadCount() {
     var d = document, s = d.createElement('script');
diff --git a/wechat/alipay_code.jpg b/wechat/alipay_code.jpg
deleted file mode 100644
index eb6bfc070d..0000000000
Binary files a/wechat/alipay_code.jpg and /dev/null differ
diff --git a/wechat/wechatpay_code.jpg b/wechat/wechatpay_code.jpg
deleted file mode 100644
index 6cb0cf38b8..0000000000
Binary files a/wechat/wechatpay_code.jpg and /dev/null differ