Rename Sequences by TBtools
小黑Black_007
发布于:2022年11月5日
这一篇就是针对有时候我们需要从文献之中获取Accesion Number来构建系统树,首先我们把pdf转成excel然后提取序列,并做好命名工作。
TBtools批量下载,应该很简单。在如图所示的位置下载就行。
然后是修改名字,这里一般是用两步,第一步删掉除了序列号以外的其他信息,可以用这行命令来执行:
1sed -i 's/\.1.*//g' ef1.fasta
删之前长这样,删后如下:
然后使用 ID rename 功能进行更名
然后就可以进行常规的mafft,gblocks啦
1234567for i in *rename2.fasta;do linsi --thread 20 ${i} > ${i}.mafft;donefor i in *.mafft;do Gblocks $i -b4=2 -b5=a -t=d;done
博客内容遵循 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议
本文永久链接是:http://jungleblack007@gamil.com/2022/11/05/Rename-Sequences-by-TBtools/
更新于:2022年11月5日
生物信息学
物种调查报告数据分析流程
现在没有太多时间来处理这个,所以搞得比较急,之后会把整个过程写成一个R语言的函数一步实现的,目前就只能先这样啦。
长表变横表
我们在做物种调查表的时候经常会遇到需要将长表、横表互相变换的情况...
ITS的批量处理和BLAST比对
ITSx, Blast
平时我们做一个调查项目,每一份标本都会提取一个its或者lsu的序列, 首先我们需要将所有的序列合并到同一个文件中,然后进行ITSx的分区,最后根据unite的数据库进行...