想试试flexbar切接头和barcode的效果,于是根据文章内容模拟了一个数据集,另外,使用16S测序的示例数据看看分barcode的情况。 继续阅读“flexbar3.0试用笔记”
分类: 生物信息
再学质控
纸上得来终觉浅呀!拿到真正的测序数据进行分析的时候才发现有各种各样的问题,不是简单的跑一下流程就能解决的。只有再次加强 学习。 继续阅读“再学质控”
找变异流程之snp_call –WES学习之路
参考了许多WES的流程之后,终于学会了几个找变异软件的使用,记在这里备忘一下。学习不可囫囵吞枣,我还是把软件的各个参数理解下,也充实下内容,避免只有代码的尴尬。
1、找变异的前处理
SILVA数据库全库下载序列的处理
处理用于QPCR引物设计的16S序列
最近在做肠道微生物的课题,搜索得知SILVA数据库是最近更新而且用的最多的,看网上的教程把其全库的序列下载了下来,没有比对的有200多兆,比对完的超过三个G,参考的那个微信公众号文章说只需要下载没有比对的,我还不信邪,把两个都下载下来了,一个解压后有3G,另一个有76g多,实在是难以处理,3g多的还勉强可以操作,于是就一小的文件做了筛选。
筛选用的是我刚入门的python,虽然水平挺菜,但是至少能用,水平也或许制约这我难以处理76g的文件。贴上我的一段筛选代码,及其简单,都没有什么复杂结构,水平啊!就是从中筛选出一个门或者属/种的16S序列。 继续阅读“SILVA数据库全库下载序列的处理”