从NBCI上下载大量细菌的SRA测序文件及其对应的fasta文件

第一步 从genome数据库中下载对应信息

  1. 打开NCBI,进入genome数据库
  2. 从Custom resources下进入Microbes,再进入Browse microbial genomes
  3. 输入需要的物种,可以进一步筛选(filter),然后download

第二步 提取csv结果文件中的biosmple列的biosample号和replicon列的chromesome号

  1. replicon,有一些是空的,需要筛选;chromesome号有CP、NZ、NC三种,按需提取
  2. 分别将biosample号、chromesome号存为文件

第三步 batch entrez下载数据

  1. nucleotide数据库下载chromesome号的文件,已经就是fasta文件了
  2. biosample数据库下载biosample的summary文件;如需更多信息,可以选择full下载样本的所有信息,包括environment等;下图为选择full之后的下载结果,可能存在部分样本不含SRA文件的情况,可以进一步筛选(也可以直接在搜索页面进行筛选)
  3. 提取上一步下载的文件的sra号,再去选择sra数据库下载SRA文件