2021.04.12丨对测序样品统一命名

 

  • 摘要
    • 在公司已经待了几个月,项目也有条不紊地推进。RNA-seq流程是早就搭建好了的,奈何拿到的测序样品数据名称和后缀经常会有一些变化,比如R1.fq.gz, R1_001.fq.gz, R1_001.fastq.gz等等。导致每次都要到流程里面改一下后缀。为了尽早实现标准化,周末闲来无事,把这个统一命名的问题解决了一下
  • 环境配置
    • python:3.8.5
  • 使用代码
#encoding=utf-8
import os
path = "./"
filelist = os.listdir(path) #该文件夹下所有的文件(包括文件夹)
for file in filelist:print(file)
for file in filelist:   #遍历所有文件Olddir=os.path.join(path,file)   #原来的文件路径#print(Olddir)'''if os.path.isdir(Olddir):   #如果是文件夹则跳过continue'''filename=os.path.splitext(file)[0]   #文件名filetype=os.path.splitext(file)[1]   #文件扩展名if "_R1" in filename:filename=filename.split('_R1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)elif "_1" in filename:filename=filename.split('_1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)if "_R2" in filename:filename=filename.split('_R2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)elif "_2" in filename:filename=filename.split('_2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)else:continue#os.rename(Olddir,Newdir)#重命名

结果展示:

处理前

处理后

总结:慢慢地还要通过脚本去解决一些小问题,比如单/双端测序在snakemake工作流上的识别,一次性输入解决样品的差异分组等。完成这些小问题都有助于完善流程的标准化。

代码参考:(1条消息) python实现文件重命名_不负韶华,逐梦如初-CSDN博客_python重命名文件名

 

 

 

 

 

2021.04.12丨对测序样品统一命名

 

  • 摘要
    • 在公司已经待了几个月,项目也有条不紊地推进。RNA-seq流程是早就搭建好了的,奈何拿到的测序样品数据名称和后缀经常会有一些变化,比如R1.fq.gz, R1_001.fq.gz, R1_001.fastq.gz等等。导致每次都要到流程里面改一下后缀。为了尽早实现标准化,周末闲来无事,把这个统一命名的问题解决了一下
  • 环境配置
    • python:3.8.5
  • 使用代码
#encoding=utf-8
import os
path = "./"
filelist = os.listdir(path) #该文件夹下所有的文件(包括文件夹)
for file in filelist:print(file)
for file in filelist:   #遍历所有文件Olddir=os.path.join(path,file)   #原来的文件路径#print(Olddir)'''if os.path.isdir(Olddir):   #如果是文件夹则跳过continue'''filename=os.path.splitext(file)[0]   #文件名filetype=os.path.splitext(file)[1]   #文件扩展名if "_R1" in filename:filename=filename.split('_R1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)elif "_1" in filename:filename=filename.split('_1')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R1.fastq"+filetype)print(Newdir)if "_R2" in filename:filename=filename.split('_R2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)elif "_2" in filename:filename=filename.split('_2')print(filename[0])Newdir=os.path.join(path,filename[0]+"_R2.fastq"+filetype)print(Newdir)else:continue#os.rename(Olddir,Newdir)#重命名

结果展示:

处理前

处理后

总结:慢慢地还要通过脚本去解决一些小问题,比如单/双端测序在snakemake工作流上的识别,一次性输入解决样品的差异分组等。完成这些小问题都有助于完善流程的标准化。

代码参考:(1条消息) python实现文件重命名_不负韶华,逐梦如初-CSDN博客_python重命名文件名