Aqueles não são comandos bash, são comandos R. Ele não diz isso explicitamente no README por algum motivo, mas o <-
é uma oferta inoperante. Eu não sei o que é mothur
, mas esses comandos do README que você mostra devem ser todos executados em R, não em bash:
tax <- read.table(file="trainset10_082014_rmdup.tax", sep="\t")
tax$V2 <- gsub(" ", "_", tax$V2) #remove spaces and replace with '_'
tax$V2 <- gsub("[^;]*_incertae_sedis$", "", tax$V2)
tax$V2 <- gsub('\"', '', tax$V2) #remove quote marks
e
levels <- read.table(file="trainset10_db_taxid.txt", sep="*", stringsAsFactors=F)
subs <- levels[grep("sub", levels$V5),]
sub.names <- subs$V2
tax.split <- strsplit(tax$V2, split=";")
remove.subs <- function(tax.vector){
return(tax.vector[which(!tax.vector %in% sub.names)])
}
no.subs <- lapply(tax.split, remove.subs)
no.subs.str <- unlist(lapply(no.subs, paste, collapse=";"))
no.subs.str <- gsub("^Root;(.*)$", "\1;", no.subs.str)
e
write.table(cbind(as.character(tax$V1), no.subs.str), "trainset10_082014.rdp.tax", row.names=F, col.names=F, quote=F, sep="\t")
Todos os comandos acima, que como mencionado devem ser executados em R, preparam seu arquivo para uso com mothur
. Eles simplesmente modificam o arquivo que contém as informações de taxonomia para que seja compatível com mothur
. O autor do post escolheu usar R para as etapas de formatação.
Então, você precisa executar os comandos que citei aqui em R (abra um terminal, execute R
e cole os comandos no shell interativo do R). Os que eu não citei aqui devem ser executados no bash.