2017-10-12 91 views
1

我已经看过以前提过的关于在列表中保留'for循环'输出的问题,但我似乎无法将其应用于我的函数。将for循环的输出添加到列表中

也许有人可以给我一个关于我做错了什么的线索。

dna_seqs <- list('id1', 'ATGGCAATAACCCCCCGTTTCTACTTCTAGAGGAGAAAAGT', 'id2', 'TCCGTTAAGATATTCTTACGTGTGACGTAGCTATGTATTTTGCAGAGCTGGCGAACGCGTTGAACACTTCACAGATGGT', 'id3', 'AGCTGGTTCCTGCGTGAGCTCGAGACTCGGGATGACAGCTCTTTAAACATAGAGCGGGGGCGTCGAACGGTCGA', 'id4', 'CATCACCGCGATAGGCTGACAAAGGTTTAACATTGAATAGCAAGGCACTTCCGGTCTCAATGAACGGCCGGGAA') 

gc_list <- list() 
count_gc <- function(x) { 
    for (i in x) { 
    if (startsWith(i, 'id')) { 
     gc_list[[i]] <- i 

    } 
    else { 
     seq <- str_to_upper(i) 
     seq <- gsub('N', '', seq) 
     gc <- str_count(seq, 'G') + str_count(seq, 'C') 
     gc_content <- gc/nchar(seq) * 100 
     gc_list[[i]] <- gc_content 
    } 
    } 
} 

这个函数没有在列表中追加任何元素,它仍然是空的?

+0

一个自定义函数中你不应该从全局环境中使用静态对象。相反,使用一个变量并在函数调用中返回它:'count_gc < - function(x)...'。在函数中用'mylist [[i]]'替换'gc_list [[i]]',在开始处放置一个mylist < - list(),在末尾放置一个'mylist'它用'gc_list < - count_gc(x)'。 – LAP

回答

5

使用lapply()并保存自己的担心

gc_list <- lapply(dna_seqs, function(seq) { 
    if (startsWith(seq, "id")) { 
     seq 
    } else { 
     seq <- str_to_upper(seq) 
     seq <- gsub('N', '', seq) 
     gc <- str_count(seq, 'G') + str_count(seq, 'C') 
     gc/nchar(seq) * 100 
    } 
}) 

不过还好,使用一个 '整洁' 的数据结构

df = data.frame(
    id = unlist(dna_seqs[c(TRUE, FALSE)]), 
    seq = unlist(dna_seqs[c(FALSE, TRUE)]), 
    stringsAsFactors = FALSE 
) 

和简单(没有if()条件)和矢量化(x可以任何长度)功能

gc_content = function(x) { 
    x = gsub("N", "", str_to_upper(x)) 
    str_count(x, "[GC]")/nchar(x) * 100 
} 

变异整洁数据

df$gc = gc_content(df$seq) 
1

请使用下面的代码

for(i in 1:length(dna_seqs)){ 

    if (startsWith(dna_seqs[[i]], 'id')) { 
    gc_list[[i]] <- dna_seqs[[i]] 

    } 
    else { 
    seq <- str_to_upper(dna_seqs[[i]]) 
    seq <- gsub('N', '', seq) 
    gc <- str_count(seq, 'G') + str_count(seq, 'C') 
    gc_content <- gc/nchar(seq) * 100 
    gc_list[[i]] <- gc_content 
    } 
} 
相关问题