我有以下的列数据帧之间没有空格栏,分裂时,有两个词
Ann
Intergenic
exon (ENS, exon 2 of 2)
promoter-TSS (ENST)
TTS (ENST0)
intron (ENST, intron 1 of 1
和我的目标在列安分成Ann1这样,
Ann Ann1
Intergenic Intergenic
exon (ENS, exon 2 of 2) exon
promoter-TSS (ENST) promoter-TSS
TTS (ENST0) TTS
intron (ENST, intron 1 of 1) intron
所以我试过,
df["Ann1"]=df['Ann'].apply(lambda x: x.split('\s'))
df["Ann1"]
[Intergenic]
1 [exon (ENST, exon 2 of 2)]
4 [promoter-TSS (ENST)]
5 [TTS (ENST)]
6 [intron (ENST, intron 1 of 1)]
但它看起来像空间不是“空间”喜欢分裂它。任何建议将是巨大的
Soory也是我能做到这样,最终[ '注释']适用。(拉姆达X:x.split( ' ')[0]) – user1017373
是,'终[' 注释']适用。 (lambda x:x.split()[0])也可以工作,但如果有一些'NaN',则失败。但是,如果没有NaN是可能的使用它。 – jezrael
您可以通过将'n = 1'参数传递给'split'来确保它只会尝试在第一个空白处进行分割,从而使处理器免于工作。 'df [“Ann1”] = df ['Ann']。str.split(n = 1).str [0]' – piRSquared