你需要利用任何read.table
或read.delim
的quote =
说法......
res <- read.delim(pURL, header=F, sep=',', dec = '.', stringsAsFactors=F , quote = "\"" , fill = TRUE , skip = 2)
的分隔符为","
不是"\t"
。写成千万的数字是总是在此文件中引用,因此您可以使用quote
参数使R忽略与quote = "\""
的引号内的逗号,并且您希望跳过前两行,并使用fill = TRUE
填充空格在不平坦的线上。
head(res)
# 2003-12 2004-12 2005-12 2006-12 2007-12 2008-12 2009-12 2010-12 2011-12 2012-12 TTM
#2 Revenue EUR Mil 2,116 2,260 2,424 2,690 2,908 3,074 3,268 3,892 4,190 4,989 5,034
#3 Gross Margin % 60.6 60.3 57.3 58.2 57.6 56.9 56.1 55.5 55.4 55.8 56.1
#4 Operating Income EUR Mil 365 404 394 460 505 515 555 618 683 832 841
#5 Operating Margin % 17.2 17.9 16.2 17.1 17.4 16.7 17.0 15.9 16.3 16.7 16.7
#6 Net Income EUR Mil 200 227 289 331 371 389 402 472 518 584 594
#7 Earnings Per Share EUR 3.90 4.30 5.44 6.22 3.48 3.62 3.78 4.36 4.82 2.77 2.80
我设置的res
以后这样的列名...
names(res) <- res[1,]; res <- res[-1,]
这给了更好的格式。
非常感谢那真棒的答案! – nopeva
@ AP13你非常欢迎。非常感谢您提供可重现的例子! :-) –