ff

    1热度

    2回答

    您好我想从一个包含使用ffbase包的复制功能日期和下面的代码FF矢量删除重复: v1 <- c("24-Mar-94", "24-Mar-94", "27-Mar-94", "28-Jun-1986", "29-Jul-1988", "28-Jun-1986", "15-Jan-1999", "13-Jan-1999") v1.d <- as.Date(v1, format="%d-%b-%y

    1热度

    1回答

    我试着给我的ffdf添加一个Source列,但似乎无法让它工作......如果它是一个正常的df我会简单地写 mtcars$NewCol <- "AB" 如果我这样做了ffdf它返回一个错误 require(ff) require(ffbase) mtcarsff <- as.ffdf(mtcars) mtcars$NewCol <- "testname" Error in `[[

    1热度

    1回答

    晚上好, 我试图将数据集加载为R时(〜20点密耳的行,140〜COLS 6.2gb在磁盘上),使用任一的LaF和ffbase或FF。无论哪种情况,加载都会失败。 struct <- detect_dm_csv(file = '/scratch/proj.csv', header = TRUE) colClasses <- struct$columns[,2] ldat <- laf_open(

    3热度

    1回答

    从save.ffdf的文档: 使用“save.ffdf”自动地设置的FF“的的终结器的‘’ 向量‘‘关闭’’。这意味着当对象被删除或R会话关闭时,数据将保留在 磁盘上。数据可以 被删除或者使用“删除”或通过除去其中 对象被保存(“DIR”)的目录。 我想先从一个小的ffdf数据框开始,一次添加一些新数据,然后将它放在磁盘上。所以,我做了一个小实验: # in R ffiris = as.ffdf

    0热度

    1回答

    是否可以将来自多个文件的数据立即加载到ff数据框(ffdf)中? 可以说我有 big_file_part1.csv big_file_part2.csv big_file_part3.csv 我知道我可以每个CSV文件加载到一个单独的ffdf对象,然后ffdfrbind.fill在一起。 但是,这似乎是一个低效率的方式,加载东西两次。有更直接的方法吗?

    3热度

    2回答

    在使用read.csv.ffdf读取大型数据集之后,其中一列是时间。如2014-10-18 00:01:02,该列中有1百万行。该栏是一个因素。如何将其转换为POSIXct由ff支持?简单地使用as.POSIXct()只是将值变成NA 或者当我在开始读取数据集时,我可以指定该列为POSIXct? 我的目标是获得月和日(甚至小时)。所以我对除了转换为POSIXct之外的解决方案开放。 例如,我们有9

    0热度

    1回答

    我有一个包含多列的ffdf。我想查找从数据中自动确定的read.table.ffdf作为字符串矢量的列类。 这样做的一种粗略的方法似乎是循环遍历列和使用类(Data [1,index])。是否有一种更优雅的方式一次完成这一切? 我试着看着ffdf对象的方法,但没有一个看起来合适。 谢谢!

    0热度

    2回答

    我可否轻松地删除ffdf对象的列? library(ff);library(ffbase) irisdf=as.ffdf(iris) 如何只包含Sepal.length和Species列?

    0热度

    1回答

    我有一个很大的(23 Mln行)ffdf表(tbl_ffdf),有10列,其中7个是因子,3个包含数字。它看起来是这样的: TABLE_bad F1 F2 F3 F4 F5 F6 F7 N1 N2 N3 1111 01.15 05.14 busns AA 16 F 55.2 16165 0 1111 01.15 05.14 busns AA 16 F

    0热度

    1回答

    我有一个ff dataframe变量,它的名字是在循环的每次迭代中在代码中创建的。我想将此变量的rownames设置为NULL,但下面的代码不起作用。有人可以提出一个解决方案吗? a="foo" row.names(eval(parse(text=paste(a, "_USD.ff", sep="")))) <- NULL