data-manipulation

1热度

3回答

我正在处理来自不同来源的关于同一事物的巨大Excel表格。消息来源报告并记录信息的方式不同。因此，例如，一个人会将位置写为“Khurais”，而另一个会将其写为“Khorais”。由于这两个文件都包含重要信息，我想将它们合并到一个Excel表中，以便我可以更轻松地处理它们。因此，如果您有任何您认为有益的建议或工具，请在此分享。 P.s. excel表单中的单词是阿拉伯词的翻译。

1热度

2回答

R中

换上多串相同的文本这里是我的样本数据： root <- c("how to manage xxx","how to run xxx","how to operate xxx") type <- c("resturant","grocery store","retail store") 我想，在“类型”每个字符串替换XXX。现在我正在使用gsub函数，但它一次只能替换一个查询。 kw <- g

1热度

1回答

基于预定义桶的百分比垃圾箱

我有一系列数字，我想知道数据的每个桶中落入的数字的百分比。 df['cuts']具有10,20和50的值。具体来说，我想series的％是在[0-10], (10-20] and (20-50] bin中，这应该附加到df数据帧。我写了下面的代码。我绝对认为它可以是即兴创作的。任何帮助表示赞赏。 bin_cuts = [-1] + list(df['cuts'].values) out = p

0热度

1回答

操纵基于另一列

我有一个数据帧（如下所示）列的值： df <- read.table(header = TRUE, text = "STUD_ID MEAS VALUE 1 LVEF(M-M) 69 1 LVEF(2D) 66 2 LVEF(2D) 36 2 LVEF(2D) 72 2 IVSD 63

2热度

4回答

采用相同的标准在许多列计算新列

我有类似下面的一个数据帧，除了我有17个变量（如Var1和Var2），而不是2 df <- read.table(header = TRUE, text = "STUD_ID Var1 Var2 1 0 0 1 0 1 2 1 2 3 3 0", stringsAsFactors = FALSE

1热度

3回答

访问多级属性及其属性的完整路径

我目前正在努力解决JavaScript问题。我想通过传入原始对象以及一组路径到我想要的属性来返回多级属性以及其中包含的每个变量。举例来说，如果我有以下对象： obj = { product: { candidate: { id: 10, reference: "test", count: 4, steps: 10 }

1热度

1回答

两个数据重复测试

如果我有2个数据有一些相同的列名，我想检查不同的观测值，我该怎么办？这里是我的样本数据： # dt1 ID Name ColA ColB 2 Peter 1 2 4 Freda 50 4 5 Jean 8 10 # dt2 ID Name ColA ColB ColC ColD 1 Roger 1 2 400 2 Peter 1 2 500 2000 3 Tin

1热度

2回答

保留基于其他列的观察

此问题是从here的扩展。如果我的数据有一个名为Remark柱： ID Name Type Date Amount Remark 1 AAAA First 2009/7/20 100 Not want 1 AAAA First 2010/2/3 200 want ya 2 BBBB First 2015/3/10 250 2 CCC Second 2009/2/

3热度

1回答

蟒蛇 - 逗号分隔字符串列的二进制编码

有人可以帮我看起来像下面的例子从这里去一个数据的二进制编码： df = pd.DataFrame({'_id': [1,2,3], 'test': ['one,two,three', 'one,two', 'two']}) print(df) _id test 0 1 one,two,three 1 2 one,two 2 3 two 到这里：

1热度

1回答

在r函数中子集 - 总是返回所选变量的第一个因子

我想在我编写的函数中使用子集数据，但我一直遇到同样的问题，即子集数据是我想要的。样本数据： n = c(2, 3, 5) QID = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, QID, b) df$QID = as.character(df$QID) str(df) 'data.frame': 3