2015-05-20 97 views
-3

我是R新手,需要帮助来比较内容列。将列的内容与另一个数据集进行比较

我按照特定的栏目排列了我的第一张表格。为此,我使用了以下功能:

x = fread ("x.txt", sep = ";") 
x_order = x [order (x $ V3)] 

我正在处理大约500万行文件,只需要减少这个数字。 一种方法是消除等于10,450项目列表的数据。也就是说,这500万行我有一列与这个列表相同和不同的值。

任何想法我可以做什么?

感谢

回答

0

如果你愿意,你可以用“在岬否定”。我的意思是!%in%。这里有一个简单的演示:

set.seed(1); 
x <- data.frame(letters=sample(letters[1:10]),numbers=sample(1:10)); 
x; 
## letters numbers 
## 1  c  3 
## 2  d  2 
## 3  e  6 
## 4  g  10 
## 5  b  5 
## 6  h  7 
## 7  i  8 
## 8  f  4 
## 9  j  1 
## 10  a  9 
eliminate <- sample(letters[1:10],3); 
eliminate; 
## [1] "j" "b" "f" 
x[!x$letters%in%eliminate,]; 
## letters numbers 
## 1  c  3 
## 2  d  2 
## 3  e  6 
## 4  g  10 
## 6  h  7 
## 7  i  8 
## 10  a  9 

这无论工作data.frame x和矢量eliminate的排序。

相关问题