我是初学者。使用SQL连接和子查询来查询R中的两个表格
我有两个.txt文件和我使用R 3与sqldf PAKAGE查询他们
第一个表(venues.txt)是这样的:
userID,venueID,year,month,date,hour
1302,47,2012,2,24,11
45,132,2012,2,24,11
24844,86,2012,2,24,11
896,248,2012,2,24,11
5020,29,2012,2,24,11
第二个表(朋友.TXT)是这样的:
userID,friendID
1,5
1,9
1,50
1,102
1,300
我要查询的地点(venueID),用户(比如用户ID = 1)访问与一个或多个他的朋友(friendID)
注:这两个用户ID,朋友表friendID可能与用户ID在场地表
查询结果应该是这样的:
venueID friendID
47 5
47 9
29 102
86 102
我可以做到这一点使用许多单独的查询,然后加入他们在一个表中,但我的数据集非常大。有没有更简单的方法来做到这一点?
我能够查询已访问由用户或他的朋友所有场馆:
sqldf("select userID, venueID from data
where userID=1 OR userID IN (select friendID from freind where userID=1)")
非常感谢。
你的意思是说,你想要一个用户访问过的地点列表,他的一个朋友也访问了这个列表?换句话说,至少有两个朋友参观过的场馆列表?或者你想要一个至少有两个朋友一起参观的场所列表,所以具有相同的年份,月份,日期,小时? –
我需要两个实际。这将是greaat! –