我正在使用csv
表单(movielens latest-small dataset)中的两个数据集。以下是两者的领域。Excel - 将两个csv文件合并为一个具有公共列的文件
rating.csv
user_id movie_id rating
movie.csv
movie_id movie_name
我要的是将其与以下领域
user_id movie_id movie_name rating
合并成一个单一的.csv从而使公用列movie_id
映射与相应的movie_name
。
这可以使用Excel来完成吗?如果不是,我该怎么做?
我只是需要它作为我的推荐器引擎的数据集,所以任何简单的解决方案都是值得欢迎的,因为最终结果就是最重要的。但是由于我在java中有一些经验,所以对我来说很容易理解和实现。
如果有某种方式使用Excel,那么这将是最好的。我尝试在网上搜索,发现一些VLOOKUP
方法,但无法清楚地得到它。
此外,我尝试了一些在线合并工具,但他们只是附加一张纸,一张接着一张没有映射列。所以我也没有问题使用在线工具。
因为是代表你的问题是有点“过于宽泛” - 你可以请更新你的问题,以表明*你是如何做到这一点合并例如在Excel中使用公式;与VBA;与其他语言/框架? –
那么你的推荐引擎是用Java编写的吗?如果您要使用.Net,则可以使用LINQ运行将它们结合使用的查询,并在内存中使用该数据集。虽然我不确定Java的等价物。 –
是的,它在java中。但是奇怪的是,使用Excel或在线工具无法做到这一点。我认为这是一个不需要任何脚本的例行操作。可以结合两个csv如此复杂吗? – techvigil