我有两个文件,两者都非常大。这些文件混合了它们之间的信息,我需要比较两个文件并连接相交的线。从两个filles连接类似的线
一个例子是:
一号文件有
var1:var2:var3
2日将有
var2:var3:var4
我需要这些在第三个文件,输出连接:var1:var2:var3:var4
。 请注意,行不匹配,var4应与var1一起使用(因为它们有var2
和var3
在一起)。 Var2和Var3在Var1和Var4中很常见。可能在这些巨大的文件中很遥远。 我需要找到一种方法来比较每一行并将其连接到第二个文件中的一行。我似乎无法想到任何足够的循环。有任何想法吗?
你如何辨别时,两行有两个或更多的记录(在你的例子中“var _ _”)是共同的吗?至少有一个共同点? –
mojo
创建的第三个文件必须采用以下格式:var1:var2:var3:var4。 var2和var3对于var1和var3是很常见的。 Var2和Var3总是成对出现,所以如果一个是共同的,另一个是共同的。 – user3184354
你保证'var2'只出现在每个文件中一次吗?两个文件之间的“十字路口”是否保证只存在一次?也就是说,从file1开始的一行,是否会有多行包含它所包含的记录(例如'var2'或'var4')? – mojo