你可以建立一个二分图,其中日期时间为一部分,ColA/ColC值为另一部分。然后将该图“投影”到日期时间节点上 - 如果它们都链接到ColA/ColC节点,则在两个日期时间之间创建链接。
下面是一些代码,显示了一种方法来创建一个无向图。我不明白你的例子中的方向意味着什么。
import csv
import StringIO
import networkx as nx
from networkx.algorithms import bipartite
data ="""Datetime,ColA,ColB,ColC
2015/07/12 08:45:34,ABC,12,
2015/07/12 08:46:04,DCD,10,ABC
2015/07/12 08:46:23,XYZ,34,ABC
2015/07/12 08:46:56,MNO,10,XYZ
2015/07/12 08:46:56,FGH,20,"""
G = nx.Graph()
csvfile = StringIO.StringIO(data)
reader = csv.DictReader(csvfile)
nodes = []
for row in reader:
nodes.append(row['Datetime'])
G.add_node(row['Datetime'])
if row['ColA'] != '':
G.add_edge(row['Datetime'],row['ColA'])
if row['ColC'] != '':
G.add_edge(row['Datetime'],row['ColC'])
print G.edges()
B = bipartite.projected_graph(G, nodes)
print B.edges()
输出
[('2015/07/12 08:46:23', 'XYZ'), ('2015/07/12 08:46:23', 'ABC'), ('ABC', '2015/07/12 08:46:04'), ('ABC', '2015/07/12 08:45:34'), ('DCD', '2015/07/12 08:46:04'), ('FGH', '2015/07/12 08:46:56'), ('2015/07/12 08:46:56', 'XYZ'), ('2015/07/12 08:46:56', 'MNO')]
[('2015/07/12 08:46:23', '2015/07/12 08:46:04'), ('2015/07/12 08:46:23', '2015/07/12 08:46:56'), ('2015/07/12 08:46:23', '2015/07/12 08:45:34'), ('2015/07/12 08:46:04', '2015/07/12 08:45:34')]
你可以用邻接表来呈现图形结构。看看这篇文章。 http://interactivepython.org/LpOMZ/courselib/static/pythonds/Graphs/graphintro.html#an-adjacency-list – czheo
@czheo谢谢你的建议。我试图创建所有列作为属性的节点。超出了这里简单示例所示的内容。 – sfactor