-2
我有大约10K这样的分层字符串。他们可以有多达10-12层次的层次结构(/)。分层字符串的频率分布
/a/b/c /a/b/d /e/b/c
每个级别我,我想计算层级路径向上分配I级。因此,对于上述情况下,这将是这样的:
level 0:
/a 0.67
/e 0.33
level 1:
/a/b 0.67
/e/b 0.33
level 2:
/a/b/c 0.33
/a/b/d 0.33
/e/b/c 0.33
我怎样才能有效地为这个字符串10K 10-12级的最大做。这必须是一个非常常见的字符串操作算法,但我忘记了正确的名字。谢谢。
您可以使用任何解析库或工具(例如,在原始文本文件中使用sed或正则表达式库)来提取所需的数据。 – jwimberley