2010-10-16 199 views
1

我需要计算IP数据包的校验和,如http://www.faqs.org/rfcs/rfc1071.html中所述。在Python中计算IP校验和

我已经下面的代码:

#!/usr/bin/python 
import struct 

data = "45 00 00 47 73 88 40 00 40 06 a2 c4 83 9f 0e 85 83 9f 0e a1" 

# a test for the checksum calculation 

def _checksum(data): 
    #calculate the header sum 
    ip_header_sum = sum(struct.unpack_from("6H", data)) 
    #add the carry 
    ip_header_sum = (ip_header_sum & 0xFFFF) + (ip_header_sum >> 16 & 0xFFFF) 
    #invert the sum, python does not support inversion (~a is -a + 1) so we have to do 
    #little trick: ~a is the same as 0xFFFF & ~a 
    ip_header_sum = ~ip_header_sum & 0xFFFF 

    return ip_header_sum #should return 0 if correct 

data = data.split() 
data = map(lambda x: int(x,16), data) 
data = struct.pack("%dB" % len(data), *data) 

print " ".join(map(lambda x: "0x%02x" % ord(x), data)) 
print "Checksum: 0x%04x" % _checksum(data) 

它与我所使用Wireshark捕获和一个包,必须具有正确的校验和,因此应计算为0

不幸的是,结果是0x6524。 有趣的是,对于每个正确的数据包,结果始终为0x6524 ...

谁发现错误?

编辑,以使误差更清晰 * *编辑

+0

Python的说:'NameError:全局名称 '一个' 不defined'。你的意思是'ip_header_sum =〜ip_header_sum&0xFFFF'? – Seth 2010-10-16 17:51:02

+0

对不起。现在已经纠正了。 – Simon 2010-10-16 18:53:00

回答

8

您可以直接使用checksum udp calculation python的解决方案,这会导致预期的校验和值为零。

import struct 

data = "45 00 00 47 73 88 40 00 40 06 a2 c4 83 9f 0e 85 83 9f 0e a1" 

def carry_around_add(a, b): 
    c = a + b 
    return (c & 0xffff) + (c >> 16) 

def checksum(msg): 
    s = 0 
    for i in range(0, len(msg), 2): 
     w = ord(msg[i]) + (ord(msg[i+1]) << 8) 
     s = carry_around_add(s, w) 
    return ~s & 0xffff 

data = data.split() 
data = map(lambda x: int(x,16), data) 
data = struct.pack("%dB" % len(data), *data) 

print ' '.join('%02X' % ord(x) for x in data) 
print "Checksum: 0x%04x" % checksum(data) 

结果:

45 00 00 47 73 88 40 00 40 06 A2 C4 83 9F 0E 85 83 9F 0E A1 
Checksum: 0x0000 
+0

也不起作用。它也给出了结果0x6524。我相信错误不在计算中,而是在解包中。但校验和是从软件包的前96位计算出来的,不是吗? – Simon 2010-10-17 17:17:21

+0

为了证明它确实有效,提供了zer0的校验和结果。 – 2010-10-18 16:57:33

6

你有两个问题在这里第二次。

首先,您拨打struct.unpack_from的电话只打开缓冲区中的4个16位值(即8个字节)。如果你想解开整个标题,你需要做一些类似struct.unpack_from("!nH")的地方,其中n是你想要解包的短裤数量。假设data只包含IP标头,则可以使用struct.unpack_from("!%dH"%(len(data)/2), data)生成适当的格式字符串。

其次,一旦你这样做了,你会发现校验和现在可以达到0.这是一个已经有校验和的数据包的正确结果,就像这样。 (您在上面的数据包中突出显示了A2C4字节。)要从头开始计算数据包的正确校验和,需要将校验和字节设置为0.(请参阅RFC1071中步骤2的开头:“生成校验和,校验和字段本身被清除“)。

+2

*您突出显示了上面的数据包中的ac和c4字节* - 我不认为Simon有意突出显示了示例数据包的任何字节,StackOverflow引擎的确认为它是一些代码 – mykhal 2010-10-16 19:17:24

+0

数据参数包含整个数据包。我也没有解开校验和所以它应该给校验和(但可能是字节交换) – Simon 2010-10-16 20:58:35

+0

我已经做了什么尼克告诉,但仍然不起作用,看到更新的问题 – Simon 2010-10-17 14:35:20