2016-07-24 62 views
2

目前我正在试图通过一个老蟒蛇CTF挑战的工作,提供了服务器的脚本,这个想法是正确的数据发送到该服务器,我应该如何解读这些数据/这些字符串

#!/usr/bin/env python3 
# from dis import dis 
import socketserver 
import types 


class RequestHandler(socketserver.BaseRequestHandler): 

    def handle(self): 
     self.request.sendall(b'PyDRM Proof of Concept version 0.7\n') 
     self.request.sendall(
      b'Submit the secret password to retrieve the flag:\n') 
     user_input_bytes = self.request.recv(4096).strip() 
     user_input = user_input_bytes.decode('utf-8', 'ignore') 
     if validate_password(user_input): 
      self.request.sendall(read_flag()) 
     else: 
      self.request.sendall(b'Invalid password\n') 


class RequestServer(socketserver.ThreadingMixIn, socketserver.TCPServer): 
    pass 


def read_flag(): 
    with open('flag.txt', 'rb') as fh: 
     return fh.read() 


def generate_validation_function(): 
    code_obj = types.CodeType(
     1, 
     0, 
     5, 
     32, 
     67, 
     b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07' 
     b'\x00d\x08\x00d\x05\x00d\t\x00d\x08\x00d\n\x00d\x01\x00d\x07\x00d\x07' 
     b'\x00d\x01\x00d\x0b\x00d\x08\x00d\x07\x00d\x0c\x00d\r\x00d\x0e\x00d' 
     b'\x08\x00d\x05\x00d\x0f\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05' 
     b'\x00d\x07\x00g \x00}\x01\x00g\x00\x00}\x02\x00x+\x00|\x01\x00D]#\x00' 
     b'}\x03\x00|\x02\x00j\x00\x00t\x01\x00t\x02\x00|\x03\x00\x83\x01\x00d' 
     b'\x10\x00\x18\x83\x01\x00\x83\x01\x00\x01qs\x00Wd\x11\x00j\x03\x00|' 
     b'\x02\x00\x83\x01\x00}\x04\x00|\x00\x00|\x04\x00k\x02\x00r\xb9\x00d' 
     b'\x12\x00Sd\x13\x00S', 
     (None, '\x87', '\x9a', '\x92', '\x8e', '\x8b', '\x85', '\x96', '\x81', 
     '\x95', '\x84', '\x94', '\x8a', '\x83', '\x90', '\x8f', 34, '', True, 
     False), 
     ('append', 'chr', 'ord', 'join'), 
     ('a', 'b', 'c', 'd', 'e'), 
     'drm.py', 
     'validate_password', 
     5, 
     b'\x00\x01$\x01$\x01\x1e\x01\x06\x01\r\x01!\x01\x0f\x01\x0c\x01\x04' 
     b'\x01', 
     (), 
     () 
    ) 
    func_obj = types.FunctionType(code_obj, globals()) 
    return func_obj 


def main(): 
    setattr(__import__(__name__), 'validate_password', 
      generate_validation_function()) 
    server = RequestServer(('0.0.0.0', 8765), RequestHandler) 
    try: 
     server.serve_forever() 
    except (SystemExit, KeyboardInterrupt): 
     server.shutdown() 
     server.server_close() 

if __name__ == '__main__': 
    main() 

编辑

我明白了,是怎么回事到如此地步,一个validate_password功能通过使用CODETYPE和函数类型对象创建。我也明白,如果validate_password(user_input)评估为True,该标志将被发送。这意味着返回类型必须是布尔值。 CodeType的文档以及服务器脚本也显示validate_password只有一个参数。

我的实际问题

源包含编译蟒蛇字节码。例如,b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07'。我尝试了许多方法来解码/编码这些字符串以获取一些有意义的数据,我设法提取的唯一数据是十六进制数据。

如何将此数据转换为实际代码,因此能够重建validate_password函数。

我曾尝试

- 我试图基本上做这样的回答表明,但在倒车时,我要么不理解正确的话,还是这不起作用

binascii。 b2a_hex() - 这是我如何设法将字符串转换为十六进制,就像我之前说过的那样,我不能从这个十六进制产生utf-8数据。

struct.unpack() - 这个方法已经取得了一些成功,但是在validate_password函数的上下文中数据意味着什么,我只能用这个方法获得整数。 (除非我误解)

回答

1

对das-g的回答嗤之以鼻,这段代码起作用。八九不离十。

import uncompyle6 
import types 
code_obj = types.CodeType(
     1, 0, 5, 32, 67, b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07' 
     b'\x00d\x08\x00d\x05\x00d\t\x00d\x08\x00d\n\x00d\x01\x00d\x07\x00d\x07' 
     b'\x00d\x01\x00d\x0b\x00d\x08\x00d\x07\x00d\x0c\x00d\r\x00d\x0e\x00d' 
     b'\x08\x00d\x05\x00d\x0f\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05' 
     b'\x00d\x07\x00g \x00}\x01\x00g\x00\x00}\x02\x00x+\x00|\x01\x00D]#\x00' 
     b'}\x03\x00|\x02\x00j\x00\x00t\x01\x00t\x02\x00|\x03\x00\x83\x01\x00d' 
     b'\x10\x00\x18\x83\x01\x00\x83\x01\x00\x01qs\x00Wd\x11\x00j\x03\x00|' 
     b'\x02\x00\x83\x01\x00}\x04\x00|\x00\x00|\x04\x00k\x02\x00r\xb9\x00d' 
     b'\x12\x00Sd\x13\x00S', 
     (None, '\x87', '\x9a', '\x92', '\x8e', '\x8b', '\x85', '\x96', '\x81', 
     '\x95', '\x84', '\x94', '\x8a', '\x83', '\x90', '\x8f', 34, '', True, 
     False), 
     ('append', 'chr', 'ord', 'join'), 
     ('a', 'b', 'c', 'd', 'e'), 
     'drm.py', 
     'validate_password', 
     5, 
     b'\x00\x01$\x01$\x01\x1e\x01\x06\x01\r\x01!\x01\x0f\x01\x0c\x01\x04' 
     b'\x01', 
     freevars=(), 
     cellvars=() 
    ) 

import sys 
uncompyle6.main.uncompyle(3.5, code_obj, sys.stdout) 

这里缺少的是这段代码实际上被封装在一个带有“a”参数的函数中。

我不会破坏给出答案的乐趣。相反:

  1. 运行上述程序。
  2. 裹在类似的输出:
    def drm(a): # Output from run above.
+0

谢谢你帮助我解决这个问题。没有必要道歉,很高兴有一个有价值的工具仍然保持,通过点成功更新,所以一切都已完成,以保持包最新:) @ das-g提供了丰富的答案,有大量的证据等,但是,这方法基本上自动化了我为其方法执行的步骤。 – RandomHash

+0

为了澄清,上述方法奏效。我不会破坏它为通过这个CTF的其他人。但仔细看看PEP文档也会给你密码:) – RandomHash

3

开始交互式Python 3会话。如果您如果您使用IPython的使用普通的Python解释器,键入

import types 
help(types.CodeType) 

,你可以写

import types 
types.CodeType? 

你会了解到types.CodeType是那里

Create a code object. Not for the faint of heart.

呃胡。什么是代码对象?我们来看看Python documentation

The type for code objects such as returned by compile() .

所以字节字符串参数可能,至少部分是二进制数据(或二进制指令),而不是(文字)串莫名其妙编码。

help?调用也告诉我们,这种类型的初始化的签名:

code(argcount, kwonlyargcount, nlocals, stacksize, flags, codestring, 
     constants, names, varnames, filename, name, firstlineno, 
     lnotab[, freevars[, cellvars]]) 

就这样,我们可以写出建设更多的自描述性:

code_obj = types.CodeType(
     argcount=1, 
     kwonlyargcount=0, 
     nlocals=5, 
     stacksize=32, 
     flags=67, 
     codestring=b'd\x01\x00d\x02\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05\x00d\x07' 
     b'\x00d\x08\x00d\x05\x00d\t\x00d\x08\x00d\n\x00d\x01\x00d\x07\x00d\x07' 
     b'\x00d\x01\x00d\x0b\x00d\x08\x00d\x07\x00d\x0c\x00d\r\x00d\x0e\x00d' 
     b'\x08\x00d\x05\x00d\x0f\x00d\x03\x00d\x04\x00d\x05\x00d\x06\x00d\x05' 
     b'\x00d\x07\x00g \x00}\x01\x00g\x00\x00}\x02\x00x+\x00|\x01\x00D]#\x00' 
     b'}\x03\x00|\x02\x00j\x00\x00t\x01\x00t\x02\x00|\x03\x00\x83\x01\x00d' 
     b'\x10\x00\x18\x83\x01\x00\x83\x01\x00\x01qs\x00Wd\x11\x00j\x03\x00|' 
     b'\x02\x00\x83\x01\x00}\x04\x00|\x00\x00|\x04\x00k\x02\x00r\xb9\x00d' 
     b'\x12\x00Sd\x13\x00S', 
     constants=(None, '\x87', '\x9a', '\x92', '\x8e', '\x8b', '\x85', '\x96', '\x81', 
     '\x95', '\x84', '\x94', '\x8a', '\x83', '\x90', '\x8f', 34, '', True, 
     False), 
     names=('append', 'chr', 'ord', 'join'), 
     varnames=('a', 'b', 'c', 'd', 'e'), 
     filename='drm.py', 
     name='validate_password', 
     firstlineno=5, 
     lnotab=b'\x00\x01$\x01$\x01\x1e\x01\x06\x01\r\x01!\x01\x0f\x01\x0c\x01\x04' 
     b'\x01', 
     freevars=(), 
     cellvars=() 
    ) 

(这只是因为types.CodeType()预计所有参数都是通过位置而不是关键字参数传递的。)

现在这意味着什么?

可以拆卸代码对象来接近这个问题:

import dis 
dis.dis(code_obj) 

(输出:)

6   0 LOAD_CONST    1 ('\x87') 
       3 LOAD_CONST    2 ('\x9a') 
       6 LOAD_CONST    3 ('\x92') 
       9 LOAD_CONST    4 ('\x8e') 
      12 LOAD_CONST    5 ('\x8b') 
      15 LOAD_CONST    6 ('\x85') 
      18 LOAD_CONST    5 ('\x8b') 
      21 LOAD_CONST    7 ('\x96') 
      24 LOAD_CONST    8 ('\x81') 
      27 LOAD_CONST    5 ('\x8b') 
      30 LOAD_CONST    9 ('\x95') 
      33 LOAD_CONST    8 ('\x81') 

    7   36 LOAD_CONST    10 ('\x84') 
      39 LOAD_CONST    1 ('\x87') 
      42 LOAD_CONST    7 ('\x96') 
      45 LOAD_CONST    7 ('\x96') 
      48 LOAD_CONST    1 ('\x87') 
      51 LOAD_CONST    11 ('\x94') 
      54 LOAD_CONST    8 ('\x81') 
      57 LOAD_CONST    7 ('\x96') 
      60 LOAD_CONST    12 ('\x8a') 
      63 LOAD_CONST    13 ('\x83') 
      66 LOAD_CONST    14 ('\x90') 
      69 LOAD_CONST    8 ('\x81') 

    8   72 LOAD_CONST    5 ('\x8b') 
      75 LOAD_CONST    15 ('\x8f') 
      78 LOAD_CONST    3 ('\x92') 
      81 LOAD_CONST    4 ('\x8e') 
      84 LOAD_CONST    5 ('\x8b') 
      87 LOAD_CONST    6 ('\x85') 
      90 LOAD_CONST    5 ('\x8b') 
      93 LOAD_CONST    7 ('\x96') 
      96 BUILD_LIST    32 
      99 STORE_FAST    1 (b) 

    9   102 BUILD_LIST    0 
      105 STORE_FAST    2 (c) 

10   108 SETUP_LOOP    43 (to 154) 
      111 LOAD_FAST    1 (b) 
      114 GET_ITER    
     >> 115 FOR_ITER    35 (to 153) 
      118 STORE_FAST    3 (d) 

11   121 LOAD_FAST    2 (c) 
      124 LOAD_ATTR    0 (append) 
      127 LOAD_GLOBAL    1 (chr) 
      130 LOAD_GLOBAL    2 (ord) 
      133 LOAD_FAST    3 (d) 
      136 CALL_FUNCTION   1 
      139 LOAD_CONST    16 (34) 
      142 BINARY_SUBTRACT  
      143 CALL_FUNCTION   1 
      146 CALL_FUNCTION   1 
      149 POP_TOP    
      150 JUMP_ABSOLUTE   115 
     >> 153 POP_BLOCK    

12  >> 154 LOAD_CONST    17 ('') 
      157 LOAD_ATTR    3 (join) 
      160 LOAD_FAST    2 (c) 
      163 CALL_FUNCTION   1 
      166 STORE_FAST    4 (e) 

13   169 LOAD_FAST    0 (a) 
      172 LOAD_FAST    4 (e) 
      175 COMPARE_OP    2 (==) 
      178 POP_JUMP_IF_FALSE  185 

14   181 LOAD_CONST    18 (True) 
      184 RETURN_VALUE   

15  >> 185 LOAD_CONST    19 (False) 
      188 RETURN_VALUE   

the meaning of the bytecode operationsdis文档(LOAD_CONSTBUILD_LIST,等等)。

为了更好地掌握函数的功能,可以尝试将其反编译回Python代码。虽然我没有设法做到这一点。 (试用uncompyle6。)

+0

组件的第一行是等效为:b = [1,2,3,4,5,6,5,7,8,9 ,8(换行)10,1,...]; c = []和for循环累积到c然后e =''.join(c),并且如果a == e则返回true或false。 (A先前被传入或设置?) – rocky

+0

@rocky你是怎么找到这个的?可能值得自己回答。 –

+0

快速检查代码。看更多的c是通过chr(ord(d))构建的,它是循环迭代器的地方。您可以让uncompyle6完成这项工作如果您提供了一个Python版本号,例如3.5或2.7。请参阅https://github.com/rocky/python-uncompyle6/blob/master/uncompyle6/main.py#L12 – rocky