我使用robobrowser来抓取这个页面,在页面里面有一个textarea
标签,里面有我需要复制和存储的信息。如何从标签中提取文本?
这是我的代码:
>>> captchacode = captchabrowser.find('textarea')
>>> print(captchacode)
<textarea cols="100" rows="5">03AHJ_VuvjiQUpaQ-JFLXqAJaUQ217f7bHqa3hG__VSG1YsbjNtsT2FGFrJksCansOxwuxniksyCsnHJTvlCeGdi2jeqUyuDfUGAQ1WIuJqO55ACslBSUnd-MtAMDIOmbTa1G9uh1QMBdZUTRXwmt1kOn7oNf6ZflnUGAtIOGeTSgx-wu8hOWY-Pw</textarea>
如何通过他们的自我得到
<textarea cols="100" rows="5">XXXXXX</textarea>
我需要XXXXX
在变量中的文本。
有一个格式错误,把数据放在textarea里面是不好的HTML。它应该是'',请注意这一点。 –
@aarongillion我刮的网站有这样的,我不能改变它:( –
这很好,我只是指出它 –