3
上周之前,我对Python的使用经验非常有限,因为我们的网络上的大型数据库文件非常有限,突然之间我被迫进入尝试从html表格中提取信息的世界。python lxml xpath返回带文本的列表中的转义字符
经过大量阅读后,我选择使用Python 2.7的lxml和xpath来检索有问题的数据。
xpath = "//table[@id='resultsTbl1']/tr[position()>1]/td[@id='row_0_partNumber']/child::text()"
这产生了以下列表::我已用下面的代码检索一个场
['\r\n\t\tBAR18FILM/BKN', '\r\n\t\t\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t', '\r\n\t\t\t\r\n\t\t']
我确认的CR/LF和标签转义字符,我想知道如何避免它们?