2013-04-06 36 views
0

我尝试从与PyQuery html文件让所有的“ID”,但带来的麻烦......我试试这个:PyQuery:从HTML中提取ID?

from pyquery import PyQuery 

file = open('index.html', 'r').read 
jQuery = PyQuery(html) 

jQuery.attr('id') 

但说明不了什么......

请帮助我。

回答

1

我不知道,如果你的示例代码是你使用的是什么,但是你错过了一些不同的东西在那里,比如调用read(),而不是使fileread方法,然后你永远使用它。当你从未分配过任何东西时,你也会通过html

但这里的东西我写的,似乎找到了id所有要素,我想是最好的,我可以按照你的名字,但我不想重用file,因为这是一个保留字,据我所知:

from pyquery import PyQuery 

html = open('temp.html').read() 

jquery = PyQuery(html) 
ids = jquery.find('[id]') 

print ids 
>>>[<link#screen-switcher-stylesheet>, <div#search>, <input#term.input-text>, <input#submit.input-button>] 
+0

感谢TankorSmash,我没有解释得很好。我需要脚本在html中使用id的名字。例如:

content
,脚本必须给我“你好” – Benyi 2013-04-06 18:13:57

+0

@Benyi完全没问题!如果解决方案适用于您,请随时单击我答案附近的复选标记以将此问题标记为已解决。 – TankorSmash 2013-04-06 18:15:04