0
我想遍历html页面中的所有子节点。例如 例如<body>......</body>
将会有许多子标签,我想要递归遍历所有这些标签,因此没有标签保持未访问状态。然后我想从每个标签中获取文本。 我正在寻找一种通用解决方案,它可以适用于任何具有任何结构的网页。有人可以提出这个建议吗? 谢谢如何遍历所有标签的所有子项以使用Python中的lxml获取数据?
我想遍历html页面中的所有子节点。例如 例如<body>......</body>
将会有许多子标签,我想要递归遍历所有这些标签,因此没有标签保持未访问状态。然后我想从每个标签中获取文本。 我正在寻找一种通用解决方案,它可以适用于任何具有任何结构的网页。有人可以提出这个建议吗? 谢谢如何遍历所有标签的所有子项以使用Python中的lxml获取数据?
例如1)
//一些文本//some text