我想从一个名为flipkart的电子商务网站上刮取定价数据,我尝试使用带有casperjs(nodejs实用程序)和类似库的Beautifulsoup,但没有一个足够好。如何从具有变化结构的网站上刮取价格?
以下是URL和结构。 https://www.flipkart.com/redmi-note-4-gold-32-gb/p/itmer37fmekafqct?
问题是布局...有什么办法来解决这个问题?
P.S:无论如何,我可以将机器学习应用于获取定价数据而不需要知道复杂的数学吗?我甚至从哪里开始?
'soup.find( '格',{ '类': '_1vC4OE _37U4_g'})。get_text()'莫比?你能发布你的代码吗? –
问题在于类名是动态的,每天都会更新。他们甚至改变了该部分的布局! – user3407278
您应该构建XPath的方式不是依赖于类,而是依赖于要匹配元素的内容('node()')。 'data-reactid'也会改变吗? – Severin