我想从网站(html)中获取信息到MATLAB中。我能够从网上得到HTML到使用字符串:Matlab文本字符串/ html解析
urlread('http://www.websiteNameHere.com...');
一旦我有串我有一个很长的字符串变量,包含完整的HTML文件的内容。从这个变量中,我正在寻找特定类中的值/字符。例如,HTML /网站都会有一堆线,然后将在以下形式的兴趣类:
...
<h4 class="price">
<span class="priceSort">$39,991</span>
</h4>
<div class="mileage">
<span class="milesSort">19,570 mi.</span>
</div>
...
<h4 class="price">
<span class="priceSort">$49,999</span>
</h4>
<div class="mileage">
<span class="milesSort">9,000 mi.</span>
</div>
...
我需要能够得到<span class="priceSort">
和</span>
之间的信息;即上述例子中的39,991美元和49,999美元。什么是最好的方式去做这件事?如果标签的具体开始和结束也是相同的(如<price>
和</price>
),我会没有问题...
我也需要知道最健壮的方法,因为我希望能够找到<span class="milesSort">
等这类信息。谢谢!