您好我使用网络抓取网站,但它的内容太多,我不需要的信息。 这里是我的代码:网络抓取删除链接没有ID /类附加为PHP
<?php
require('phpQuery.php');
$url = 'http://www.nasdaq.com/screening/companies-by-name.aspx?letter=A';
$html = file_get_contents($url);
$pq = phpQuery::newDocumentHTML($html);
echo $pq['#CompanylistResults'];
?>
,其结果是:
<table id="CompanylistResults">
<tbody>
<tr>
<tr>
<td>
<a target="_blank" rel="nofollow" href="http://www.1800flowers.com">1-800 FLOWERS.COM, Inc.</a>
</td>
<td>
<td style="">$100.55M</td>
<td style="display:none"></td>
<td>United States</td>
<td>1999</td>
<td style="width:105px">Other Specialty Stores</td>
我需要的是 “1-800 FLOWERS.COM公司”和“$ 100.55M”中的文字来说,该怎么做呢?
这种财务信息可从几十个的API就没有必要凑。在您显示的页面上有一个链接:“下载此列表”,它提供了一个csv文件 – 2012-08-23 20:18:44
dozen api's ???实际上,我希望使用这两个文本创建链接并在网站中显示 –