我有一个内部网站,会在日常基础上发布最新的统计数据。 这个网站有关于许多公司的信息。我需要获得一家公司的数据。 HTML代码如下:Python:从网页获取乘文本值
注:所有文本值,如“Big Company A”,“1810”,“14”,“2045”,“135”,“98.8%”,“100.0% “都需要输出。
* 注2:在同一页面有很多公司列表,它们都具有相同的结构。对我来说问题是,如何找到“大公司A”,并输出属于大公司A的所有文本值?
<TH class=Company><A href="?scope=1&values=1&deleg=35">Big Company A</A></TH>
<TD>1810</TD>
<TD>14</TD>
<TD>2045</TD>
<TD>135</TD>
<TD class=ok><A class=ok href="av_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">99.8%</A></TD>
<TD class=ok><A class=ok href="av_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">100.0%</A></TD>
<TD class=ok><A class=ok href="hips_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">100.0%</A></TD>
<TD class=ok><A class=ok href="hips_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">98.8%</A></TD>
<TD class=ok><A class=ok href="os_reportbyou.php?deleg=35&dc=%&ou=%&bu=%&site=%&server=0&counts=1">100.0%</A></TD>
<TD class=ok><A class=ok href="os_reportbyou.php?deleg=35&dc=%&ou=%&bu=%&site=%&server=1&counts=1">100.0%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs.php?deleg=35&dc=%&ou=%&bu=%&site=%">95.7%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs.php?deleg=35&dc=%&ou=%&bu=%&site=%">97.6%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs4.php?deleg=35&dc=%&ou=%&bu=%&site=%">104.8%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs4.php?deleg=35&dc=%&ou=%&bu=%&site=%">104.2%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs4.php?deleg=35&dc=%&ou=%&bu=%&site=%">99.9%</A></TD>
很抱歉,我没有Python和HTML,感谢您的帮助很多知识提前
编辑注 @ 2014/04/01追加一个评论关于如何定位“大公司A”
看一看美丽的汤。 – rlms
感谢您的指导,我检查了BeautifulSoup,并且我认为我需要花更多时间来了解HTML和Python –