2013-01-05 73 views
0

我试图用python2.7和beautifulsoup4刮网站。我使用的代码在一台机器上工作,另一方面,我得到了在这些字母之间添加了三个空格的“汤”。我得到类似如下(无论是在终端,如日食/ PyDev的。任何想法是什么引起的?空白的刮结果(python)

   i f  ( w i n d o w . D o m L o a d e d ) 
      { 
       D o m L o a d e d . l o a d ( f u n c t i o n ( ) { b a n n e r S y n c ( ' t b ' ) ; } ) ; 

       d o c u m e n t . w r i t e ( ' d i v  i d = " d o m L o a d e d "  s t y l e = " d i s p l a y : n o n e " > \ / d i v > ' ) ; 
      } 
    / s c r i p t > 
     ! - -  S e r v e r :  P h o b o s ,  S e r v e r  t i m e :  0 , 0 9 2 7  s  ( C :  0 , 0 5 2 0 ;  Q :  7 ;  0 , 0 0 2 2 ;  E :  5 2 ;  0 , 0 3 1 1  s ,  M :  3 ;  0 , 0 0 1 1  s ,  A :  0 ;  0 , 0 0 0 0  s ) ,  M e m :  1 2 3 0 1  K B ,  E n g i n e s :  ( S )  p h o b o s  ( 5 2 )  - - > 
/ b o d y > 

/HTML >

+0

相关的代码片段可以帮助你得到更好的答案。尽可能小,在准备你的例子时,你可能自己偶然发现了答案 – Nathan

+0

@Nathan认真地说,它不能显示输出中出现什么问题,而不是显示输出的剪切。代码显然不是问题,也不是被刮掉的网站。正如文中明确提到的,它在另一台机器上完美无缺。我已经将这些空格留在了剪辑中,因为这些都是问题... –

回答

0

这很可能是两台机器都安装了不同的HTML解析器库,请如你所知,不同的解析器可能会有不同的解析结果,特别是那些格式不对的HTML

+0

Zeng谢谢。我确信我几乎准确地在两台机器上复制了环境,所以我没有想到最明显的。现在像魅力一样工作。我不敢相信我在这个上花了这么多时间:s。 –