2013-10-17 43 views
-2

我想了解BeautifulSoup的工作原理。请注意,我对Python非常陌生,所以我可能错过了一些东西。BeautifulSoup - 为什么打印文件路径而不是内容

我打开一个Python终端和这样写:

from bs4 import BeautifulSoup 
import re 
ytchannel = '/home/XXX/Documents/test2' 
soup = BeautifulSoup(ytchannel) 
print(soup.prettify()) 

这就是我得到:

<html> 
<body> 
    <p> 
    /home/XXX/Documents/test2 
    </p> 
</body> 
</html> 

为什么?对我来说完全是无稽之谈。我只想要test2的内容。 我正在写BeautifulSoup网站上写的内容。

回答

1

您将一个字符串传递给BeautifulSoup();确定它是一个文件名,但BeautifulSoup()不会为您打开文件名。它仅对字符串或打开的文件对象进行操作。

先打开文件;

with open(ytchannel) as infile: 
    soup = BeautifulSoup(infile) 

Making the soup:如果你把它们放到BeautifulSoup()将读取的文件对象。

+0

谢谢你的帮助! – user1983400

相关问题