我怎样才能提取<span class="arabic_sanad arabic">
& <span class="arabic_text_details arabic">
从我曾尝试以下下面SPAN unsing beautifulsoup内刮文本
<div class="arabic_hadith_full arabic"><span class="arabic_sanad arabic">حَدَّثَنَا أَبُو الْيَمَانِ، قَالَ أَخْبَرَنَا شُعَيْبٌ، قَالَ حَدَّثَنَا أَبُو الزِّنَادِ، عَنِ الأَعْرَجِ، عَنْ أَبِي هُرَيْرَةَ ـ رضى الله عنه ـ أَنَّ رَسُولَ اللَّهِ صلى الله عليه وسلم قَالَ </span>
<span class="arabic_text_details arabic">" فَوَالَّذِي نَفْسِي بِيَدِهِ لاَ يُؤْمِنُ أَحَدُكُمْ حَتَّى أَكُونَ أَحَبَّ إِلَيْهِ مِنْ وَالِدِهِ وَوَلَدِهِ "</span><span class="arabic_sanad arabic">.</span></div>
的文字,但我没有按误差低于
print name2
UnicodeEncodeError: 'ascii' codec can't encode characters in position 2-11: ordinal not in range(128)
CODE:
url = "http://www.sunnah.com/bukhari/8"
parser = etree.HTMLParser()
html = etree.parse(url, parser)
result = etree.tostring(html.getroot(), pretty_print=True, method="html")
soup = BeautifulSoup(result)
results = soup.findAll("div", {"class" : "actualHadithContainer"})
for result in results :
ar = result.find("div", {"class" : "arabic_hadith_full arabic"})
name2 = ar.get_text()
print name2
尝试用'print u“{}”.format(name2)'。更多信息:http://goo.gl/Mz0QMw –
我得到name2 = ar.get_text() AttributeError:'ResultSet'对象没有属性'get_text' – Ossama