目前,有一款游戏拥有不同的群组,您可以每小时玩一次“黄金奖”。有时候有黄金,有时候没有。它每小时在facebook上发布“group2中的黄金”或“group6中的黄金”,而其他时间由于没有黄金作为该小时的奖品而没有帖子。我想写一个小脚本,每小时检查一次该网站,并获取结果(如果有或没有金子,以及什么组),然后显示给我。我想在Python中编写它,因为我正在学习它。这是最好的语言吗?我怎么去做这件事?我真正能够找到的是关于提取链接的信息。我不想提取链接,只是文本。感谢任何和所有的帮助。我很感激。从网站获取文本并将其显示回
0
A
回答
1
检出urllib2
从网址获取HTML和BeautifulSoup
/HTMLParser
/etc来解析html。然后,你可以使用类似以此为出发点的脚本:
import time
import urllib2
import BeautifulSoup
import HTMLParser
def getSource(url, postdata):
source = ""
req = urllib2.Request(url, postdata)
try:
sock = urllib2.urlopen(req)
except urllib2.URLError, exc:
# handle the error..
pass
else:
source = sock.read()
finally:
try:
sock.close()
except:
pass
return source
def parseSource(source):
pass
# parse source with BeautifulSoup/HTMLParser, or here...
def main():
last_run = 0
while True:
t1 = time.time()
# check if 1 hour has passed since last_run
if t1 - last_run >= 3600:
source = getSource("someurl.com", "user=me&blah=foo")
last_run = time.time()
parseSource(source)
else:
# sleep for 60 seconds and check time again.
time.sleep(60)
return 0
if __name__ == "__main__":
sys.exit(main())
这里是一个很好的文章有关parsing-html-with-python
1
我有类似的东西给你什么,而是你留下了什么我的主问题围绕着。我看着htmlparser和bs,但我不确定如何做一些事情,如if($ posttext == gold)echo“gold in so so so”..看起来像bs处理很多标签..我想因为facebook的帖子可以使用各种标签,我将如何去做只是对文本的搜索,并返回'后'?
相关问题
- 1. 从一个网站获取数据并将其显示在另一个网站
- 2. 从网站获取文本并将其放入一行?
- 3. 从文本区域获取输入并将其回显
- 4. 从网站获取文本
- 5. 如何从网站获取特定信息并将其显示在框中?
- 6. 如何从网站上抓取图片并将其显示在html文件中?
- 7. 只从Wordpress网站获取文本,在iOS应用上显示
- 8. 如何从其他网页获取图片并在我的网站上显示
- 9. Sweetalert - 获取div内容并将其显示为文本
- 10. 如何从图片托管网站获取专辑图片并自动将其显示在网站上
- 11. 通过ID从另一页/网站上的div获取内容并将其显示在我的网站上
- 12. 从网址获取文本并显示它(几乎可行)
- 13. 从网站收集特定信息并将其显示在我的网站上
- 14. 将Xml解析为本地文件并将其显示为回收站视图
- 15. 如何从远程文本文件提取数据并将其显示在我的网站上?
- 16. 拉一个网站的网站文字,并将其显示在另一个
- 17. 从其他网站获取数据并显示在我们的页面中。
- 18. 通过API调用从网站获取网站并向用户显示
- 19. 从网站获取图像列表并显示它
- 20. vb.net从web.txt文件中读取文本并将其显示在文本框中?
- 21. 如何从数组中获取项目并将其显示在文本框中;
- 22. 如何从JSON获取价值并将其显示在文本框中?
- 23. 从网站获取JSON文本
- 24. Python - 从报纸网站获取文本
- 25. 用VBA从网站获取文本
- 26. 使用JSoup从网站获取文本
- 27. 从警报获取文本在网站
- 28. 从短信中读取文本,并将其显示为文本视图
- 29. 从文本框中获取文本并将其放入javascript中
- 30. 从其他网站获取文本以便在html中使用
另请参阅:lxml.html – Lionel