我有一个Ruby/Rails应用程序,并试图屏幕刮一页来获取一些数据。这里的HTML是什么样子:如何解析HTML页面中的特定javascript变量?
<html>
<head>
...
</head>
<body>
<h1>Blah</h1>
<script type="text/javascript" language="JavaScript">
var foo = "abc";
var bar = {interesting_json_here};
var baz = "xyz";
</script>
Other uninteresting content and tags here
</body>
</html>
我不关心什么除了栏的内容。
如何获得酒吧,然后遍历它来解析json酒吧的内容?
它“依赖” - 你能给出一个json的样本 - 尽量贴近现实。如果bar包含在一行中,并且仅在页面中出现一次,那么您可能很懒,并使用正则表达式来提取它。因为替代方法 - 使用DOM提取JavaScript块然后解析Javascript更困难。 – 2012-02-16 00:05:18