2011-02-25 37 views
1

我正在尝试做一点第三方供应商错误跟踪系统(jira)的屏幕抓图,我可以刮所有未解决的错误的计数/类别。我想把这些信息放在我们的内部网上,这样管理人员就可以在不访问第三方网站(他们没有登录凭证)的情况下看到它。yql和firebug xpath复制/粘贴返回没有结果

虽然我在获取xpath结果时遇到了问题。这是我正在做的。使用Firebug,我选择我感兴趣的DOM元素并右键单击“copy as xpath”。然后我将它粘贴到YQL控制台中,所以我看起来像这样:

select * 
from html 
where url='http://username:[email protected]/path/to/page_i_want.aspx' 
     and xpath='//*[@id="primary"]' 

我的JSON结果返回null。如果我在查询中删除xpath,我会返回结果。如果我选择页面上的其他元素,我的JSON结果将返回null。如果我开始调整xpath,比如删除路径中的最后一个div,我有时可以得到结果,这取决于我选择的和我在xpath中调整了什么。

任何人都知道我为什么没有得到任何结果做xb的Firebug副本?我真的不能说我是一个xpath亲:)

编辑:其实,看着结果我回来没有xpath,它看起来像我没有认证。我的用户名中有一个@和域名,所以我通过浏览器登录的东西,如:

名@域

密码

YQL似乎并不喜欢@域和\转义@似乎不起作用。有人有主意吗?

回答

0

这将工作只要满足下列条件:

该模块将只取下1.5MB的HTML页面和页面也必须是可转位(例如,通过网站的robots.txt文件允许的。) 。

由于它是在登录后面,所以它可能不可索引。该robots.txt是公开的,如:

http://internet.com/robots.txt

以供将来参考,使用双引号逃脱商业at符号:

'http://"[email protected]:password"@jira.3rdparty.com/path/to/page_i_want.aspx' 

这里有一些资源: