2016-11-15 44 views
0

我试图找出其中包含一个特定的标签页,但是这个标签包含谷歌标签管理器中,并因此不可用在页面源代码,或DOM(从我所看到的)。如何加载URL并跟踪所有请求的资源?

我可以Chrome开发工具内然而看到网络选项卡上,其涉及于所讨论的标签的请求。

我不知道是否有一种方式来加载Python中的页面,并跟踪所有加载页面时,这样我就可以解析这个列表标识我提出的要求的。

不知道是否有一个明显的是这样做的,但我似乎无法找到在任何请求模块或urllib3相关的任何东西。

编辑 - 更多信息:

我特别尝试识别AdWords转换标签。我知道这采取了https://www.google.com/ads/conversion/xxxxxxxxxx/的请求形式。对于大多数网站,代码在页面源中可见,有时仅在DOM中可见。我使用前者的请求模块,后者使用phantomjs。但是,如果网站使用的是Google跟踪代码管理器,它似乎并不在其中。

我可以看到但这一请求被在Chrome浏览器开发工具进行的网络选项卡,所以希望有一种方法,以蟒蛇内直接复制吗?

+0

我在同一个主题,用Ruby UT斯达康进行一些测试。 –

回答

0

有些疼痛试图PhantomJS使用OnResourceRequested后,我代替以下内容:

chromedriver = "/path/to/chromedriver" 
    os.environ["webdriver.chrome.driver"] = chromedriver 
    self.driver = webdriver.Chrome(chromedriver) 

    self.driver.get(link) 

    time.sleep(5) 
    timings = self.driver.execute_script("return window.performance.getEntries();") 
     for item in timings: 
      print item[u'name']