2012-12-11 31 views
0

现在,当我必须扫描或抓取视频URL链接时遇到一些困难。该网页使用基于Flash的技术来嵌入视频和流媒体视频。抓取嵌入式Flash视频并呈现Javascript以获取最终的GUI

为了更清楚地理解,这是一个链接例如:

http://vnexpress.net/gl/the-gioi/tu-lieu/2012/11/bai-phat-bieu-thua-nhan-that-bai-cua-romney/

上述链路具有低于内容(用于Flash嵌入式视频HTML代码):

 <div id="flashContent" style="text-align:center;width:100%;">             
      <span id="FlashPlayer79237" class="Normal" align="center">B&#7841;n c&#7847;n c&#224;i <a href="http://www.macromedia.com/go/getflashplayer">Flash Player</a> &#273;&#7875; xem &#273;&#432;&#7907;c Clip n&#224;y.</span>    
     </div>   

在这种上面的文章,有一个以上的视频。但是,当我试图扫描或抓取内容时,视频无法正常运行(因为无法加载正确的视频链接),只能显示安装Flash Player插件单词(当然,真正的网页需要运行一些Javascript脚本或Flash脚本来获取真实视频链接并为用户传输视频)

因此,如何通过PHP或ASP.NET或Java渲染Flash和Javascript脚本?抓取网页时如何获得正确的视频链接?在这种情况下,如何才能获得正确的 Flash嵌入式视频(HTML代码)?

非常感谢。

+0

你应该包括一些你已经尝试过的例子,以及你目前的解决方案在哪里不足。 – Henrik

回答

0

在我回答之前,我想记下一点,如果你需要这些信息来做任何事情......请不要。

此外,对于特定的网站,这是相对容易的。

flashvars param(可能放在那里的Javascript)包含一个名为xmlPath的值,它是一个url编码路径(相对于他们的域名)。如果你抓住这和解码它,你喜欢的东西:

/Service/FlashVideo/PlayListVideoPage.asp?id=79237&f=108&t=1 

如果你读的是,它是包含实际视频的URL的XML文件指向

http://vnexpress.net/Service/FlashVideo/PlayListVideoPage.asp?id=79237&f=108&t=1 

我不太确定那个值是从哪里产生的。如果您需要在服务器端完成此操作,则可以使用无头浏览器进行处理。

+0

感谢您的回答。但是,如果您下载网页的内容,则无法看到以下参数:因此,我们无法跟踪通过自己的方式的视频链接。参数值是通过JavaScript脚本生成的,这是我对这个线程的问题。 –

相关问题