2011-12-10 81 views
0

我有这个歌网站什么都数据已同被显示在其他网站 即使我回声“你好”同样是在其他网站做没有任何身体知道如何阻止这 只是更深入地让我发现网站使用的file_get_contents()我怎么能阻止他这样做,如何从刮我的网站停止网站

+1

重定向起诉他们将是最好 选项,如果可能 –

+0

我从一个网站获得一些外汇资讯,当他们认识到他们通过js更改了代码和加载信息时。 –

+0

如果你困扰,你仍然可以获得信息。 – 2011-12-15 14:30:53

回答

0

你说file_get_contents正在被使用。

A URL can be used as a filename with this function if the fopen wrappers have been enabled. See fopen() for more details on how to specify the filename. See the Supported Protocols and Wrappers for links to information about what abilities the various wrappers have, notes on their usage, and information on any predefined variables they may provide.

要禁用它们的详细信息,在http://www.php.net/manual/en/filesystem.configuration.php#ini.allow-url-fopen

编辑:如果他们去使用卷曲或在此之后等效,通过改变HTML布局等尝试和乱用他们的脚本如果没有帮助,试图找到脚本主机的IP,并使其返回废话;)

EDIT2:如果他们使用iframe使用JavaScript对iframe中检测

2

那么,你可以尝试dermine他们的IP地址,并阻止它

+0

这不是一个很好的选择动态IP呢? –

+0

我知道的大多数爬虫不使用动态IP。他们可能会旋转他们,但他们是从服务器enviroments,不是典型的国内一线 – Pleun

+0

我用此溶液同意就跑,远远阻止他们的IP地址或范围。他们最终会用完。 :) – brant

0

或者你甚至可以为该爬虫生成垃圾信息,只是为了搞乱“克隆”网站。

第一个需要回答的问题是:您是否确定了抓取工具从您的网站获取信息?

如果是这样,那么你就可以给你想这个过程什么:无(忽略/块),一条消息,告知车主停止获取您的信息,让他们回来的垃圾内容,...

不管怎么说,第一步是妥善处理事情。请确保您的网站有适用于抓取工具的已接受政策的“robots.txt”。