2015-11-15 24 views
0

我一直在面对奇怪的情况一段时间了,需要关于这方面的指导。如何降低谷歌和bing在magento网站上爬行时的CPU利用率?

问题: 由于过去两天,我们正在经历非常缓慢的网站相比,这是什么,当我们推出的服务器。我们认为这是temperory问题。但现在,它已经死了缓慢&一页需要至少3分钟才能加载。我也检查了CPU的使用率达到了100%,并认为爬行可能会这样做。

我们使用一些第三方做我们的SEO和谷歌我们的Magento网站的动态再行销和广告。我坚信这些东西需要爬行我的网站索引搜索引擎。

我已经看到,谷歌和必应定期抓取我们的网站。你可以称它为谷歌机器人和僵尸机器人,并突然它看到了最大的高峰。

看一看截图: https://www.dropbox.com/s/2c4u04rhtbi99j0/Screenshot%202015-11-14%2014.16.41.png?dl=0

与最大的尖峰由冰所引起,并在同一时间谷歌和较小的似乎只能是谷歌机器人。

所以我只是有这方面一个问题吗?

你们认为如果一个僵尸IP被列入白名单,我们是否会遇到搜索引擎优化和谷歌广告和动态再营销的问题,因为那样它就不允许这个IP在我们的网站上爬行?

这是一个垃圾邮件或漫游器抓取我们的商店,导致商店响应时间减少,这可能会影响我们商店的搜索引擎排名和转换?

大型实例类型的AWS可以帮助我们解决我们的CPU使用问题吗? 注意:我们已经在使用m3.large实例类型。

+3

问题与搜索引擎是他们爬的一切,这基本上意味着您网站上的服务拒绝攻击。您可以实施像CloudFlare(便宜)或Akamai(昂贵)这样的CDN,这可能会减少部分负载。如果您已经在AWS上,那么CloudFront可能也是一个不错的选择... –

+0

好的,将使用cloudfront,然后查看,但是,如果我们加载css,js n媒体,皮肤文件夹,Cloudfront可以提供帮助吗?它。我知道一些基础知识,虽然我不是AWS的SysOps中的专家,但在系统管理方面并不是那么好.. –

+1

从另一方面确保服务器配置良好(缓存层,php,Nginx,数据库,文件系统)。所以为了帮助你在这里发布配置文件和日志在这里请。 Nginx中的缓存层可以显着减少数据库和文件系统的负载。 – Anatoly

回答

0

这是一个垃圾邮件或机器人爬行我们的商店,这是造成存储响应时间,以降低它可以在我们店里影响搜索引擎排名和转换?

搜索引擎和爬虫可能导致维持业务和资源秒杀单个Magento的服务器。不管是什么来加速magento的性能,如:magento的默认缓存,nginx或apache设置,安装的扩展等...

可以使用大型实例类型的AWS帮助我们解决CPU使用问题?注意:我们已经在使用m3.large实例类型。

绝对 - 一个Burstable t2.large实例可以更具成本效益,并且可以更好地处理由机器人引起的流量尖峰。只要你有一个半可预测的流量模式。就像白天和更低的隔夜高流量的情况下将获得学分,它可以使用到爆高于正常CPU能力看到这一个详尽的解释:

https://aws.amazon.com/blogs/aws/low-cost-burstable-ec2-instances/

我看到的最大的帮助是有一个正确为magento配置robots.txt它确保爬虫被引导到正确的位置,确保您的服务器只需要提供它所需的页面。这个职位是一个伟大的地方开始:

https://magento.stackexchange.com/questions/14891/how-do-i-configure-robots-txt-in-magento

在谷歌和Bing的网站管理员工具,一旦你验证你的域,如果需要的话可以更改抓取速度。

您还可以实现转诊垃圾邮件与Nginx的看到阻止:

https://github.com/Stevie-Ray/referrer-spam-blocker