2015-06-26 88 views
2

我在AWS EC2 t2.micro实例上运行wordpress页面。没有什么花哨,但只是一个简单的WordPress的网站。AWS EC2 t2.micro实例非常不稳定

已经发生了相当一致的是每隔几个星期:

  1. 我的网页将无法访问,SSH无法到达或者
  2. 时,仪表板上的检查,一切看起来正常,没有任何警告或投诉
  3. 重新启动它AWS管理面板上,检查的人会失败:“实例可达性检查失败的(时间)”

系统日志显示有一个内核恐慌(所有的LO g下面复制)。什么会造成这种情况? AWS端硬件不好?这真的让我很困惑,请帮忙。谢谢!

[2950123.794183] end_request: I/O error, dev xvda, sector 13514688 
[2950123.797618] end_request: I/O error, dev xvda, sector 13514712 
[2950123.798170] end_request: I/O error, dev xvda, sector 13514776 
[2950123.798170] end_request: I/O error, dev xvda, sector 13514816 
[2950123.798170] end_request: I/O error, dev xvda, sector 13514872 
[2950123.798170] end_request: I/O error, dev xvda, sector 12894512 
[2950123.798170] end_request: I/O error, dev xvda, sector 12875536 
[2950123.798170] end_request: I/O error, dev xvda, sector 511456 
[2950123.798170] end_request: I/O error, dev xvda, sector 13403944 
[2950123.798170] end_request: I/O error, dev xvda, sector 515968 
[2950124.114201] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000007 
[2950124.114201] 
[2950124.118093] CPU: 0 PID: 1 Comm: init Not tainted 3.14.35-28.38.amzn1.x86_64 #1 
[2950124.118093] Hardware name: Xen HVM domU, BIOS 4.2.amazon 05/06/2015 
[2950124.118093] ffff88003d578ae0 ffff88003da2bc80 ffffffff814867ca ffffffff81788cf0 
[2950124.118093] ffff88003da2bcf8 ffffffff814825ab ffffffff00000010 ffff88003da2bd08 
[2950124.118093] ffff88003da2bca8 ffffffff81c9af20 0000000000000007 ffff88003da30480 
[2950124.118093] Call Trace: 
[2950124.118093] [<ffffffff814867ca>] dump_stack+0x45/0x56 
[2950124.118093] [<ffffffff814825ab>] panic+0xc8/0x1cd 
[2950124.118093] [<ffffffff8105ffd1>] do_exit+0xa41/0xa50 
[2950124.118093] [<ffffffff8106005f>] do_group_exit+0x3f/0xa0 
[2950124.118093] [<ffffffff8106f707>] get_signal_to_deliver+0x1c7/0x6e0 
[2950124.118093] [<ffffffff81014458>] do_signal+0x48/0x6f0 
[2950124.118093] [<ffffffff811e7c38>] ? fsnotify+0x228/0x2f0 
[2950124.118093] [<ffffffff81014b68>] do_notify_resume+0x68/0x90 
[2950124.118093] [<ffffffff8148d822>] retint_signal+0x48/0x86 
+0

如果移动到其他t2.micros会发生什么情况? – tedder42

+0

不知道这是否有所作为 - 我碰巧落在了“柠檬”硬件中? :) –

+0

它会裁定,是的。 – tedder42

回答

3

你应该设计你的解决方案失败。失败是不可避免的,但aws提供所有服务来处理这个问题。

在自动扩展组中设置您的ec2实例,并创建/设置AWS可用来确定您的实例是否运行正常或不正常的运行状况检查。

如果您设置正确,那么当AWS发现您的实例失败/失败时,它将自动替换您的实例。

这将需要您的工作来正确地构建正确的东西,但是您不再需要担心在出现问题时观看/检查实例并旋转新的实例。

http://docs.aws.amazon.com/AutoScaling/latest/DeveloperGuide/WhatIsAutoScaling.html

不要把你的EC2实例像一个正常的托管服务提供商包,即一个你买了,把你的解决方案,并只是希望它运行的是永远的。如果这是您的计划,那么您最好与常规托管服务提供商合作 - 他们将负责通过为您管理底层硬件/软件来确保您的网站永远运行。

如果您打算使用AWS,请利用其平台。

至于你的具体问题,我会倾向于想到内存泄漏 - 症状听起来很正确,你开始新鲜它一次运行几天/几周,然后崩溃。

+0

tomcat服务器也在同一个实例上运行,这可能是其中某个应用程序的mem泄漏源。取消部署应用程序,我会监视一段时间,看看问题是否会停止。谢谢! –

+0

@ ej-brennan和YXP我有类似的错误,我也重新启动我的机器,并在几个小时后再次返回错误http://stackoverflow.com/questions/34643170/amazon-django-each-12-hours-appears - 即-错误号-5-输入 - 输出误差/ 34643524#34643524 – bgarcial