2014-09-02 21 views
1

我看到这个线程在我的jstack中看起来并没有移动。任何关于如何弄清楚为什么卡住的指针?我没有看到任何锁或任何东西,唯一可疑的是“Object.wait()”引用。如何弄清为什么线卡死?

"main" prio=10 tid=0x00007f3a8000b000 nid=0x942 in Object.wait() [0x00007f3a89539000] 
    java.lang.Thread.State: RUNNABLE 
     at org.joda.time.DateTimeZone.<clinit>(DateTimeZone.java:95) 
     at org.joda.time.format.DateTimeFormatter.withZoneUTC(DateTimeFormatter.java:301) 
     at com.amazonaws.auth.AWS4Signer.<clinit>(AWS4Signer.java:44) 
     at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) 
     at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:57) 
     at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) 
     at java.lang.reflect.Constructor.newInstance(Constructor.java:525) 
     at java.lang.Class.newInstance0(Class.java:372) 
     at java.lang.Class.newInstance(Class.java:325) 
     at com.amazonaws.auth.SignerFactory.createSigner(SignerFactory.java:121) 
     at com.amazonaws.auth.SignerFactory.lookupAndCreateSigner(SignerFactory.java:107) 
     at com.amazonaws.auth.SignerFactory.getSigner(SignerFactory.java:80) 
     at com.amazonaws.AmazonWebServiceClient.computeSignerByServiceRegion(AmazonWebServiceClient.java:311) 
     at com.amazonaws.AmazonWebServiceClient.computeSignerByURI(AmazonWebServiceClient.java:284) 
     at com.amazonaws.AmazonWebServiceClient.setEndpoint(AmazonWebServiceClient.java:160) 

而且,在堆栈的顶部DateTimeZone.java线95是这样的:

public static final DateTimeZone UTC = new FixedDateTimeZone("UTC", "UTC", 0, 0); 

还有另外一个线程也停留在一个相似的地方:

"FeatureManagerService" daemon prio=10 tid=0x00007f3a8056a800 nid=0x94f in Object.wait() [0x00007f3a84151000] 
    java.lang.Thread.State: RUNNABLE 
     at com.amazonaws.util.DateUtils.<clinit>(DateUtils.java:35) 
     at com.amazonaws.services.s3.internal.ServiceUtils.<clinit>(ServiceUtils.java:59) 
     at com.amazonaws.services.s3.internal.S3Signer.sign(S3Signer.java:123) 
     at com.amazonaws.http.AmazonHttpClient.executeHelper(AmazonHttpClient.java:348) 
     at com.amazonaws.http.AmazonHttpClient.execute(AmazonHttpClient.java:245) 
     at com.amazonaws.services.s3.AmazonS3Client.invoke(AmazonS3Client.java:3711) 
     at com.amazonaws.services.s3.AmazonS3Client.invoke(AmazonS3Client.java:3664) 
     at com.amazonaws.services.s3.AmazonS3Client.listObjects(AmazonS3Client.java:620) 
     at com.amazonaws.services.s3.AmazonS3Client.listObjects(AmazonS3Client.java:603) 

并且DateUtils.java:35是:

private static final DateTimeZone GMT = new FixedDateTimeZone("GMT", "GMT", 0, 0); 

我已经试着用jvisualvm/jhat进行调查,但并没有真正走得很远。

请注意,这是一个实时进程,而不是我在本地调试器中运行的,在重新启动后它工作正常,因此它似乎是间歇性的。

任何帮助,将不胜感激!

谢谢!

更新使用jstack混合模式似乎给一些更深入的了解 - 这是等待一个调用pthread_cond_wait:

----------------- 2370 ----------------- 
0x00007f3a89115414  __pthread_cond_wait + 0xc4 
0x00007f3a8833a03c  _ZN13ObjectMonitor4waitElbP6Thread + 0x7dc 
0x00007f3a88117fbb  _ZN13instanceKlass15initialize_implE19instanceKlassHandleP6Thread + 0x36b 
0x00007f3a881182ca  _ZN13instanceKlass10initializeEP6Thread + 0x6a 
0x00007f3a8814d3f3  _ZN18InterpreterRuntime4_newEP10JavaThreadP19constantPoolOopDesci + 0x143 
0x00007f3a7d01d9ee  * org.joda.time.DateTimeZone.<clinit>() bci:0 line:95 (Interpreted frame) 
0x00007f3a7d0004f7  <StubRoutines> 
... 
+0

有任何其他线程处理?有线程转储? – ssnobody 2014-09-02 15:55:50

+0

还有其他一些线索 - 我应该寻找什么? – naumcho 2014-09-02 16:04:07

+0

@ssnobody在创建FixedDateTimeZone之前发现另一个线程被卡住了 – naumcho 2014-09-02 16:15:59

回答

0

也许这不是卡住了。它只是在一个循环中调用新的DateTimeZone(),构造函数会进行一些计算。每次查看此线程时,它都位于DateTimeZone()内部 - 但每次都是不同的DateTimeZone()。

然后被丢弃。发生在我身上的不少次数。

+0

你完全正确,这就是有时会发生的情况,但通常你可以通过变量的地址来判断,在这种情况下地址保持不变,这让我觉得它不是一个循环。好主意,但。 – naumcho 2014-09-02 17:39:59

0

正如@naumcho发现的,这被证明是一个错误(https://github.com/JodaOrg/joda-time/issues/171)。

根据提供的信息(两个不同线程+源代码行的堆栈跟踪),可能会怀疑发生死锁,因为两个线程都试图实例化一个新类型相同的对象FixedDateTimeZone

下一步确认将使用GDB检查围绕__pthread_cond_wait()的堆栈帧。

相关问题