2017-03-20 63 views
0

期间死亡我有一个数据帧lokking这样的:Seaborn的ClusterMap,内核计算

   value_1 value_2 
test_id       
A1BG  -0.956960  -inf 
A1BG-AS1 -1.186835 -1.689504 
A1CF  -2.941882  -inf 
A2M   0.966581 1.031764 
A2M-AS1  -1.188544 -1.231258 
A2ML1   -inf -1.787149 
A2MP1   -inf  -inf 
A3GALT2  -0.885212 -0.587419 
A4GALT  0.981555 0.876730 
A4GNT   -inf  -inf 
AA06    -inf  -inf 
AAAS   1.364746 1.410399 
AACS   1.044108 0.983331 
AACSP1  -1.421534 -1.514185 

它大约有25000行。现在我想将它绘制成具有聚类的热图。我用下面的命令:

import numpy as np 
import pandas as pd 
import seaborn as sb 
import matplotlib.pyplot as plt 

Data=pd.read_table("C://Users/Kevin/Desktop/Test.txt", sep="\t", header=0, index_col=0) 
Data['value_1']=np.log10(Data['value_1']) 
Data['value_2']=np.log10(Data['value_2']) 
print(Data) 
Data.fillna(0) 

sb.clustermap(Data) 

但这种情况发生的唯一的事:

Kernel died, restarting 

我在想什么?

+0

您在问题的第一部分显示的数据框是“print(Data)”的输出还是该部分显示了文件“Test.txt”的内容? – Schmuddi

+0

https://github.com/mwaskom/seaborn/issues/449 – mwaskom

+0

这是print()命令的输出 –

回答

-1

根据意见,解决方案是将Data.fillna(0)分配给一个新变量,或与inplace=True一起使用。在这种情况下,取代np.inf或在记录元素之前添加一个小数字(log(data + small_number))也更合适。