2015-05-04 88 views
1

问题

我该如何摆脱每行数据的重复列标签?Python 3.4熊猫DataFrame构造

CODE

req = urllib.request.Request(newIsUrl) 
resp = urllib.request.urlopen(req) 
respData = resp.read() 
dRespData = respData.decode('utf-8') 

    df = pd.DataFrame(columns= ['Ticker', 'GW', 'RE', 'OE', 'NI', 'CE']) 

    df = df.append({'Ticker':ticker, 
         'GW':gw, 
         'RE':rt, 
         'OE':oe, 
         'NI':netInc, 
         'CE':capExp}, ignore_index= True) 
    print(df) 

yhooKeyStats() 



acquireData() 

观察

Ticker  GW   RE    OE   NI   CE  

0 MMM [7,050,000] [34,317,000] [13,109,000] [4,956,000] [(1,493,000)] 

Ticker  GW   RE    OE   NI   CE  

0 ABT [17,501,000] [7,412,000] [12,156,000] [2,437,000] 

NOTES

  • 所有标头和数据的排队分别
  • 报头重复中的数据帧进行数据的每一行
+0

代码缺口并不完全正确,因为计算器GUI要求其重新格式化 –

+0

我定您的格式,但你缺少一个值。 –

+0

通过突出显示和ctrl + k格式化代码(或使用{}按钮) –

回答

0

您可以跳过与切片和ILOC每隔一行:

In [11]: df = pd.DataFrame({0: ['A', 1, 'A', 3], 1: ['B', 2, 'B', 4]}) 

In [12]: df 
Out[12]: 
    0 1 
0 A B 
1 1 2 
2 A B 
3 3 4 

In [13]: df.iloc[1::2] 
Out[13]: 
    0 1 
1 1 2 
3 3 4