我上传了一个文件到Google电子表格(用数据创建了一个可公开访问的示例IPython Notebook)我使用的是原生格式的文件,可以读入Pandas Dataframe。所以现在我用下面的代码来阅读电子表格,工作正常,但只是以字符串形式出现,并且我没有任何运气试图让它回到数据框中(您可以获取数据)将Google Spreadsheet CSV文件导入Pandas Dataframe
import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content
数据最终看起来像:(1排头)
',City,region,Res_Comm,mkt_type,Quradate,National_exp,Alabama_exp,Sales_exp,Inventory_exp,Price_exp,Credit_exp\n0,Dothan,South_Central-Montgomery-Auburn-Wiregrass-Dothan,Residential,Rural,1/15/2010,2,2,3,2,3,3\n10,Foley,South_Mobile-Baldwin,Residential,Suburban_Urban,1/15/2010,4,4,4,4,4,3\n12,Birmingham,North_Central-Birmingham-Tuscaloosa-Anniston,Commercial,Suburban_Urban,1/15/2010,2,2,3,2,2,3\n
,在磁盘驻留文件所带来的本地大熊猫代码如下所示:
df = pd.io.parsers.read_csv('/home/tom/Dropbox/Projects/annonallanswerswithmaster1012013.csv',index_col=0,parse_dates=['Quradate'])
“干净”的解决方案将是有益的至 许多人提供一种简单的方法来共享Pandas使用的数据集!我尝试了一堆替代品,但没有成功,我很确定我再次失去了一些明显的东西。
只是一个更新注意新的谷歌电子表格都有不同的URL模式在上面的例子中就用这个来代替URL和或以下的答案,你应该罚款这里有一个例子:
https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&id
看到@Max Ghenis以下解决方案,它只是用pd.read_csv,不需要StringIO的或请求...
非常有帮助......需要学习StringIO! – dartdog
我正在寻找几周,如何将电子表格导入熊猫。从来没有听说过请求或StringIO库。谢谢!! – moldovean
注意新的谷歌电子表格版本 – dartdog