2013-07-15 133 views
26

this post有一个Python例如从CSV转换为XLS。的Python转换CSV到XLSX

然而,我的文件已经超过65536行这样的xls不起作用。如果我将这个文件命名为xlsx,它并没有什么不同。是否有一个Python包可以转换为xlsx?

回答

46

下面是一个使用xlsxwriter一个例子:

import os 
import glob 
import csv 
from xlsxwriter.workbook import Workbook 


for csvfile in glob.glob(os.path.join('.', '*.csv')): 
    workbook = Workbook(csvfile[:-4] + '.xlsx') 
    worksheet = workbook.add_worksheet() 
    with open(csvfile, 'rt', encoding='utf8') as f: 
     reader = csv.reader(f) 
     for r, row in enumerate(reader): 
      for c, col in enumerate(row): 
       worksheet.write(r, c, col) 
    workbook.close() 

仅供参考,还有一个叫openpyxl包,可以读/写的Excel 2007 XLSX/XLSM文件。

希望有所帮助。

+0

感谢这个非常有用的代码片段。在使用大文件时,最好使用'constant_memory'来控制内存的使用,例如:'workbook = Workbook(csvfile +'.xlsx',{'constant_memory':True})''。参考文献:http://xlsxwriter.readthedocs.org/en/latest/working_with_memory.html – Ethan

+1

尼斯......然而,创建XLSX文件是完全具有字段存储为文本而不是数字错误的所有字段数.. 。 – MrMobileMan

+1

发现修复数字为文本问题在这里:http://stackoverflow.com/questions/24971556/openpyxl-python-writing-csv-to-excel-gives-number-formatted-as-text – MrMobileMan

17

随着我的图书馆pyexcel,你能做到在一个命令行:

from pyexcel.cookbook import merge_all_to_a_book 
import pyexcel.ext.xlsx # needed to support xlsx format, pip install pyexcel-xlsx 
import glob 


merge_all_to_a_book(glob.glob("your_csv_directory/*.csv"), "output.xlsx") 

每个CSV都会有自己的片材和名称将是他们的文件名。

+1

非常好...谢谢!我投了这个票。然而,我遇到的一个问题是,这个和xlswriter都创建了xlsx的错误,文本字段被格式化为文本而不是数字... – MrMobileMan

+1

找到了修复数字为文本问题在这里... http: //堆栈溢出。com/questions/24971556/openpyxl-python-writing-csv-to-excel-given-number-formatted-as-text – MrMobileMan

+0

如果需要额外的格式,可以不使用merge_all_to_a_book,但使用pyexcel.Sheet,可以使用它首先使用format()函数[将float转换为int](https://github.com/chfw/pyexcel/issues/18),然后使用[sheet operations](http://pyexcel.readthedocs.org/en/latest /tutorial04.html)合并它们并保存为csv。 – chfw

2

如何与openpyxl lib中做到这一点:

import csv 
from openpyxl import Workbook 

def convert_csv_to_xlsx(self): 
    wb = Workbook() 
    sheet = wb.active 

    CSV_SEPARATOR = "#" 

    with open("my_file.csv" as f: 
     reader = csv.reader(f) 
     for r, row in enumerate(reader): 
      for c, col in enumerate(row): 
       for idx, val in enumerate(col.split(CSV_SEPARATOR)): 
        cell = sheet.cell(row=r+1, column=idx+1) 
        cell.value = val 

    wb.save("my_file.xlsx") 
0
from openpyxl import Workbook 
import csv 


wb = Workbook() 
ws = wb.active 
with open('test.csv', 'r') as f: 
    for row in csv.reader(f): 
     ws.append(row) 
wb.save('name.xlsx') 
0

有一个简单的方法

import os 
import csv 
import sys 

from openpyxl import Workbook 

reload(sys) 
sys.setdefaultencoding('utf8') 

if __name__ == '__main__': 
    workbook = Workbook() 
    worksheet = workbook.active 
    with open('input.csv', 'r') as f: 
     reader = csv.reader(f) 
     for r, row in enumerate(reader): 
      for c, col in enumerate(row): 
       for idx, val in enumerate(col.split(',')): 
        cell = worksheet.cell(row=r+1, column=c+1) 
        cell.value = val 
    workbook.save('output.xlsx') 
1

并称,只使用熊猫库中读取一个答案。 csv文件并保存为.xlsx文件。这个例子使用的pandas.read_csvLink to docs)和pandas.dataframe.to_excelLink to docs)。

完全重复的例子,使用numpy的只生成随机数,这样就可以,如果你想用你自己的.csv文件被删除。

import pandas as pd 
import numpy as np 

# Creating a dataframe and saving as test.csv in current directory 
df = pd.DataFrame(np.random.randn(100000, 3), columns=list('ABC')) 
df.to_csv('test.csv', index = False) 

# Reading in test.csv and saving as test.xlsx 

df_new = pd.read_csv('test.csv') 
writer = pd.ExcelWriter('test.xlsx') 
df_new.to_excel(writer, index = False) 
writer.save()