我的工作分配在Python类目前列出的元组,以及一个特定部分要求我在“文本的格式导入CSV文件(数据,数字,数字,...,数字,数字“),并且以这种格式返回数据作为元组列表:解析CSV不使用CSV模块
[(’Text’, [number, number, ..., number, number]),
(’Text’, [number, number, ..., number, number]),
.....]
[(’Text’, [number, number, ..., number, number]),
(’Text’, [number, number, ..., number, number]),
.....]
我想我得打开文件,并开始由线正确路线读它(见下面代码段)的实际过程,但我不能就如何处理方面着手每行解析成格式相当肯定需要。
def load_data(filename):
open(filename)
for line in filename
我试图寻找帮助,但唯一的帮助,我似乎找到说只使用CSV模块(这是不是特别有帮助,因为我们不允许任何导入模块吧数学库)或者以不同格式输入和/或输出数据。如果任何人都可以给我一些关于我应该做什么的指示,或者我可以在哪里开始,这将是超级有用的。谢谢!
编辑:每通过@dotancohen这里提出的建议是一些示例数据:
Slow Loris, 21.72, 29.3, 20.08, 29.98, 29.85, 26.22, 29.68
Ocelot, 57.51, 47.59, 55.89, 47.15, 46.71, 51.7, 46.68, 54.54
Tiger, 75.0, 82.43, 112.11, 89.93, 103.19, 80.6, 113.44, 75.55, 102.29, 108.1, 98.84, 101.48, 77.75, 98.57, 70.31, 78.28, 80.18
而且下面是我目前所面对的是一个潜在的解决方案:
def load_data(filename):
open(filename) as file
output = []
for line in filename
temp_list = line.split(',')
temp_item = temp_list.pop(0)
tup = (temp_item, temp_list)
output.append(tup)
return output
对,所以我会使用line.split(','),因为我的文件完全是用逗号分隔的。尽管我无法控制输入,但我们已经获得了两个CSV文件,程序将针对这两个文件进行测试,并且它们都具有相同的一致格式,而且没有引号值,转义引号或非Unicode字符(尽管我们正在使用Python 3)。我应该将文本分割成单独的变量,然后将文本作为元组重新加入数字中?这应该给我所寻找的输出,对不对? – RandosaurusRex
@RandosaurusRex - 这看起来是一段很好的工作方法。你可能没有进一步的帮助就可以完成它,但如果你尝试这种设计,并且麻烦回来并要求详细的帮助。我怀疑你会从这里得到好处,但如果你确实遇到了从这里到最后的跳闸点,那么不会感到羞耻。 – jwpfox
@RandosaurusRex:我希望在给出yes或no之前查看示例文件,能否请您在问题中添加几行示例行?谢谢。 – dotancohen