1
我有一个excel文件,包含多个单词的单个列。我正在计算每个单词出现的频率。 所以如果我有一个列表.value_counts()给出截断结果
Labels
a
a
b
b
c
c
c
输出应该
c : 3
b : 2
a : 2
我使用的代码片段
import pandas as pd
train = pd.read_csv("ani2.csv")
A = train['Labels'].value_counts()
f = open("ani3.csv",'a')
f.write(str(A))
f.close()
数据集有大约53000值和输出I以下获得被截断。我获得的输出是这种格式。
z : 1700
y : 1500
x : 1000
...
c : 3
b : 2
a : 2
由于某种原因,中间的数值缺失,我得到的所有数据都是三个点。