我有一个名为df_ratings
的熊猫数据框,大约有一百万行和三列。寻找更快的方式来迭代熊猫数据帧
我想借此数据这个数据框里面,就可以应用转换,并把它称为ratings_matrix
一个numpy的矩阵里面我写了下面的代码来实现这一目标:
for i in range(df_ratings.shape[0]): #fill matrix with ratings. zero = unrated
current_user = df_ratings.iloc[i, 0] - 1
current_movie = rated_movies_dictionary[df_ratings.iloc[i, 1]]
current_rating = df_ratings.iloc[i, 2]
ratings_matrix[current_movie, current_user] = current_rating
它作品,但非常缓慢。迭代for循环中的每一行数据帧都很慢。有没有更快的方法来做到这一点?
很难说没有任何数据。但你可以摆脱循环。 –