我有一个机器学习算法,它涉及一系列步骤,例如清理数据,准备训练数据等。每个步骤都存储在python类的单独方法中。我想知道构建我的类的最佳实践方式是如何在类实例化时自动执行这些步骤。 这是我所做的(代码是说明性的,但这种方法适用于真正的算法)。它感觉有点笨重。有没有更优雅的方式? class Kaggle():
"""
An algorithm
"""
d
我正在使用Kaggle提供的泰坦尼克号数据集。我有一个数据框,我想改变“性”列的情况下小写。我使用下面的代码 import pandas as pd
df = pd.read_csv('titanic.csv')
print dfFull['sex'].unique()
df.sex.str.lower()
#check if it worked
print df['sex'].un
我拥有列表形式的数据。我想做一些像(data[1::100])[3]这样的事情,在那里我访问前100个元素,然后是所有元素的第三列。在上Kaggle教程,我看到了之类的东西data[1::100,3],但是Python说: TypeError: list indices must be integers, not tuple. 是否有一个简单的方法来做到这一点?我可以使用一个循环或其他东西,但是这