我基本上是从R迁移到Python。我想基于列来对数据框进行子集化。当遇到堆栈溢出answer时,我找到了一个解决方案。熊猫数据框中.loc的用途
但考虑下面的代码:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
'B': 'one one two three two two one three'.split(),
'C': np.arange(8), 'D': np.arange(8) * 2})
df1 = df[df['A'] == "foo"]
df1
df2 = df.loc[df['A'] == "foo"]
df2
两个DF1和DF2是一样的。
所以我的问题是:首先要求loc
功能是什么。请记住,我来自R背景和R,我们不必使用loc
类型函数来对数据帧进行子集化。
请阅读[本](http://pandas.pydata.org/pandas-docs/stable/indexing.html#different-choices-for-indexing)和[this](http://pandas.pydata。 org/pandas-docs/stable/indexing.html#indexing-view-versus-copy)如果您还有其他问题,请编辑您的问题 – EdChum