我试图在开始和停止时间之间过滤熊猫数据帧,然后在满足这些条件时将值放入指定列的行中。我有几百个项目同时发生,因此我试图以可扩展的方式进行。它没有给我预期的行为,将值放入指定的行,然后移动到下一个条件将项目放入这些行。相反,每次运行代码时,它都会写入最后一个值。请参阅下面的伪代码。任何想法/想法对于如何处理这个问题都会有所帮助。使用熊猫过滤数据并将数值放入数据框
注意:我曾考虑过使用apply方法,但是,我有400 X 60种不同的值,我需要遍历数百万行数据,因此它看起来像过滤方法将是最有利的。
transactional_df[(transactional_df.timestamp > start1) & (transactional_df.timestamp < stop1)]['new_col'] = item1
transactional_df[(transactional_df.timestamp > start2) & (transactional_df.timestamp < stop2)]['new_col'] = item2
期望的结果:
transactional_df.col1...new_col
Condition1 Met item1
Condition2 Met item2
检查零的回答https://stackoverflow.com/questions/46179362/fastest-way-to-merge-pandas-dataframe-on-ranges – Wen