pandas操作:生成器__iter__分析数据样本
推荐
在线提问>>
在Jupyter Notebook中通常很难像使用Excel一样难逐行或逐个组地浏览数据集。一个非常有用的技巧是使用 generator 生成器和Ctrl + Enter组合,而不是我们常规的Shift + Enter运行整个单元格。这样做就可以很方便地迭代查看同一单元格中的不同样本了。
一、首先在单元格中使用.groupby()(或.iterrows())和.__iter __()创建一个生成器:
generator = df.groupby(['identifier']).__iter__()
二、然后,根据自己需要运行的次数,使用键盘快捷键 Ctrl + Enter 逐个查看数据。
group_id, grouped_data = generator.__next__()
print(group_id)
grouped_data
下面是taitanic数据集的示例。正常分析的时候,所有乘客都混在一起,我们是不能单独地隔离每组乘客的,使用这种方法就可以非常简单地分析一组乘客。

