Method chaining solution to drop column level in pandas DataFrame(Pandas DataFrame中删除列级的方法链接解决方案)
本文介绍了Pandas DataFrame中删除列级的方法链接解决方案的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我在重塑和查询我在 pandas DataFrames
中的数据时使用的是Lot of方法链。有时会为in索引(行)和列创建额外的和不必要的级别。如果是,例如在索引(行轴)上,可以使用DataFrame.reset_index()
:
df.query('some query')
.apply(cool_func)
.reset_index('unwanted_index_level',drop=True) # <====
.apply(another_cool_func)
reset_index
函数允许用户继续链接方法并继续使用DataFrame
。
尽管如此,我从来没有为Column_Axis找到一个等价的解决方案。有吗?
推荐答案
您可以只调用stack
列(将其移动到索引中),并使用Drop=True调用reset_index
,或者您可以使用reset_index()
作为起点编写reset_columns()
方法(请参阅Frame.py#L2940)
df.query('some query')
.apply(cool_func)
.stack(level='unwanted_col_level_name')
.reset_index('unwanted_col_level_name',drop=True)
.apply(another_cool_func)
替代方案:猴贴溶液
def drop_column_levels(self, level=None, inplace=False):
"""
For DataFrame with multi-level columns, drops one or more levels.
For a standard index, or if dropping all levels of the MultiIndex, will revert
back to using a classic RangeIndexer for column names.
Parameters
----------
level : int, str, tuple, or list, default None
Only remove the given levels from the index. Removes all levels by
default
inplace : boolean, default False
Modify the DataFrame in place (do not create a new object)
Returns
-------
resetted : DataFrame
"""
if inplace:
new_obj = self
else:
new_obj = self.copy()
new_columns = pd.core.common._default_index(len(new_obj.columns))
if isinstance(self.index, pd.MultiIndex):
if level is not None:
if not isinstance(level, (tuple, list)):
level = [level]
level = [self.index._get_level_number(lev) for lev in level]
if len(level) < len(self.columns.levels):
new_columns = self.columns.droplevel(level)
new_obj.columns = new_columns
if not inplace:
return new_obj
# Monkey patch the DataFrame class
pd.DataFrame.drop_column_levels = drop_column_levels
这篇关于Pandas DataFrame中删除列级的方法链接解决方案的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:Pandas DataFrame中删除列级的方法链接解决方案
猜你喜欢
- 将文件从Azure文件加载到Azure数据库 2022-09-21
- 如何命名HDF5数据集中的列? 2022-09-21
- 为什么切换屏幕在Kivy中不起作用? 2022-09-21
- 基于多个一级列的子集多索引DataFrame 2022-09-22
- H5py:如何在HDF5组和数据集上使用key()循环 2022-09-21
- 获取多索引中某个级别的最后一个元素 2022-09-22
- 如何将属性添加到作为组存储在HDF5文件中的 pa 2022-09-21
- 使用带有CROSS_VAL_SCORE的自定义估计器失败 2022-09-21
- 如何防止Groupby超越指数? 2022-09-22
- 合并具有多个索引和列值的数据帧 2022-09-22