Filter Dataframe Based on Differnce Between Columns [Not Next-to-Next Columns](根据列之间的差异过滤数据帧[不是下一列])
本文介绍了根据列之间的差异过滤数据帧[不是下一列]的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个唯一的数据帧df
:
name val_1 val_2 val_3 val_4
AAA 1 2 3 11
BBB 2 3 5 9
CCC 6 4 15 10
我只需要保留其中任何右侧val
列从前面的任何val
列增加10的名称,否则删除它们。
我知道diff()
和ge()
在这里会有帮助,但不确定如果不是关于下一列之间的差异,它们将如何工作。
所需输出:
name
AAA #val_4 increases by 10 from val_1
CCC #val_3 increases by 11 from val_2
做这件事最聪明的方式是什么?如有任何建议,我们将不胜感激。谢谢!
推荐答案
我认为它正在做所需的工作。请注意,我将val_1的第二个值更改为20,这样我们就可以确保我们不会得到从左到右的差异,而不仅仅是从右到左的差异。
import pandas as pd
df = pd.DataFrame(
{
'name': ['AAA', 'BBB', 'CCC'],
'val_1': [1, 20, 6],
'val_2': [2, 3, 4],
'val_3': [3, 5, 15],
'val_4': [11, 9, 10]
}
)
df = df.set_index("name")
f = lambda x: max( [ x[:i][-1] - min(x[:i][:-1]) for i in range(2,len(x)+1)] )
df = df[df.apply(f, axis=1) >= 10]
print(df.index.to_list())
这篇关于根据列之间的差异过滤数据帧[不是下一列]的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:根据列之间的差异过滤数据帧[不是下一列]
猜你喜欢
- 如何使用PYSPARK从Spark获得批次行 2022-01-01
- 计算测试数量的Python单元测试 2022-01-01
- 我如何卸载 PyTorch? 2022-01-01
- 使用公司代理使Python3.x Slack(松弛客户端) 2022-01-01
- ";find_element_by_name(';name';)";和&QOOT;FIND_ELEMENT(BY NAME,';NAME';)";之间有什么区别? 2022-01-01
- 使用 Cython 将 Python 链接到共享库 2022-01-01
- YouTube API v3 返回截断的观看记录 2022-01-01
- 检查具有纬度和经度的地理点是否在 shapefile 中 2022-01-01
- 我如何透明地重定向一个Python导入? 2022-01-01
- CTR 中的 AES 如何用于 Python 和 PyCrypto? 2022-01-01