在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?

Can one perform a left join in pandas that selects only the first match on the right?(在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?)

本文介绍了在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在 pandas 中,是否可以只选择右侧的第一个匹配项进行左联接?示例:

left            = pd.DataFrame()
left['age']     = [11, 12]
right           = pd.DataFrame()
right['age']    = [10, 11, 11]
right['salary'] = [ 100, 150, 200 ]
left.merge( right, how='left', on='age' )

退货

   age  salary
0   11     150
1   11     200
2   12     NaN

但我想要的是保留左边的行数,只取第一个匹配。即:

   age  salary
0   11     150
2   12     NaN

所以我一直在使用

left.merge( right.drop_duplicates(['age']), how='left', on='age')

但我相信这是Right的完整副本。而且闻起来很怪。

有没有更优雅的方式?

推荐答案

可以,您可以使用GROUPBY删除重复行。做你所做的一切来定义左和右。现在,我在您的最后一行定义了一个新的数据帧:

left2=left.merge( right, how='left', on='age' )
df= left2.groupby(['age'])['salary'].first().reset_index()
df

一开始我使用的是.min(),它会给出每个年龄的最低工资,如下所示:

df= left2.groupby(['age'])['salary'].min().reset_index()

但你特别问的是第一场比赛。为此,您可以使用.first()选项。注意:末尾的.Reset_index()只是将groupby的输出重新格式化为DataFrame。

这篇关于在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本文标题为:在 pandas 中,人们可以只选择右边的第一个匹配来执行左连接吗?