pandas 将min()与groupby一起使用时, 并保留其他列数据, 类似于sql中的group by having min()-APISpace

pandas 将min()与groupby一起使用时, 并保留其他列数据, 类似于sql中的group by having min()

我正在使用groupbypandas数据帧删除所有没有特定列的最小行。像这样的东西：

df1 = df.groupby("item", as_index=False)["diff"].min()

但是，如果我有超过这两列，则其他列将被删除。我可以使用groupby保留这些列，还是我必须找到一种不同的方法来删除行？

我的数据如下：

item diff otherstuff 0 1 2 1 1 1 1 2 2 1 3 7 3 2 -1 0 4 2 1 3 5 2 4 9 6 2 -6 2 7 3 0 0 8 3 2 9

并应该最终像：

item diff otherstuff 0 1 1 2 1 2 -6 2 2 3 0 0

但我得到的是：

item diff 0 1 1 1 2 -6 2 3 0

我一直在查看文档，找不到任何东西。我试过了：

df1 = df.groupby(["item", "otherstuff"], as_index=false)["diff"].min()df1 = df.groupby("item", as_index=false)["diff"].min()["otherstuff"]df1 = df.groupby("item", as_index=false)["otherstuff", "diff"].min()

但是没有一个可以

查阅可以有解决约这样的

方法＃1：用于idxmin()获取最小元素的索引diff，然后选择：

>>> df.loc[df.groupby("item")["diff"].idxmin()] item diff otherstuff1 1 1 26 2 -6 27 3 0 0[3 rows x 3 columns]

方法＃2：排序diff依次，然后取每组中的第一个元素item：

>>> df.sort_values("diff").groupby("item", as_index=False).first() item diff otherstuff0 1 1 21 2 -6 22 3 0 0[3 rows x 3 columns]

请注意，即使行内容相同，结果索引也不同。

c语言sscanf函数的用法是什么

257 2022-09-21

pandas 将min()与groupby一起使用时, 并保留其他列数据, 类似于sql中的group by having min()

c语言sscanf函数的用法是什么

c语言一维数组怎么快速排列

php怎么获取input输入的值

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）