python - Có cách nào để xuất df.min, df.max và df.mean trong Pandas.groupby trong một cột mỗi lần không? -6ren

python - Có cách nào để xuất df.min, df.max và df.mean trong Pandas.groupby trong một cột mỗi lần không?

In lại Tác giả: Vũ trụ không gian Thời gian cập nhật: 2023-11-04 01:46:57

27

4

Vì vậy, tôi cần nhóm các hàng theo cột "fh_status" rồi thực hiện giá trị tối thiểu, trung bình và tối đa của "gini" cho mỗi nhóm (sẽ có ba). Tôi đã nghĩ ra mã này:

m = (df2.groupby(['fh_status']).max().iloc[:, 2]) #iloc2 tương ứng với cột gini
n = (df2.groupby(['fh_status']).min().iloc[:, 2])
e = (df2.groupby(['fh_status']).mean().iloc[:, 2])
nl = '\n'
print(f' nghĩa là: {e} {nl} tối đa: {m} {nl} tối thiểu:{n}')

Đầu ra:

nghĩa là: fh_status
miễn phí 38.170175
không miễn phí 39,750000
miễn phí một phần 43.931250
Tên: gini, dtype: float64 
 tối đa: fh_status
miễn phí 10.0
không miễn phí 5.0
miễn phí một phần 9.0
Tên: ô nhiễm09, dtype: float64 
 tối thiểu:fh_status
miễn phí 6.0
không miễn phí -10.0
miễn phí một phần -6.0
Tên: ô nhiễm09, dtype: float64

Sử dụng cả ba trong một chuỗi không có tác dụng (theo như tôi biết thì nó chỉ in lệnh sau), do đó ba biến xuất hiện, hơi khó sử dụng. Kết quả đầu ra có vẻ đúng nhưng tôi khá chắc chắn rằng có cách để tối ưu hóa nó và giảm số lượng mã. Hay không?

câu trả lời hay nhất

Có, bạn có thể sử dụng .agg(..) và vượt qua danh sách các hoạt động:

df2.groupby('fh_status')['gini'].agg(['min', 'max', 'mean'])

Điều này sẽ tạo ra một khung dữ liệu với các cột dưới dạng tổng hợp (phút,max,nghĩa là), nhóm hành vi (giá trị bạn đã tạo ở trên .groupby(..)).

Giới thiệu về python - Có cách nào để xuất df.min, df.max và df.mean trong Pandas.groupby trong một cột nhất định tại một thời điểm không? , chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/58894526/

27

4

0

Bài viết khuyến nghị: python - Nhận diện tích hình chữ nhật tối đa từ mảng có nhiều mảng

Bài viết khuyến nghị: node.js - Cách quét mã để phát hiện lỗi không được dùng nữa hoặc tệ hơn

Bài viết khuyến nghị: Python: Cho phép gọi một số phương thức nhất định nếu thuộc tính là đúng

Bài viết khuyến nghị: android — Máy khách Socket.io ngắt kết nối do hết thời gian chờ ping/đóng vận chuyển

Sự khác biệt giữa df[x], df[[x]], df ['x' ], df[['x' ]] và df.x
Hãy cố gắng hiểu sự khác biệt giữa 5 ví dụ trong tiêu đề. Có một số trường hợp sử dụng cho Series và DataFrame không? Khi nào nên sử dụng cái này thay vì cái kia? Những cái nào là tương đương? Câu trả lời hay nhất df[x] — lập chỉ mục cột bằng biến x. Trả về pd.Series df[[x]
python - Hiển thị df.info(), df.head(), df.shape, df.dtypes trong một bước
Trong khi sử dụng Jupyter Notebook, tôi phải chừa các khoảng trống riêng cho df.info(), df.head(), v.v. như đã đề cập trong tiêu đề câu hỏi. Có cách nào để đặt tất cả những thứ này vào một khối như trong hình thứ hai không, và hiển thị tất cả thông tin
python - Cách tốt hơn để triển khai `df[m] = df[x] + df[y] + df[z]`
Tôi muốn tìm tổng của ba cột. Phương pháp tôi thực hiện như sau: Trong [14]: a_pd = pd.DataFrame({'a': np.arange(3), 'b': [5, 7,
Thay thế df <- df %>% bằng phím tắt ...
Tôi nghĩ hầu hết chúng ta đều đã sử dụng những thứ như thế này (ít nhất là nếu bạn đang sử dụng gọn gàng): ví dụ về thư viện (tidyverse) % select(- mpg) Câu hỏi của tôi: Tôi biết có một
python - Chức năng chia một DF thành nhiều DF và thực hiện mọi thao tác trên mỗi DF
Tôi có một DF có khoảng 20.000 hàng trong đó. Tôi đã xây dựng một tập lệnh Python để chạy nhiều thao tác dọn dẹp và tính toán trên dữ liệu này (bao gồm cả bảng tổng hợp). Tôi muốn chia DF này thành 3 DF riêng biệt rồi kết hợp 3 DF này dựa trên giá trị cột
python - 避免在执行 df ['column' ] = df ['column' ] 时写两次 df ['column' ]
我什至不知道如何表达这一点，但在 Python 中有没有一种方法可以引用等号之前的文本，而无需实际再次编写？ ** 编辑 - 我在 Jupyter 中使用 python3 我似乎用了半辈子的时间来写作
python - Thay thế các ô trong DF trong đó ô của DF là chỉ mục của hàng mong muốn trong DF khác
Trong df1, mỗi giá trị ô là chỉ mục của hàng tôi muốn lấy từ df2. Tôi muốn lấy thông tin về các hàng trong cột trial_ms của df2 và sau đó đổi tên các cột trong df1 dựa trên các cột thu được của df2. DF có thể tái tạo: #df1
python - Lấy nhiều df từ một df sao cho mỗi df không có giá trị NaN
Tôi muốn chuyển đổi bảng này 0 Thứ John 3.0 1 Thứ James 4.0 2 mol NaN 5.0 3 mol NaN NaN 4
r - Tôi có thể viết tắt df[ !is.na(df$val) & df$val > 15] không?
Tôi có một khung dữ liệu mà từ đó tôi muốn trích xuất các giá trị trong val lớn hơn 15 và trong đó val không phải là NA: df[ !is.na(df$val) & df$val > 15, ] Vì tôi giả sử điều đó trong R điều này thường cần thiết để so sánh, vì vậy
python - Làm cách nào để thay thế df.ix bằng df.loc hoặc df.iloc?
Do df.ix[...] sắp ngừng sử dụng, làm cách nào tôi có thể thay thế .ix trong mã này? df_1 = df.ix[:, :datetime.time(16, 50)] d
python-3.x - Sự khác biệt giữa df.where( ) và df [ (df [] == )] trong Pandas, python
Ai có thể giúp tôi phân biệt sự khác biệt giữa hai câu lệnh này trong Pandas - python df.where(df['colname'] == value) và df[(df['colname'] == value)]
python - Tạo hàm lambda với điều kiện trên một df để sử dụng trong df.apply của một df khác
Xét chỉ số df ABC 0 20161001 0 24,5 1 20161001 3 26,5 2
python - Có cách nào để xuất df.min, df.max và df.mean trong Pandas.groupby trong một cột mỗi lần không?
Vì vậy, tôi cần nhóm các hàng theo cột "fh_status" rồi thực hiện giá trị tối thiểu, trung bình và tối đa của "gini" cho mỗi nhóm (sẽ có ba). Tôi đã nghĩ ra mã này: m = (df2.groupby(['fh_status']).
Chỉ chọn một giá trị trong một hàng df col trong cùng một df để nhận kết quả tính toán cho các giá trị khác nhau và chỉ thực hiện điều đó cho một ký hiệu chứng khoán tại một thời điểm df
Tôi cố gắng tính toán một số KPI cho các công ty/cổ phiếu khác nhau. Thông tin chứng khoán của tôi ở dạng df với cấu trúc sau Mã mở cao thấp Quảng cáo
Làm cách nào để tạo một df mới từ tập hợp con các giá trị của một df khác?
Tôi có một df trông như thế này: gen ID Thăm dò ID Nhiễm sắc thể Bắt đầu Dừng 1: H3F3A 539154271
Cách tốt nhất để tạo một df mới bằng cách sử dụng các giá trị chỉ mục từ một df khác được sử dụng để truy xuất nhiều giá trị?
nn_idx_df chứa giá trị chỉ mục khớp với chỉ mục của xyz_df. Làm cách nào tôi có thể nhận giá trị từ cột H trong xyz_df và tạo cột mới trong nn_idx_df để khớp với kết quả được hiển thị trong out_df. Tôi có thể giải quyết vấn đề này,
Cách tạo DF từ DF dựa trên điều kiện
DF hiện tại của tôi trông giống như thế này Kết hợp Đếm 1 ('IDLY', 'VADA') 3734 6 ('DOSA', 'IDLY')
Điền DF bằng DF thứ hai
Tôi đã thấy một số câu hỏi liên quan đến vấn đề này nhưng tôi thấy rằng không có thủ thuật nào trong số này có hiệu quả. Tôi đang cố gắng điền tất cả các giá trị NaN của khung dữ liệu dựa trên các giá trị của khung dữ liệu thứ hai. Df đầu tiên lớn và df thứ hai sẽ hoạt động như một loại khóa nào đó. DF1Par
Sao chép dữ liệu từ df sang df khác trong nhiều cột dựa trên một khóa
Tôi có hai khung dữ liệu, df1 và df2. Mã định danh duy nhất của mỗi khung dữ liệu là "ID" và "Prop_Number". Tôi cần sao chép các cột Num1, 2 và 3 trong df1 sang các cột tương ứng trong df2, 1_Num...nhưng tôi không chắc
python - df.to_dict() chỉ nhận được một hàng khung dữ liệu gốc (df)
Tôi có khung dữ liệu sau: Lưu ý: Ngày là thành phố chỉ mục buổi sáng buổi chiều buổi tối nửa đêm ngày 2014-05-01 Y

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

python - Có cách nào để xuất df.min, df.max và df.mean trong Pandas.groupby trong một cột mỗi lần không?