cuốn sách gpt4 ai đã làm

python - Lựa chọn tính năng (phân loại) của tập dữ liệu nhị phân

In lại Tác giả: Vũ trụ không gian Thời gian cập nhật: 2023-11-04 04:23:58 32 4
mua khóa gpt4 Nike

Tập dữ liệu của tôi có 32 biến phân loại và một biến số liên tục (sale_volume)

Đầu tiên tôi chuyển đổi các biến phân loại thành nhị phân bằng cách sử dụng một mã hóa nóng (pd.get_dummies) và bây giờ tôi có 1294 cột vì mỗi cột có nhiều biến phân loại.

Bây giờ tôi muốn giảm chúng trước khi sử dụng bất kỳ kỹ thuật giảm kích thước nào.

  1. Các lựa chọn tốt nhất để lựa chọn các biến hiệu quả nhất là gì?

  2. Ví dụ; một biến phân loại có hai câu trả lời "là" và "không". Chẳng lẽ cột “là” có ý nghĩa còn cột “không” thì không có gì để giải thích? Bạn bỏ câu hỏi (cột "có" và "không") hay chỉ cột "không"?

Cảm ơn trước.

câu trả lời hay nhất

hiện hữu sklearn , bạn có thể sử dụng sklearn.feature_selection.SelectFromModel, cho phép bạn điều chỉnh mô hình cho tất cả các tính năng và chỉ chọn các tính năng quan trọng hơn trong mô hình, ví dụ: Rừng ngẫu nhiên. Sau đó get_support() Các phương thức cung cấp cho bạn những chức năng quan trọng.

từ sklearn.ensemble nhập RandomForestClassifier
từ sklearn.feature_selection nhập SelectFromModel

clf = RandomForestClassifier()
sfm = SelectFromModel(clf)
sfm.fit(X,y)

sfm.get_support()

Về python - lựa chọn tính năng (phân loại) của tập dữ liệu nhị phân, chúng tôi tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/53872255/

32 4 0
không gian vũ trụ
Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Nhận phiếu giảm giá taxi Didi miễn phí
Phiếu giảm giá taxi Didi
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress