Tôi có hàng triệu đối tượng DateTime trong gấu trúc. Tôi không thể tìm thấy bất cứ điều gì trong tài liệu Phân tích dữ liệu khám phá (EDA).
Có vẻ như mọi hàng trong mọi khung dữ liệu đều có cùng thời gian:
DF1
Dấu thời gian ('2018-02-20 00:00:00')
hoặc
Dấu thời gian DF2 ('2018-01-01 05:00:00')
Có cách nào sử dụng gấu trúc để lặp qua từng cột và kiểm tra xem có sự khác biệt về giờ/phút/giây không?
Tất cả mọi thứ tôi tìm thấy là về sự khác biệt giữa thời gian tính toán.
Tôi đã thử một số kỹ thuật cơ bản nhưng tất cả những gì tôi nhận được chỉ là những con số mô tả đơn giản.
phút(dữ liệu['ngày'])
dữ liệu['date'].nunique()
Tôi đã thử:
in(dữ liệu['TIMESTAMP_UTC'])
Nó hiển thị một số ngày với thời gian khác nhau, nhưng tôi cần một cách để quản lý thông tin này:
0 2018-01-16 05:00:00
1 2018-05-04 04:00:00
2 22-10-2018 04:00:00
3 2018-01-02 05:00:00
4 2018-01-03 05:00:00
5 2018-01-04 05:00:00
6 2018-01-05 05:00:00
......
Lý tưởng nhất là tôi đang tìm kiếm thứ gì đó có thể xuất ra .value_counts() của một ngày khác biệt với tất cả các ngày khác
Bạn có thể sử dụng.áp dụng()
phương pháp thay đổi định dạng từstr
转换为ngày giờ
. Sau đó bạn sử dụng ngày giờđể giải quyết nó.
Để chuyển đổi giá trị cột thành datetime:
df['TIMESTAMP_UTC'] = pd.to_datetime(df['TIMESTAMP_UTC'] )
df['TIMESTAMP_UTC'] = df['TIMESTAMP_UTC'].apply(lambda x: datetime.strptime(x, "%Y-%b-%d %H:%M:%S"))
然后您可以使用ngày giờ
Các chức năng mạnh mẽ để so sánh hoặc trích xuất thông tin, chẳng hạn như trích xuất giờ:
df['TIMESTAMP_UTC'].dt.day
Tôi là một lập trình viên xuất sắc, rất giỏi!