sách gpt4 ăn đã đi

Triển khai dữ liệu lọc gấu trúc theo phạm vi ngày

In lại Tác giả: qq735679552 Thời gian cập nhật: 29-09-2022 22:32:09 27 4
mua khóa gpt4 giày nike

CFSDN nhấn mạnh vào giá trị tạo ra nguồn mở và chúng tôi cam kết xây dựng nền tảng chia sẻ tài nguyên để mọi nhân viên CNTT có thể tìm thấy thế giới tuyệt vời của bạn tại đây.

Bài viết trên blog CFSDN này về việc triển khai lọc dữ liệu theo phạm vi ngày được tác giả sưu tầm và biên soạn. Nếu bạn quan tâm đến bài viết này thì nhớ like nhé.

Pandas là một thư viện mạnh mẽ trong python. Tôi sẽ không nhắc lại ở đây mà sẽ giới thiệu ngắn gọn cách sử dụng phạm vi ngày để lọc dữ liệu về gấu trúc.

chuyển đổi ngày

Cột dùng để lọc thuộc loại ngày, vì vậy phạm vi ngày cần lọc phải được chuyển đổi từ chuỗi sang loại ngày.

Ví dụ: dữ liệu của tôi chứa tên cột Trade_date, từ 20050101 đến 20190926. Tôi muốn lọc dữ liệu từ 20050606 đến 20071016. Sau đó, trước tiên hãy chuyển đổi kiểu dữ liệu như sau:

?
1
2
ngày s_s = datetime.datetime.strptime( '20050606' , '%Y%m%d' ).ngày()
ngày điện tử = datetime.datetime.strptime( '20071016' , '%Y%m%d' ).ngày()

Lọc dữ liệu

Rất đơn giản, chỉ một dòng mã:

?
1
df = df[(df[ 'giữa_ngày' ] > = s_date) & (df[ 'giữa_ngày' ] < = ngày điện tử)]

Những điều cần lưu ý.

  • Khi nhiều điều kiện lọc cùng tồn tại, bạn không thể sử dụng và để kết nối chúng mà bạn cần sử dụng một ký hiệu &.
  • s_date <= df['trade_date'] <= e_date tương đương với và

Năm cách trích xuất dữ liệu trong một khoảng thời gian nhất định bằng gấu trúc

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
nhập khẩu gấu trúc như pd
 
#Đọc tập tin
df = pd. đọc_csv( './TianQi.csv' )
 
#Một số phương pháp để lấy dữ liệu tháng 9
#Phương pháp 1 sử dụng việc cắt chỉ mục hàng, ['2019/9/1':'2019/9/30']. Điểm bất lợi là các ngày phải liên tiếp. Để thuận tiện cho việc xem, 5 mục trên cùng được lấy. Các phương pháp khác dưới đây đều lấy 5 mục trên cùng. Vì chúng không được sắp xếp nên thứ tự sẽ khác.
df. set_index( 'ngày' , tại chỗ = ĐÚNG VẬY )
in (trích dẫn[ '2019/9/1' : '2019/9/30' ].cái đầu())  #Hoặc print(df.loc['2019/9/1':'2019/9/30',:])
'''
In:
      Nhiệt độ tối đa Nhiệt độ tối thiểu Thời tiết Hướng gió Mức gió Chất lượng không khí
ngày                 
1/9/2019 33oC 19oC Có mây đến nắng Gió tây nam cấp 2 Tốt
2019/9/2 34oC 20oC nắng gió nam cấp 2 tốt
2019/9/3 33°C 20°C Nắng, gió Đông Nam cấp 2, tốt
2019/9/7 34oC 21oC nắng gió tây nam cấp 2 tốt
8/9/2019 35oC 22oC Nắng~Mây Gió Đông Bắc cấp 2 Tốt
'''
 
#Phương pháp 2 Sử dụng tính năng tạo danh sách và startwith('2019/9') để tạo danh sách bool. Nhược điểm là rắc rối hơn.
in (df.loc[[ ĐÚNG VẬY nếu như i.bắt đầu bằng( '2019/9' ) khác SAI Tôi TRONG df.index.tolist()],:].head())
'''
In:
      Nhiệt độ tối đa Nhiệt độ tối thiểu Thời tiết Hướng gió Mức gió Chất lượng không khí
ngày                 
2019/9/4 32oC 19oC Nắng, gió đông nam cấp 2, tốt
2019/9/5 33oC 20oC Nắng, gió đông nam cấp 2, tốt
2019/9/6 33oC 20oC Nắng, gió đông nam cấp 1, tốt
1/9/2019 33oC 19oC Có mây đến nắng Gió tây nam cấp 2 Tốt
2019/9/2 34oC 20oC nắng gió nam cấp 2 tốt
'''
 
#Phương pháp 3: Sử dụng str và startedwith('2019/9')|contains('2019/9') của gấu trúc.
df1 = pd. đọc_csv( './TianQi.csv' )
in (df1[df1[ 'ngày' ]. đường .bắt đầu bằng( '2019/9' )].cái đầu())
'''
In:
      Ngày Nhiệt độ tối đa Nhiệt độ tối thiểu Thời tiết Hướng gió Mức gió Chất lượng không khí
243 2019/9/4 32oC 19oC Nắng, gió đông nam cấp 2, tốt
244 2019/9/5 33oC 20oC Nắng, gió đông nam cấp 2, tốt
245 2019/9/6 33oC 20oC Nắng, gió đông nam cấp 1, tốt
246 2019/9/1 33°C 19° Có mây đến nắng Gió Tây Nam cấp 2 Tốt
247 2019/9/2 34°C 20° Nắng Gió Nam Cấp 2 Tốt
'''
 
#Phương pháp 4: Chuyển đổi ngày thành kiểu ngày giờ
df1[ 'ngày' ] = pd.to_datetime(df1[ 'ngày' ])
df1.set_index( 'ngày' , tại chỗ = ĐÚNG VẬY ,làm rơi = ĐÚNG VẬY )
#print(df1['2019']) #Nhận dữ liệu năm 2019 hoặc df.loc['2019']
in (df1[ '2019/09' ].cái đầu()) 
'''
  Lấy dữ liệu cho tháng 9 năm 2019. Các biến thể khác là df['2019-9'] df['2019-09'] df['2019/9'] df.loc['2019-9',:] df.loc[ '2019 -09',:] df.loc['2019/09',:] df.loc['2019/9',:]
In:
       Nhiệt độ tối đa Nhiệt độ tối thiểu Thời tiết Hướng gió Mức gió Chất lượng không khí
ngày                  
2019-09-04 32oC 19oC Nắng, gió đông nam cấp 2, tốt
2019-09-05 33oC 20oC nắng gió đông nam cấp 2 tốt
2019-09-06 33°C 20°C Nắng, gió Đông Nam cấp 1, tốt
2019-09-01 33oC 19oC Có mây~Nắng Gió Tây Nam cấp 2 Tốt
2019-09-02 34oC 20oC nắng gió nam cấp 2 tốt
'''
#Lưu ý rằng nếu bạn muốn lấy dữ liệu cho một ngày nhất định, bạn phải sử dụng tính năng cắt, chẳng hạn như df['2019/9/1':'2019/9/1']
'''
Hãy dành chút thời gian
df1.truncate(after = '2019-9-01') # Trả về dữ liệu trước sau
df1.truncate(Before = '2019-9-01') # Trả về dữ liệu sau trước
df1['20190901':'2019/9/10']
'''
 
#Phương pháp 5 #Khi đọc một tệp, hãy sử dụng phân tích cú pháp_dates=['date'] để chuyển đổi ngày thành loại ngày giờ, tương đương với pd.to_datetime. Đồng thời, bạn có thể sử dụng index_col để lấy cột đó làm chỉ mục hàng, tương đương với set_index.
df2 = pd. đọc_csv( './TianQi.csv' ,phân tích ngày = [ 'ngày' ])
df2[ 'Năm' ] = df2[ 'ngày' ].ngày.năm
df2[ 'mặt trăng' ] = df2[ 'ngày' ].ngày.tháng
số lượng = "Năm=='2019' và tháng=='9'"
in (df2.query(qstr).head())
'''
In:
       Ngày Nhiệt độ tối đa Nhiệt độ tối thiểu Thời tiết Hướng gió Mức gió Chất lượng không khí Năm và tháng
243 2019-09-04 32°C 19° Nắng gió Đông Nam cấp 2 Tốt 2019 9
244 2019-09-05 33°C 20° Nắng gió Đông Nam cấp 2 Tốt 2019 9
245 2019-09-06 33°C 20° Nắng gió Đông Nam cấp 1 Tốt 2019 9
246 2019-09-01 33°C 19° Có mây đến nắng Gió Tây Nam cấp 2 Liang 2019 9
247 2019-09-02 34°C 20° Nắng Gió Nam cấp 2 Tốt 2019 9
'''
 
'''
Các thuộc tính và phương thức thường được sử dụng khác của dt như sau:
df['Date'].dt.day # Ngày trích xuất
df['date'].dt.year #Trích xuất năm
df['Date'].dt.hour # Trích xuất giờ
df['Date'].dt.phút # Trích xuất phút
df['Date'].dt.second # Trích xuất giây
df['Date'].dt.week # Tuần trong năm
df['Date'].dt.weekday # Trả về ngày trong tuần, 0 đại diện cho Thứ Hai, 6 đại diện cho Chủ Nhật
df['Date'].dt.dayofyear # Trả về ngày trong năm
df['Date'].dt.quarter # Lấy phần tư của mỗi ngày.
df['date'].dt.is_month_start # Xác định xem ngày có phải là ngày đầu tiên của mỗi tháng không
df['date'].dt.is_month_end # Xác định xem ngày đó có phải là ngày cuối cùng của mỗi tháng không
df['Date'].dt.is_leap_year # Xác định xem đó có phải là năm nhuận không
df['Date'].dt.month_name() # Trả về tên tiếng Anh của tháng
df['date'].dt.to_ Period('Q') # M đại diện cho tháng, Q đại diện cho quý, A đại diện cho năm, D đại diện cho ngày
df['Date'].dt.weekday_name # Trả về ngày trong tuần bằng tiếng Anh. Do vấn đề về phiên bản gấu trúc, để thay đổi phiên bản gấu trúc, hãy nhập vào cmd: pip install --upgrade pandas==0.25.3.
Series.dt.normalize() # Hàm chuyển đổi thời gian trong đối tượng Series đã cho thành nửa đêm.
'''

Đến đây là kết thúc bài viết về việc triển khai tính năng lọc dữ liệu theo phạm vi ngày của gấu trúc. Để biết thêm thông tin về tính năng lọc theo phạm vi ngày của gấu trúc, vui lòng tìm kiếm các bài viết trước của tôi hoặc tiếp tục duyệt qua các bài viết liên quan bên dưới. Tôi hy vọng bạn sẽ ủng hộ tôi trong tương lai! .

Liên kết gốc: https://blog.csdn.net/pptsv7/article/details/101438535.

Cuối cùng, bài viết này về việc triển khai gấu trúc lọc dữ liệu theo phạm vi ngày kết thúc tại đây. Nếu bạn muốn biết thêm về việc triển khai gấu trúc lọc dữ liệu theo phạm vi ngày, vui lòng tìm kiếm bài viết CFSDN hoặc tiếp tục duyệt các bài viết liên quan. blog của tôi trong tương lai! .

27 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress