CFSDN nhấn mạnh vào giá trị tạo ra nguồn mở và chúng tôi cam kết xây dựng nền tảng chia sẻ tài nguyên để mọi nhân viên CNTT có thể tìm thấy thế giới tuyệt vời của bạn tại đây.
Bài viết trên blog CFSDN này về việc triển khai lọc dữ liệu theo phạm vi ngày được tác giả sưu tầm và biên soạn. Nếu bạn quan tâm đến bài viết này thì nhớ like nhé.
Pandas là một thư viện mạnh mẽ trong python. Tôi sẽ không nhắc lại ở đây mà sẽ giới thiệu ngắn gọn cách sử dụng phạm vi ngày để lọc dữ liệu về gấu trúc.
chuyển đổi ngày
Cột dùng để lọc thuộc loại ngày, vì vậy phạm vi ngày cần lọc phải được chuyển đổi từ chuỗi sang loại ngày.
Ví dụ: dữ liệu của tôi chứa tên cột Trade_date, từ 20050101 đến 20190926. Tôi muốn lọc dữ liệu từ 20050606 đến 20071016. Sau đó, trước tiên hãy chuyển đổi kiểu dữ liệu như sau:
?
1
2
|
ngày s_s
=
datetime.datetime.strptime(
'20050606'
,
'%Y%m%d'
).ngày()
ngày điện tử
=
datetime.datetime.strptime(
'20071016'
,
'%Y%m%d'
).ngày()
|
Lọc dữ liệu
Rất đơn giản, chỉ một dòng mã:
?
1
|
df
=
df[(df[
'giữa_ngày'
] >
=
s_date) & (df[
'giữa_ngày'
] <
=
ngày điện tử)]
|
Những điều cần lưu ý.
- Khi nhiều điều kiện lọc cùng tồn tại, bạn không thể sử dụng và để kết nối chúng mà bạn cần sử dụng một ký hiệu &.
- s_date <= df['trade_date'] <= e_date tương đương với và
Năm cách trích xuất dữ liệu trong một khoảng thời gian nhất định bằng gấu trúc
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
|
nhập khẩu
gấu trúc như pd
df
=
pd. đọc_csv(
'./TianQi.csv'
)
df. set_index(
'ngày'
, tại chỗ
=
ĐÚNG VẬY
)
in
(trích dẫn[
'2019/9/1'
:
'2019/9/30'
].cái đầu())
in
(df.loc[[
ĐÚNG VẬY
nếu như
i.bắt đầu bằng(
'2019/9'
)
khác
SAI
vì
Tôi
TRONG
df.index.tolist()],:].head())
df1
=
pd. đọc_csv(
'./TianQi.csv'
)
in
(df1[df1[
'ngày'
].
đường
.bắt đầu bằng(
'2019/9'
)].cái đầu())
df1[
'ngày'
]
=
pd.to_datetime(df1[
'ngày'
])
df1.set_index(
'ngày'
, tại chỗ
=
ĐÚNG VẬY
,làm rơi
=
ĐÚNG VẬY
)
in
(df1[
'2019/09'
].cái đầu())
df2
=
pd. đọc_csv(
'./TianQi.csv'
,phân tích ngày
=
[
'ngày'
])
df2[
'Năm'
]
=
df2[
'ngày'
].ngày.năm
df2[
'mặt trăng'
]
=
df2[
'ngày'
].ngày.tháng
số lượng
=
"Năm=='2019' và tháng=='9'"
in
(df2.query(qstr).head())
|
Đến đây là kết thúc bài viết về việc triển khai tính năng lọc dữ liệu theo phạm vi ngày của gấu trúc. Để biết thêm thông tin về tính năng lọc theo phạm vi ngày của gấu trúc, vui lòng tìm kiếm các bài viết trước của tôi hoặc tiếp tục duyệt qua các bài viết liên quan bên dưới. Tôi hy vọng bạn sẽ ủng hộ tôi trong tương lai! .
Liên kết gốc: https://blog.csdn.net/pptsv7/article/details/101438535.
Cuối cùng, bài viết này về việc triển khai gấu trúc lọc dữ liệu theo phạm vi ngày kết thúc tại đây. Nếu bạn muốn biết thêm về việc triển khai gấu trúc lọc dữ liệu theo phạm vi ngày, vui lòng tìm kiếm bài viết CFSDN hoặc tiếp tục duyệt các bài viết liên quan. blog của tôi trong tương lai! .
Tôi là một lập trình viên xuất sắc, rất giỏi!