[opencv] Nhận dạng hình ảnh truyền thống: hog+svm thực hành nhận dạng người đi bộ-6ren

[opencv] Nhận dạng hình ảnh truyền thống: thực hành nhận dạng người đi bộ hog+svm

In lại Tác giả: Tôi là chú chim nhỏ Thời gian cập nhật: 2023-08-15 14:31:30

Công cụ thực hành: python3.7+pycharm+opencv4.6 Kiến thức về thuật toán: Trích xuất tính năng HOG, xây dựng mô hình SVM Mục đích thực tế: Mục đích của cuộc chiến thực tế này là làm quen với thuật toán quy trình làm việc HOG+SVM và bước đầu nắm vững thuật toán hình ảnh truyền thống phân loại. Kỷ lục thực tế: Tôi nghĩ rằng sau khi học các nguyên tắc, ứng dụng thuật toán và thực hành thực hành, tôi sẽ có thể thực hiện thành công dự án phát hiện người đi bộ một cách hoàn toàn độc lập, nhưng quy trình thực tế không đạt yêu cầu nên kết quả chỉ ở mức tầm thường. Những thiếu sót bộc lộ trong quá trình chiến đấu thực tế bao gồm:

Kiến thức cơ bản về opencv, numpy, python chưa toàn diện và vững chắc;
Chưa hiểu sâu về dạng dữ liệu đầu ra của thuật toán HOG;
Tôi có hiểu biết hạn chế về các tham số và phương thức chức năng liên quan của mô hình SVM, đặc biệt là vai trò và đầu ra của dữ liệu trong SVM.

Đánh giá thực tế: Tuy gập ghềnh nhưng vẫn ở mức khá.

1. Chuẩn bị

Dữ liệu được sử dụng trong trận chiến thực tế này là cơ sở dữ liệu về người đi bộ của MIT (có dữ liệu làm sẵn nhưng tôi quá lười để thu thập nó). Cơ sở dữ liệu này là cơ sở dữ liệu công cộng về người đi bộ trước đó, với tổng số 924 hình ảnh về người đi bộ (định dạng ppm, chiều rộng và chiều cao 64x128), từ vai đến chân. Khoảng cách là khoảng 80 pixel. Cơ sở dữ liệu chỉ chứa hai phối cảnh: trước và sau, không có mẫu âm và không phân biệt giữa tập huấn luyện và tập kiểm tra. Dalal và cộng sự đã sử dụng "HOG+SVM" và độ chính xác phát hiện trên cơ sở dữ liệu này là gần 100%. Liên kết tải xuống cơ sở dữ liệu có thể được tìm thấy ở đây.

2. Mã thực hành

                        
                          """ Tải và sắp xếp tập dữ liệu-->Xử lý trước hình ảnh-->Trích xuất tính năng hình ảnh-->Trình phân loại thiết kế-->Độ chính xác của trình phân loại đầu ra-->Kiểm tra hình ảnh""" import cv2 import Random import glob import numpy as np # Tải tập dữ liệu hình ảnh cục bộ, thêm tất cả các tập dữ liệu vào danh sách, sau đó xáo trộn thứ tự dữ liệu def load_image(filename): path = glob.glob(filename) people, labels = [], [] for i trong đường dẫn: Persons.append(cv2.imread(i)) labels.append(1) Random.seed(1) Random.shuffle(persons) Persons = np.array(persons) trả về người, nhãn # Tiền xử lý ảnh, làm xám hình ảnh đầu vào độ, độ mờ Gaussian def image_preprocessing(image): cv2.cvtColor(image, cv2.COLOR_RGB2GRAY) # image = cv2.resize(image, dsize=(32, 64)) image_preprocess = cv2.GaussianBlur(image, (3, 3), sigmaX=1, sigmaY=1) return image_preprocess # Xây dựng trình phát hiện HOG def get_hog(): winSize = (64, 128) cellSize = (8, 8) blockSize = (16, 16) blockStride = (16, 16) nbins = 9 signatureGradient = True derivAperture = 1 # Tham số mặc định winSigma = -1. # Tham số mặc định histogramNormType = 0 # Tham số mặc định L2HysThreshold = 0.2 # Tham số mặc định gammaCorrection = 1 # Tham số mặc định nlevels = 64 # Tham số mặc định hog = cv2. HOGDescriptor(winSize, blockSize, blockStride, cellSize, nbins, derivAperture, winSigma, histogramNormType, L2HysThreshold, gammaCorrection, nlevels, signatureGradient) return hog # Tạo mô hình SVM và cấu hình tham số def SVM_model(): model = cv2.ml.SVM_create() model.setType(cv2.ml.SVM_ONE_CLASS ) model.setKernel(cv2.ml.SVM_POLY) model.setC(1) model.setNu(0.01) model.setDegree(0.1) model.setCoef0(0.5) model.setGamma(0.6) model.setTermCriteria((cv2.TERM_CRITERIA_MAX_ITER, int (1e2), 1e-5)) return model # Training model def SVM_train(mô hình, mẫu, phản hồi): model.train(mẫu, cv2.ml.ROW_SAMPLE, phản hồi) mô hình trả về # Tính độ chính xác của độ chính xác của trình phân loại def (model, data_train, labels_train): retval, result = model.predict( data_train ) temp = (np.array(labels_train) == result).mean() print(f'Độ chính xác của mô hình này là: {temp * 100}') # Trình phân loại kiểm tra def image_predict(model, data_test, samples, labels_test): retval, result = model.predict(samples) counter = 0 for i in (labels_test == result.ravel()): # Kết quả kiểm tra không khớp với thực tế kết quả Chỉ hiển thị kênh màu đỏ nếu không phải i: data_test[counter][..., :2] = 0 counter += 1 h1 = data_test[0] for i in data_test[1:12, ...]: h1 = np.hstack((h1, i)) h2 = data_test[12] for i in data_test[13:, ...]: h2 = np.hstack((h2, i)) return np .vstack((h1, h2)) if __name__ == "__main__": print('Load image...') datas, labels = Load_image('image\\Pedestrian phát hiện\\per*.ppm') temp, data_test = np.split(datas, [900]) print('Tiền xử lý dữ liệu...') datas = list(map(image_preprocessing, datas)) print('Trích xuất đào tạo HOG vectơ đặc trưng của dữ liệu...') hog = get_hog() hog_vector = list(map(hog.compute, datas)) print('Chia tập dữ liệu thành hai phần, 900 ảnh để huấn luyện và 24 ảnh để kiểm tra...') data_train, temp = np.split(datas, [900]) labels_train, labels_test = np.split(np .array (nhãn), [900]) hog_vector_train, hog_vector_test = np.split(hog_vector, [900]) print('Đào tạo mô hình SVM...') model = SVM_model() model_svm = SVM_train(model, hog_vector_train, labels_train) print('Xuất ra độ chính xác của mô hình phân loại...') độ chính xác(model_svm, hog_vector_train, labels_train) print ( 'Mô hình phân loại thử nghiệm...') result = image_predict(model_svm, data_test, hog_vector_test,labels_test) cv2.imshow('result, nhấn phím q để thoát', result) while 1: if cv2.waitKey() == ord('q'): break print('Kiểm tra các hình ảnh khác...') class_name = {0: "Không bao gồm người đi bộ", 1: "Bao gồm người đi bộ"} img = cv2.imread('image\\persontrain.png') img = cv2.resize(img, dsize=(64, 128)) img2 = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY) img_preprocess = cv2.GaussianBlur(img2, (3, 3), sigmaX=1, sigmaY=1) # vector = np.array([hog.compute(img_preprocess)]) vector = np.expand_dims(hog.compute(img_preprocess), 0) ret = model_svm.predict(vector)[1].ravel() print(f"Picture img{ class_name[int(ret)]}") cv2.imshow('img', img) cv2.waitKey() cv2.destroyAllWindows() ''' Tải ảnh... Tiền xử lý dữ liệu... Trích xuất vectơ đặc trưng HOG của dữ liệu huấn luyện... Chia tập dữ liệu thành hai phần, 900 cho huấn luyện và 24 cho thử nghiệm... . ... Xuất ra độ chính xác của mô hình phân loại... Độ chính xác của mô hình là: 99,0 Kiểm tra mô hình phân loại... Kiểm tra các hình ảnh khác... Hình ảnh img chứa người đi bộ''

Kết quả cho bộ ảnh thử nghiệm: Các hình ảnh khác cho thử nghiệm:

3. Tóm tắt dự án

Trích xuất đặc trưng của HOG là vectơ đặc trưng của hình ảnh, được sử dụng làm biến đầu vào "mẫu" của mô hình svm train(). Tất nhiên, khi sử dụng hàm dự đoán() trên ảnh thử nghiệm, đầu vào cũng là vectơ đặc trưng của ảnh --- "mẫu".
Các SVMType khác nhau có chức năng khác nhau, chủ yếu được chia thành hai loại: phân loại và hồi quy. Các danh mục có thể được chia thành các danh mục duy nhất MỘT_LỚP và phân loại không đơn SVM_C_SVC Và NO_SVC . Dự án này sử dụng một loại phân loại duy nhất.
hog.conpute(img) 、 model.train(mẫu, bố cục, phản hồi) 、 mô hình.dự đoán(mẫu) mối quan hệ:
- hog.conpute(img) Những gì được trích xuất là vectơ đặc trưng một chiều của một hình ảnh. Nếu bạn muốn trích xuất vectơ đặc trưng của một tập hợp hình ảnh, bạn có thể sử dụng. bản đồ() Hoặc một vòng lặp for. hog.conpute(img) Các kết quả được xử lý thường được sử dụng để huấn luyện và kiểm tra các mô hình.
- model.train(mẫu, bố cục, phản hồi) , ba tham số của hàm này là ma trận vectơ đặc trưng của tập mẫu huấn luyện, dạng ma trận của từng vectơ đặc trưng mẫu và ma trận nhãn. cách trình bày--- cv2.ml.ROW_MẪU , chỉ ra rằng mỗi mẫu huấn luyện là một vectơ hàng; cv2.ml.MẪU_COL , chỉ ra rằng mỗi mẫu huấn luyện là một vectơ cột. Giá trị của bố cục xác định dạng của từng vectơ đặc trưng mẫu trong các mẫu đầu vào trong ma trận.
- mô hình.dự đoán(mẫu) Dạng ma trận của các mẫu phụ thuộc vào model.train(mẫu, bố cục, phản hồi) Giá trị của bố cục. Có hai giá trị trả về cho hàm này trả lại Và kết quả , giá trị nhãn của mẫu thử được lưu trữ trong kết quả.ravel() ở giữa.

Cuối cùng, bài viết này về nhận dạng hình ảnh truyền thống [opencv]: nhận dạng người đi bộ hog+svm trong thực tế kết thúc tại đây. Nếu bạn muốn biết thêm về nhận dạng hình ảnh truyền thống [opencv]: nhận dạng người đi bộ hog+svm trong thực tế, vui lòng tìm kiếm các bài viết của CFSDN. để duyệt các bài viết liên quan, tôi hy vọng bạn sẽ ủng hộ blog của tôi trong tương lai! .

Đề xuất bài viết: Hãy là người đầu tiên trải nghiệm nó! AnchorPositioning neo định vị siêu mạnh

Đề xuất bài viết: Tìm hiểu các hoạt động hàng loạt của các chỉ mục Elaticsearch

Đề xuất bài viết: Liên kết nền combobox

Đề xuất bài viết: Hàng đợi chủ đề Redis

svm - Làm cách nào để xử lý tình trạng mất cân bằng dữ liệu trong SVM?
Nếu tôi huấn luyện một SVM trên tập huấn luyện lớn và biến lớp là Đúng hoặc Sai, liệu một vài giá trị True so với số lượng giá trị Sai trong tập huấn luyện có ảnh hưởng đến mô hình/kết quả được huấn luyện không? Họ có nên bằng nhau? Nếu tập huấn luyện của tôi là T
svm - libSVM SVM hạng nhất
Giả sử vectơ đặc trưng của tôi là (x1, x2, ...xn) Có ai có thể cho tôi mã để huấn luyện SVM một lớp bằng libSVM không? Tôi nên sử dụng xác thực chéo để tìm hiểu các thông số như thế nào. Câu trả lời hay nhất Điều này có thể giúp bạn label=ones(Num
svm - Tính toán lề và độ lệch SVM
Tôi xin lỗi trước vì tính mới của câu hỏi này, nhưng tôi bị mắc kẹt. Tôi đang cố gắng giải quyết vấn đề này, tôi có thể làm được phần i)-1v) nhưng tôi bị kẹt ở v. Tôi biết để tính lề y, bạn có thể y=2/||W|| và tôi biết rằng W là pháp tuyến của siêu phẳng, chỉ cần
R - Hadoop - rmr2 - Mô hình SVM - Chuyển đổi lớp "danh sách" kết quả thành lớp gốc "svm.formula" "svm"
Tôi có cấu hình R sau: Hệ điều hành: LinuxR phiên bản 3.0.1 (2013-05-16)rmr2 phiên bản 2.2.1rhdfs phiên bản 1.0.6hadoop phiên bản 1.2.0 Cách sử dụng với gói rmr2
svm - huấn luyện trình phân loại SVM (nhúng từ và nhúng câu)
Tôi muốn thử các phần nhúng khác nhau, chẳng hạn như Word2Vec, ELMo và BERT, nhưng tôi hơi bối rối không biết nên sử dụng phần nhúng từ hay phần nhúng câu và tại sao. Tôi sử dụng các phần nhúng làm đầu vào tính năng cho bộ phân loại SVM. Cảm ơn. Câu trả lời tốt nhất là cả hai phương pháp đều có thể chứng minh
svm - Cách phân loại tài liệu văn bản bằng SVM và KNN
Hầu hết tất cả các ví dụ đều dựa trên các con số. Trong tài liệu văn bản tôi có chữ thay vì số. Vậy bạn có thể cho tôi biết một ví dụ đơn giản về cách sử dụng các thuật toán này để phân loại tài liệu văn bản không? Tôi không cần một ví dụ về mã, chỉ cần mã giả logic sẽ giúp ích rất nhiều Câu trả lời hay nhất Một cách tiếp cận phổ biến là
svm - yêu cầu triển khai SVM hoặc thư viện Java
đóng cửa. Câu hỏi này không tuân thủ các nguyên tắc của Stack Overflow. Hiện tại nó không chấp nhận câu trả lời. Chúng tôi không cho phép các câu hỏi tìm kiếm đề xuất về sách, công cụ, thư viện phần mềm, v.v. Bạn có thể chỉnh sửa câu hỏi của mình để trả lời bằng sự kiện và trích dẫn. Đóng cửa 3 năm trước.
svm - Làm cách nào để huấn luyện bộ phân loại svm để nhận dạng giọng nói bằng hàm mfcc?
Tôi hiện đang trong giai đoạn thảo luận về dự án nhận dạng giọng nói và tôi đang sử dụng trích xuất tính năng MFCC, nhưng các tính năng MFCC được trả về từ hàm là một ma trận, chẳng hạn như ma trận tính năng (20,38) cho mỗi tệp giọng nói ( wav). Nhưng làm cách nào tôi có thể chuyển tính năng này sang bộ phân loại SVM. vì
svm - Huấn luyện trình phân loại SVM bằng các tính năng SIFT
Xin vui lòng, tôi thích sử dụng SIFT DESCRIPTOR và SVM để phân loại một bộ hình ảnh thành 4 loại. Bây giờ, bằng cách sử dụng trình trích xuất SIFT, tôi có các kích thước điểm chính khác nhau, ví dụ img1 có 100 điểm chính và img2 có 55 điểm chính
học máy - Ước tính xác suất SVM một lớp và SVM một lớp khác với phân cụm như thế nào
Tôi có một bộ hình ảnh. Tôi muốn tìm hiểu máy vectơ hỗ trợ một lớp (OC-SVM) để mô hình hóa phân phối của một lớp cụ thể (dương) vì tôi không có đủ ví dụ để biểu diễn các lớp khác (âm). Sự hiểu biết của tôi về OC-SVM là nó cố gắng tách dữ liệu khỏi nguồn, nói cách khác là nó cố gắng học một siêu cầu
python - Triển khai SVM, scikit-learn để giảm thời gian chạy, svm nhanh nhất
Tôi đang sử dụng scikit-learn để xây dựng một số mô hình dự đoán bằng SVM. Tôi có một tập dữ liệu với khoảng 5000 ví dụ và khoảng 700 tính năng. Tôi đang sử dụng tìm kiếm lưới 18x17 để xác thực chéo 5 lần trên tập huấn luyện của mình,
học máy - Nhược điểm của SVM kernel so với SVM tuyến tính trong không gian tính năng mở rộng là gì?
Đây là một câu hỏi được hỏi trong kỳ thi của tôi. Tôi đã đưa ra câu trả lời sau và điểm của tôi là 0 điểm. Giáo sư thậm chí còn không đồng ý cung cấp bất kỳ tín chỉ một phần nào hoặc cho tôi biết câu trả lời của tôi có sai sót gì. Có ai có thể giúp tôi tìm ra điều gì sai với câu trả lời của tôi không? Đây là câu trả lời tôi đã đưa ra trong bài kiểm tra. Nhược điểm là: 1)
r - Tinh chỉnh tham số svm trong R (nhân SVM tuyến tính)
Sự khác biệt giữa tune.svm() và best.svm() là gì. Khi điều chỉnh các tham số của kernel svm, không phải lúc nào chúng ta cũng muốn chọn những giá trị tốt nhất cho mô hình của mình. Xin hãy tha thứ cho tôi vì tôi chưa quen với R và học máy. Tôi nhận thấy rằng khi điều chỉnh svm
OpenCV + HOG +SVM: cần trợ giúp với vector đặc trưng đơn SVM
Tôi cố gắng sử dụng OpenCV2.3 để triển khai hệ thống phát hiện người dựa trên SVM và HOG. Nhưng tôi bị mắc kẹt. Tôi đã hiểu được điều này: Tôi có thể tính toán các giá trị HOG từ cơ sở dữ liệu hình ảnh, sau đó tôi sử dụng LIBSVM để tính toán các vectơ SVM, vì vậy tôi lấy ví dụ
hadoop - Gần đây việc triển khai SVM đã được thêm vào Mahout và tôi đang dự định sử dụng SVM. Có ai đã thử điều này chưa?
Có phát triển mới nào xung quanh SVM (Máy vectơ hỗ trợ) trong Mahout (Học với Hadoop) bằng Hadoop không? Gần đây việc triển khai SVM đã được thêm vào Mahout. Tôi dự định sử dụng SVM. Ai đó đã cố gắng
Tại sao kết quả của sklearn.svm.SVC.predict() và sklearn.svm.SVC.predict_proba() không nhất quán?
Tôi sử dụng sklearn.svm.SVC để xây dựng bộ phân loại vectơ hỗ trợ như bên dưới. nhập numpy dưới dạng np từ sklearn.svm nhập SVC svc=SVC(proba
scikit-learn - Làm cách nào để đào tạo mô hình sklearn svm (sklearn.svm.SVC) với các kỷ nguyên?
Tôi muốn xem liệu mô hình có hội tụ với xác thực chéo của tôi hay không. Làm cách nào tôi có thể tăng hoặc giảm kỷ nguyên trong sklearn.svm.SVC? Hiện tại: SVM_Model = SVC(gamma='auto') SVM_Model.fit(X_t
học máy - Tại sao SVM 1 chuẩn lại thưa hơn SVM 2 chuẩn?
Làm cách nào chúng ta có thể cải thiện độ thưa bằng cách sử dụng trọng số 1 chỉ tiêu trong hàm chi phí so với sử dụng trọng số 2 chỉ tiêu trong cùng hàm chi phí của SVM. Đối với 1 chỉ tiêu: hàm chi phí - giảm thiểu ||w||_1 Đối với 2 chỉ tiêu: hàm chi phí - giảm thiểu
c++ - Sử dụng svm-train.c và svm-predict.c từ chương trình cpp
Thực ra tôi không phải là một lập trình viên C++ có kinh nghiệm, tôi là một lập trình viên C# và như bạn biết điều đó tạo nên sự khác biệt lớn, đối với trải nghiệm học máy của tôi, tôi chỉ sử dụng matlab nên nếu tôi có một số lỗi, vui lòng bỏ qua các lỗi về khái niệm. Tôi đang cố gắng
Lỗi khi sử dụng chức năng dự đoán svm trong openCV khi tải tệp đã lưu bằng tải svm
Tôi đang cố gắng sử dụng chức năng tải SVM trong OpenCV để tải tệp .xml và sau đó sử dụng chức năng dự đoán để phân loại biển báo giao thông. Lỗi được đưa ra khi đạt được việc thực thi chức năng dự đoán: Ngoại lệ chưa được xử lý ở 0x000

tôi là một con chim nhỏ

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren AI

Trung tâm mua sắm

[opencv] Nhận dạng hình ảnh truyền thống: thực hành nhận dạng người đi bộ hog+svm

1. Chuẩn bị

2. Mã thực hành

3. Tóm tắt dự án