cuốn sách gpt4 ai đã làm

Trích xuất một phần tài liệu được quét (ID cá nhân) - chọn thư viện và phương pháp nào?

In lại Tác giả: Taklimakan Thời gian cập nhật: 2023-11-03 07:34:02 27 4
mua khóa gpt4 Nike

Tôi phải xử lý một số lượng lớn ID được quét mà tôi cần trích xuất ảnh để xử lý thêm. Đây là một ví dụ hư cấu:

nhập mô tả hình ảnh ở đây

Vấn đề là các bản quét không được căn chỉnh hoàn hảo (xoay tối đa 10 độ). Vì vậy tôi cần tìm vị trí của chúng, xoay chúng và cắt ảnh ra. Điều này hóa ra khó hơn nhiều so với tôi nghĩ ban đầu.

  • Tôi đã kiểm tra OpenCV và điều duy nhất tôi tìm thấy là phát hiện hình chữ nhật, nhưng nó không mang lại cho tôi kết quả tốt: các hình chữ nhật không phải lúc nào cũng khớp đủ trên các mẫu. Ngoài ra, thuật toán so khớp hình ảnh của nó chỉ hoạt động trên các hình ảnh không được xoay vì đây chỉ là một phép so sánh thô bạo.

  • Vì vậy, tôi đã cân nhắc sử dụng ARToolkit (thư viện thực tế tăng cường) vì tôi biết nó có khả năng định vị rất chính xác điểm đánh dấu nhất định trên hình ảnh. Nhưng có vẻ như việc đánh dấu phải rất đơn giản, vì vậy tôi không thể sử dụng phần hằng số của tài liệu cho mục đích này (vui lòng sửa lại cho tôi nếu tôi sai). Hơn nữa, tôi thấy rất khó biên dịch nó trên Ubuntu 11.10.

  • OCR - chưa thử tính năng này, tôi thực sự đánh giá cao bất kỳ đề xuất nào về những gì cần tìm trước khi bắt đầu nghiên cứu.

Tôi đang tìm giải pháp C (ưu tiên)/C++. Python cũng là một lựa chọn.

câu trả lời hay nhất

Nếu bạn không thể tìm thấy giải pháp lý tưởng khác, một phương pháp tôi đã sử dụng trước đây để xử lý trước OCR là chuyển đổi hình ảnh nguồn thành PPM và sử dụng không có giấy tờTrong Ubuntu. Bạn có thể cố gắng sửa hình ảnh dựa trên bất kỳ mặt nào bạn chỉ định vì có các cạnh được xác định rõ ràng và bạn có thể tùy ý bỏ qua các bộ lọc thường được áp dụng cho văn bản đen trắng. Bạn có thể không muốn những thứ này cho hình ảnh.

Ví dụ về hình ảnh nghiêng không quá 15 độ, sử dụng cạnh dưới và bên phải để phát hiện xoay:

không có giấy -n -dn đáy,phải -dr 15 input.ppm out.ppm

không có giấy tờ Nó được viết bằng C, nếu mã nguồn giúp bạn.

Trích xuất một phần tài liệu được quét (ID cá nhân) - chọn thư viện và phương pháp nào? , chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/8073135/

27 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress