cuốn sách gpt4 ai đã làm

hình ảnh - Phát hiện đối tượng + phân đoạn

In lại Tác giả: Vũ trụ không gian Thời gian cập nhật: 2023-11-03 20:38:55 27 4
mua khóa gpt4 Nike

Tôi đang cố gắng tìm một phương pháp hiệu quả với độ phức tạp có thể chấp nhận được

  • Phát hiện các đối tượng trong ảnh để cách ly chúng với môi trường xung quanh
  • Chia đối tượng thành các phần con của nó và gắn nhãn cho chúng để tôi có thể tìm nạp chúng theo ý muốn

Tôi đã làm việc trong thế giới xử lý hình ảnh được 3 tuần và tôi đã đọc về rất nhiều thuật toán (sàng lọc, rắn, nhiều rắn hơn, liên quan đến phạm vi, v.v.) và các thuật toán phỏng đoán mà tôi không biết bắt đầu từ đâu "tốt nhất" cho những gì tôi muốn đạt được. Xem xét rằng tập dữ liệu hình ảnh quan tâm là rất lớn, tôi thậm chí không biết liệu mình nên sử dụng một số thuật toán được triển khai trong OpenCV hay tôi nên tự mình triển khai một thuật toán.

总结:

  • Tôi nên tập trung vào phương pháp nào? Tại sao?
  • Tôi có nên sử dụng OpenCV cho loại việc đó hay có các tùy chọn "tốt hơn" khác không?

提前谢谢你。

EDIT - Thông tin thêm về tập dữ liệu

Mỗi tập dữ liệu chứa 80K hình ảnh chia sẻ cùng một sản phẩm

  • Các khái niệm như áo thun, đồng hồ, giày
  • kích cỡ
  • Hướng (90%)
  • Nền (95%)

Rõ ràng, ngoại trừ bản thân các sản phẩm, tất cả hình ảnh trong mỗi tập dữ liệu đều trông gần như giống hệt nhau. Để làm cho mọi thứ rõ ràng hơn một chút, chúng ta hãy xem xét "tập dữ liệu quan sát":

Tất cả các bức ảnh trong bộ sưu tập trông gần như giống hệt nhau:

nhập mô tả hình ảnh ở đây

(Một lần nữa, ngoại trừ chính chiếc đồng hồ). Tôi muốn tách dây đeo đồng hồ và mặt đồng hồ. Vấn đề là có rất nhiều kiểu dáng và hình dạng đồng hồ khác nhau. Từ những gì tôi đã đọc cho đến nay, tôi nghĩ rằng tôi cần một thuật toán mẫu cho phép uốn cong và kéo dài để có thể phù hợp với các kiểu dây đeo và mặt số khác nhau.

Thay vì tạo ba mẫu khác nhau (nửa trên dây đeo, nửa dưới dây đeo, mặt số), chỉ tạo một mẫu và chia thành 3 phần. Bằng cách này tôi đủ tự tin để phát hiện rằng mỗi phần đều đang phát hiện lẫn nhau như mong đợi. Mặt số sẽ không được phát hiện bên dưới phần dưới của dây đeo.

Trong số tất cả các thuật toán/phương pháp tôi đã gặp, mô hình hình dạng|hình thức hoạt động có vẻ hứa hẹn nhất. Thật không may, tôi vẫn chưa tìm được cách triển khai giảm dần và tôi không đủ tự tin rằng đây là cách tiếp cận tốt nhất, vì vậy tôi đã tự mình viết một bản.

Nếu bất cứ ai có thể chỉ cho tôi những gì tôi thực sự nên tìm kiếm (thuật toán/phương pháp phỏng đoán/thư viện, v.v.) thì tôi sẽ rất biết ơn. Nếu một lần nữa bạn cho rằng mô tả của tôi hơi mơ hồ, vui lòng yêu cầu mô tả chi tiết hơn.

câu trả lời hay nhất

Dựa trên những gì bạn nói, thoạt nhìn sẽ có thông tin sau:

  • Cách tiếp cận đơn giản nhất là nhị phân hóa hình ảnh và thực hiện các thành phần được kết nối bằng thư viện OpenCV hoặc CvBlob. Đối với những hình ảnh đơn giản có nền không phức tạp, điều này thường dẫn đến các đối tượng

  • Tuy nhiên, nhìn vào hình ảnh mẫu của bạn,dựa trên kết cấuKỹ thuật phân đoạn có thể hoạt động tốt hơn - mặt số, dải và nền có những thay đổi hợp lý về kết cấu/độ nhám, đây có thể là cách lý tưởng để phân tách chúng.

    Độ nhám của chi tiết có thể dễ dàng được tìm thấy thông qua phép biến đổi riêng (trong VÌ THẾ Có một số giải thích về điều này, hãy xem liên kết đến tài liệu nghiên cứu được cung cấp ở đó), sau đó bạn có thể áp dụng phép biến đổi bộ lọc dịch chuyển trung bình cho đầu ra của biến đổi riêng. Điều này sẽ làm cho các khu vực được phân tách rõ ràng bằng kết cấu. Dịch chuyển trung bình kim tự tháp và tìm giá trị riêng thông qua SVD đều được triển khai trong OpenCV, vì vậy trừ khi bạn có thể tối ưu hóa mã của riêng mình, việc sử dụng các hàm tích hợp nếu chúng tồn tại sẽ tốt hơn (và dễ dàng hơn) về mặt tốc độ và hiệu quả.

Về hình ảnh - phát hiện đối tượng + phân đoạn, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/7221332/

27 4 0
không gian vũ trụ
Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Nhận phiếu giảm giá taxi Didi miễn phí
Phiếu giảm giá taxi Didi
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress