cuốn sách gpt4 ai đã làm

字符串相似度 -> Levenshtein 距离

In lại Tác giả: Taklimakan Thời gian cập nhật: 2023-11-03 02:16:08 28 4
mua khóa gpt4 Nike

Tôi đang sử dụng thuật toán Levenshtein để tìm sự giống nhau giữa hai chuỗi. Đây là một phần rất quan trọng của chương trình tôi đang thực hiện nên nó cần phải hoạt động. Vấn đề là thuật toán không tìm thấy các ví dụ sau giống nhau:

CONAIR
máy lạnh

Khoảng cách được đưa ra bởi thuật toán là 6. Vậy đối với từ có 6 chữ cái này (bạn nhìn từ có số chữ cái nhiều nhất) chênh lệch là 100% => độ giống nhau là 0%.

Tôi cần tìm cách tìm ra sự giống nhau giữa hai chuỗi đồng thời tính đến các tình huống giống như tình huống tôi đã trình bày trước đây.

Có thuật toán nào tốt hơn tôi có thể sử dụng không? Hoặc bạn khuyên tôi điều gì?

EDIT: Tôi cũng đã xem xét thuật toán "Damerau–Levenshtein", bổ sung thêm chuyển vị. Vấn đề là cách chuyển đổi này chỉ có tác dụng với các ký tự liền kề (không phải nhiều ký tự).

câu trả lời hay nhất

Tôi sẽ tách các số hạng thành đơn vị, bigram và bộ ba rồi tính độ tương tự cosine.

Về độ tương tự của chuỗi -> Khoảng cách Levenshtein, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/11675034/

28 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress