cuốn sách gpt4 ai đã làm

java — Làm cách nào để biết một chuỗi được tạo ngẫu nhiên hay một từ tiếng Anh hợp lý?

In lại Tác giả: Taklimakan Thời gian cập nhật: 2023-11-03 05:21:31 26 4
mua khóa gpt4 Nike

Tôi có một kho văn bản chứa một số chuỗi. Một số chuỗi này là các từ tiếng Anh và một số là ngẫu nhiên, chẳng hạn như VmsVKmGMY6eQE4eMI. Không có giới hạn về số lượng ký tự trong mỗi chuỗi.

Có cách nào để xác định xem một chuỗi có phải là một từ tiếng Anh không? Tôi đang tìm kiếm một số thuật toán có thể thực hiện công việc. Đây là bằng Java và tôi không muốn triển khai thêm từ điển.

câu trả lời hay nhất

Tôi phải giải quyết một vấn đề liên quan chặt chẽ cho một dự án khai thác mã nguồn và mặc dù gói này được viết bằng Python chứ không phải Java, nhưng có vẻ như nó đáng được đề cập ở đây trong trường hợp nó vẫn hữu ích. Gói này làlỗ mũi (dành cho "Bộ đánh giá chuỗi vô nghĩa"), được thiết kế để xác định xem chuỗi được trích xuất trong quá trình khai thác mã nguồn có khả năng là một lớp/hàm/biến/v.v. hay không. định danh hoặc vô nghĩa ngẫu nhiên. Nostril không sử dụng từ điển, nhưng nó bao gồm một bảng tần số n-gram khá lớn để hỗ trợ việc đánh giá xác suất của các chuỗi văn bản.

Ví dụ: Đoạn mã sau,

từ lỗ mũi vô nghĩa
real_test = ['bunchofwords', 'getint', 'xywinlist', 'ioFlXFndrInfo',
'DMEcalPreshowerDigis', 'httpredaksikatakamiwordpresscom']
rác_test = ['faiwtlwexu', 'asfgtqwafazfyiur', 'zxcvbnmlkjhgfdsaqwerty']
cho s trong real_test + Junk_test:
print('{}: {}'.format(s, 'nonsense' if (các) điều vô nghĩa khác 'real'))

sẽ tạo ra đầu ra sau:

bó từ: có thật
getint: thực
xywinlist: có thật
ioFlXFndrInfo: có thật
DMEcalPreshowerDigis: có thật
httpredaksikatakamiwordpresscom: có thật
faiwtlwexu: vô nghĩa
asfgtqwafazfyiur: vô nghĩa
zxcvbnmlkjhgfdsaqwerty: vô nghĩa

Dự án đang ởGitHubTôi hoan nghênh những đóng góp. Nếu bạn thực sự cần triển khai Java, có thể chúng tôi có thể làm cho Nostril tương thích với Python 2.7 và bạn có thể thử sử dụng JythonChạy nó từ Java.

Giới thiệu về java - Làm cách nào để biết một chuỗi được tạo ngẫu nhiên hay một từ tiếng Anh hợp lý? , chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/21715354/

26 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress