Việc triển khai Python NLTK của Beeferman và PK của WindowDIFF nhận được kết quả hoàn toàn khác với cả hai triển khai phân tách python.
Sử dụng các thông số tương tự.
hy vọng: 0100100000
giới thiệu: 0101000000
k=2
Phân đoạn PK: 0,2222222
NLTK của PK: 0,111111111
hy vọng: 111111
Tham chiếu: 100100
k=2
Phân đoạn PK:0,4
NLTK của PK: 0,64
Điều này có thể dẫn đến kết quả nghiên cứu khác nhau cho những người sử dụng nó.
Tại sao tôi nhận được kết quả khác nhau khi sử dụng PK trong hai lần triển khai này? PK phải chỉ có một kết quả.
Có thể có điều gì đó không đúng với cách bạn gọi hàm NLTK hoặc có thể bạn đang sử dụng phiên bản NLTK cũ hơn.
Kết quả NLTK tôi nhận được giống với kết quả bạn hiển thị theo cách riêng:
>>> từ pk nhập nltk.metrics.segmentation
>>> hyp = '0100100000'
>>> giới thiệu = '0101000000'
>>> pk(hyp, ref, 2)
0.2222222222222222
>>> hyp = '111111'
>>> giới thiệu = '100100'
>>> pk(hyp, ref, 2)
0,4
Phiên bản nltk của tôi:
>>> nltk.__version__
'3.0.5'
Làm điều này:
cài đặt $ pip -U nltk
Tôi là một lập trình viên xuất sắc, rất giỏi!