Khoảng cách Levenshtein là gì? Trong Excel có giải pháp tương tự không?

Liên hệ QC
Tôi tuân thủ nội quy khi đăng bài

htin1997

Dậm chân tại chỗ là đi lùi.
Tham gia
12/10/20
Bài viết
316
Được thích
271
Xin chào GPE,
Em không biết đăng box này có đúng không, nếu sai nhờ Admin dời box giúp em.

Theo Wikipedia: Khoảng cách Levenshtein(nó) thể hiện khoảng cách khác biệt giữa 2 chuỗi ký tự.
Em tìm đọc và chưa hiểu lắm tác dụng của nó nên em có một số thắc mắc.
1. Nếu lấy MIN khoảng cách của chuỗi hiện tại với các chuỗi có trong 1 dãy ô để xác định mức độ "gần". Thì lúc này nó có hoạt động giống hàm MATCH nhưng đối số match_type=1 không? Hoặc giống hàm LOOKUP không?
2. Trên phương diện VBA thì nó có thể lập ra UDF không?
3. Nó có được áp dụng vào trường hợp cụ thể nào trong tính toán không?
4. Độ tin cậy của phép tính này cao không?
5. Suy nghĩ rằng nó luôn trả về kết quả gần đúng nhất có đúng không?

Sở dĩ câu hỏi này đặt ra là em đang tìm hiểu về làm LOOKUP vì bác @VetMini nói hàm này là 1 hàm nguy hiểm. Trong lúc tìm hiểu thì em tình cờ thấy nó trên mạng, xin lỗi là em đã mất liên kết bài viết đó.

Xin cảm ơn.
 
Là con toán đo dộ khác nhau giữa hai chuỗi. Độ khác nhau này được tính bằng sô thao tác cần thiết để biến hai chuỗi thành giống nhau.
Ví dụ"
"Tran Van An", "Tran Van Anh": khoảng cách là 1, chỉ cần xóa hoặc thêm "h"
"Tran Van An", "Trang Thi Van Anh", khoảng cách là 6

Trong Excel không có sẵn hàm tính cái này. Một là viết công thức khủng, hai là dùng hàm UDF.
 
1- Ứng dụng: Phổ thông nhất là so sánh 2 đoạn văn bản với nhau, tìm tỷ lệ giống nhau (như vụ đạo văn vừa rồi)
2- Dùng hàm UDF trong VBA dạng
=TIMDOKHACNHAU(chuỗi 1, chuỗi 2)
Nếu bạn cần hàm này thì các cao thủ ở đây thừa sức viết.
 
...
Nếu bạn cần hàm này thì các cao thủ ở đây thừa sức viết.
Cao thủ với đê thủ cái mốc xì. Việc này code đã khó mà viết được cái bảng test cho đúng càng khó hơn.
Làm sao bảo đảm được dụng ý của con số Levenshtein? Ví dụ làm sao bảo đảm n+1 phức tạp hơn n?
Cỡ khoảng cách 10 tôi còn cố gắng nhìn. Cỡ số 20 tôi viết cái test cực lắm.
 
Không dễ chút nào. so an với anh hay so anh với an? dư 1 ký tự hay thiếu 1 ký tự? Rồi so an với ăn? Rồi cùng có số ký tự/ số từ y chang nhau nhưng thứ tự khác đi? Một tỷ thứ.
 
Web KT

Bài viết mới nhất

Back
Top Bottom