So sánh 2 chuỗi ký tự để đồng nhất dữ liệu

Liên hệ QC

nhatquyelec

Thành viên mới
Tham gia
17/12/10
Bài viết
48
Được thích
2
Nghề nghiệp
Elec Engineer
Chào mọi người,
Trong quá trình làm việc mình có một vướng mắc sau, mà mình nghĩ chắc cũng có nhiều người gặp phải vấn đề này,
Mình có một cột A là tên của các trạm điện của một file 1 (mình làm trong ngành điện), rồi cũng có một cột A là tên của một trạm điện của một file 2. Bây giờ mình muốn lấy dữ liệu cột B, C,... của file 2 đắp qua file 1. Nếu cột A của cả file 1 và 2 giống nhau thì khỏe rồi (dùng hàm VLOOKUP), tuy nhiên cột A của file 1 và 2 này đặt tên không đồng nhất với nhau, ví dụ : trong cột A file 1 thì trạm có tên là "An Khánh", trong khi trong cột A của file 2 nó lại đước đặt tên là "trạm BA an Khánh", đó là chưa kể có viết hoa viết thường, rồi còn nhiều trường hợp khác nữa, nơi thì đặt tên ngắn gọn, nơi thì đặt tên có thêm thắt như : công ty TNHH",...
Bây giờ mình muốn tạo hàm so sánh 2 chuỗi kí tự xem mức độ giống nhau của nó là bao nhiêu phần trăm để từ đó xác định dữ liệu có trùng nhau hay không,
Thấy vấn đề này rất hữu ích mong ai đó biết thì giúp đỡ.
 
Chào mọi người,
Trong quá trình làm việc mình có một vướng mắc sau, mà mình nghĩ chắc cũng có nhiều người gặp phải vấn đề này,
Mình có một cột A là tên của các trạm điện của một file 1 (mình làm trong ngành điện), rồi cũng có một cột A là tên của một trạm điện của một file 2. Bây giờ mình muốn lấy dữ liệu cột B, C,... của file 2 đắp qua file 1. Nếu cột A của cả file 1 và 2 giống nhau thì khỏe rồi (dùng hàm VLOOKUP), tuy nhiên cột A của file 1 và 2 này đặt tên không đồng nhất với nhau, ví dụ : trong cột A file 1 thì trạm có tên là "An Khánh", trong khi trong cột A của file 2 nó lại đước đặt tên là "trạm BA an Khánh", đó là chưa kể có viết hoa viết thường, rồi còn nhiều trường hợp khác nữa, nơi thì đặt tên ngắn gọn, nơi thì đặt tên có thêm thắt như : công ty TNHH",...
Bây giờ mình muốn tạo hàm so sánh 2 chuỗi kí tự xem mức độ giống nhau của nó là bao nhiêu phần trăm để từ đó xác định dữ liệu có trùng nhau hay không,
Thấy vấn đề này rất hữu ích mong ai đó biết thì giúp đỡ.

Em cũng làm trong nghành điện, Anh có thể gửi file lên để em học hỏi được không?
 
Upvote 0
Cái này khó bỏ bố. Nó là cả một công tình nghiên cứu của người ta đó.

Muốn biết thuật toán, tra các từ Fuzzy Logic (lô gíc không xác định), O(n) Sequence Comparision Algorithm (độ phức tạp thuật toán so sánh chuỗi)

Muốn tìm add-ins cho Excel, tra các từ Fuzzy Lookup Add-Ins
 
Upvote 0
Chà, không ngờ phức tạp vậy,
Kệ mọi người có ý tưởng nào thì cứ đưa ra vì mình thấy vấn đề này cũng thường xuyên cần lắm !
Đây là file hiện mình đang làm gởi bạn "nguyencanh160890" tham khảo
 

File đính kèm

Upvote 0
Chà, không ngờ phức tạp vậy,
Kệ mọi người có ý tưởng nào thì cứ đưa ra vì mình thấy vấn đề này cũng thường xuyên cần lắm !
Đây là file hiện mình đang làm gởi bạn "nguyencanh160890" tham khảo

Cell B8 = TBA An Khánh
Trong khi ở cột N có: Cấp nước An Khánh, An KhánhAn Khánh 2
Vậy cái nào mới là TBA An Khánh đây?
 
Upvote 0
"TBA An Khánh" = "An Khánh", "TBA An Khánh 2" = "An Khánh 2" đó,... nói chung trong cột B và N có tương ứng 1-1 hết, còn trường hợp dư thừa ra thì chắc do sai sót thôi cũng không liên quan đến bài toán lắm,
Cám ơn anh "ndu96081631" đã quan tâm ,
À với cho mình hỏi luôn mình có 2 chuỗi "an khánh" ở 2 cột, sao mình dùng VLOOKUP nhưng kết quả không trúng (chuỗi "an khánh" ở 2 cột này không được đánh vào đồng nhất từ 1 file mà là từ 2 file khác nhau copy dán qua về), đã định dạng kiểu font, cỡ chữ giống nhau rồi sao vẫn không được,
 
Upvote 0
mình cũng có vấn đề tương tự như vậy, không biết ai có giải pháp giúp đỡ giùm không?
 
Upvote 0
Web KT

Bài viết mới nhất

Back
Top Bottom