Xin giúp đỡ lọc lấy dữ liệu trùng nhiều điều kiện.

Liên hệ QC

phananhvusv

Thành viên chính thức
Tham gia
28/3/17
Bài viết
72
Được thích
13
Em có file excel dữ liệu hơn 200.000 dòng và hơn 20 cột. Nhiệm vụ của em là trích lọc dữ liệu trùng 3 tiêu chí và 4 tiêu chí ra 2 sheet mới.
Trùng 3 tiêu chí gồm: Hoten, ngaysinh, gioitinh
Trùng 4 tiêu chí gồm: Hoten, ngaysinh, gioitinh, diachi
Trường hợp nào trùng 4 tiêu chí thì không liệt kê vào sheet trùng 3 tiêu chí nữa.
Em có gởi kèm file ví dụ đã rút gọn cho nhẹ, nhờ các bác giúp đỡ ạ.
 

File đính kèm

  • Solieu test rut gon .xls
    2.4 MB · Đọc: 18
Khi xây dựng CSDL bạn chưa có mã duy nhất cho từng người; Giờ thì phải đi tìm cách khắc phục cho sai lầm trước đây, mệt nhỉ.
Nếu là mình thì giờ phải tìm cách thêm cột mã duy nhất cho từng dòng. Nếu không thì đừng làm việc gì khác thêm nữa.
 
Upvote 0
Khi xây dựng CSDL bạn chưa có mã duy nhất cho từng người; Giờ thì phải đi tìm cách khắc phục cho sai lầm trước đây, mệt nhỉ.
Nếu là mình thì giờ phải tìm cách thêm cột mã duy nhất cho từng dòng. Nếu không thì đừng làm việc gì khác thêm nữa.
Vì cái "bộ quy tắc ứng xử" của bác mà con phải mò làm sao để từ cột J nó ra tới cột Q nè! Tại chưa có khả năng vận dụng linh hoạt các hàm mà con phải chèn cả đống cột phụ rồi làm từng bước, híc, tự cảm thấy mình quá cùi bắp. :D
1594258019793.png
 
Upvote 0
Khi xây dựng CSDL bạn chưa có mã duy nhất cho từng người; Giờ thì phải đi tìm cách khắc phục cho sai lầm trước đây, mệt nhỉ.
Nếu là mình thì giờ phải tìm cách thêm cột mã duy nhất cho từng dòng. Nếu không thì đừng làm việc gì khác thêm nữa.
Dạ, con quên. Trong dữ liệu đó mỗi dòng có 1 soSoBhxh duy nhất (cột R) ạ.
 
Upvote 0
Lần chỉnh sửa cuối:
Upvote 0
Nếu Số sổ BHXH là duy nhất thì bây giờ không có giá trị gì, vì trùng 3 hay trùng 4 sẽ có các số sổ BHXH khác nhau
Dạ đúng ạ, nhiệm vụ là lấy ra các số sổ BHXH có các tiêu chí trùng nhau (tất nhiên số sổ ko trùng được rồi, và số sổ ko nằm trong các tiêu chí đó)
 
Upvote 0
Dạ đúng ạ, nhiệm vụ là lấy ra các số sổ BHXH có các tiêu chí trùng nhau (tất nhiên số sổ ko trùng được rồi, và số sổ ko nằm trong các tiêu chí đó)
Tìm kiểu này không chắc lấy được tất cả các dòng trùng, vì chỉ cần so sai 1 dấu cách, dấu phẩy... cũng không tìm được.
"Bo" thêm cho bạn cột cuối cùng ghi lại số các dòng bị trùng trong Data.
 

File đính kèm

  • Solieu test rut gon .rar
    123.6 KB · Đọc: 12
Lần chỉnh sửa cuối:
Upvote 0
Tìm kiểu này không chắc lấy được tất cả các dòng trùng, vì chỉ cần so sai 1 dấu cách, dấu phẩy... cũng không tìm được.
"Bo" thêm cho bạn cột cuối cùng ghi lại số các dòng bị trùng trong Data.
Dạ, ý đồ là dù có sai 1 chút cũng ko tính là trùng ạ.
Sau khi test thì em thấy có trường hợp thế này: có 3 trường hợp trùng thì code chỉ đưa ra 2 kết quả (3 tiêu chí), em muốn liệt kê hết luôn thì có được ko ạ?
 

File đính kèm

  • Solieu test rut gon .rar
    123.6 KB · Đọc: 8
Upvote 0
Dạ, ý đồ là dù có sai 1 chút cũng ko tính là trùng ạ.
Sau khi test thì em thấy có trường hợp thế này: có 3 trường hợp trùng thì code chỉ đưa ra 2 kết quả (3 tiêu chí), em muốn liệt kê hết luôn thì có được ko ạ?
1/ Trường hợp Nguyễn Lê Hoàng Khải, giới tính 1, chỉ có 2 dòng trùng 4, 1 dòng giới tính 0 coi như duy nhất, sao liệt kê ra 3 dòng ?
2/ Trường hợp Trịnh Hoài Vũ, có 3 dòng trùng 3, nhưng trong đó có 2 dòng trùng 4, liệt kê bên nào? Nếu lấy bên trùng 4 2 dòng thì bên trùng 3 chỉ còn 1 dòng.
Nếu lu bu thì chỉ tìm trùng 2 thôi (Họ tên, Ngày tháng năm sinh), Sort theo Tên để các tên nằm gần nhau, lúc đó xét trùng 3 hay 4 thì "nhìn bằng mắt".
 
Lần chỉnh sửa cuối:
Upvote 0
1/ Trường hợp Nguyễn Lê Hoàng Khải, giới tính 1, chỉ có 2 dòng trùng 4, 1 dòng giới tính 0 coi như duy nhất, sao liệt kê ra 3 dòng ?
2/ Trường hợp Trịnh Hoài Vũ, có 3 dòng trùng 3, nhưng trong đó có 2 dòng trùng 4, liệt kê bên nào? Nếu lấy bên trùng 4 2 dòng thì bên trùng 3 chỉ còn 1 dòng.
Nếu lu bu thì chỉ tìm trùng 2 thôi (Họ tên, Ngày tháng năm sinh), Sort theo Tên để các tên nằm gần nhau, lúc đó xét trùng 3 hay 4 thì "nhìn bằng mắt".
Vậy anh làm giúp em 1 file trùng 2 nữa nhé. Dùng hàm cũng được nhưng dữ liệu lớn hay bị văng lắm.
 
Upvote 0
Web KT
Back
Top Bottom