Tách chuỗi: Chuỗi không theo chuẩn cụ thể nào cả

Liên hệ QC

uronmapu

Thành viên thường trực
Tham gia
9/6/10
Bài viết
361
Được thích
15
Chào cả nhà,

Em đang rất cần tách danh sách của em nhưng khổ nỗi danh sách này các cột thông tin nhập vào không theo 1 quy tắc nào. Cụ thể như sau ạ: File excel của em có các cột

Full name: ghi tên đầy đủ cả tiếng anh, tiếng viêt, tiếng việt không dấu, có cả giới tính trong này nữa. Em muốn tách nó ra thành các cột Title, Firstname, Lastname

Full Phone: ghi số điện thoại cố định, bao gồm có mã quốc gia hoặc không và số máy lẻ hoặc không có. Em muốn tách ra thành các cột: Office Country Code, Office Phone, Office Ext

Mobile: ghi số điện thoại di động, bao gồm có mã quốc gia hoặc không. Em muốn tách ra thành các cột: Mobile Country Code, Mobile Phone,

Full Address: ghi địa chỉ với quận huyên, thành phố, hoặc ko. Em cũng muốn tách ra thành: Address, District, City, ...

Em gửi kèm file excel để minh họa ạ

Xin cảm ơn các bác
 

File đính kèm

cấu trúc dữ liệu của bạn không đồng nhất như vậy thì chỉ làm được từng Cells cụ thể thôi. còn đối với các Cells kiểu khác nữa thì ...chịu.
 
Nghĩa là phải làm thủ công à bác :(

Của em đến 35 nghìn bản ghi, huhu :(
 
nếu nhiều lọc nhóm những cells có điểm giống nhau như sau MR có chấm".", không chấm... rồi dùng code thì còn may ra.
 
Thế này thì chít em rùi, huhu
 
cấu trúc dữ liệu của bạn không đồng nhất như vậy thì chỉ làm được từng Cells cụ thể thôi. còn đối với các Cells kiểu khác nữa thì ...chịu.
thích thì chiều à , làm được chứ sao ko+-+-+-+
Chào cả nhà,

Em đang rất cần tách danh sách của em nhưng khổ nỗi danh sách này các cột thông tin nhập vào không theo 1 quy tắc nào. Cụ thể như sau ạ: File excel của em có các cột

Full name: ghi tên đầy đủ cả tiếng anh, tiếng viêt, tiếng việt không dấu, có cả giới tính trong này nữa. Em muốn tách nó ra thành các cột Title, Firstname, Lastname

Full Phone: ghi số điện thoại cố định, bao gồm có mã quốc gia hoặc không và số máy lẻ hoặc không có. Em muốn tách ra thành các cột: Office Country Code, Office Phone, Office Ext

Mobile: ghi số điện thoại di động, bao gồm có mã quốc gia hoặc không. Em muốn tách ra thành các cột: Mobile Country Code, Mobile Phone,

Full Address: ghi địa chỉ với quận huyên, thành phố, hoặc ko. Em cũng muốn tách ra thành: Address, District, City, ...

Em gửi kèm file excel để minh họa ạ

Xin cảm ơn các bác
xem file có đúng yêu cầu ko nhe

các câu còn lại tự làm thêm nhe, có mẫu rồi làm tương tự, bằng ko làm hết rồi bạn ko có việc làm ngồi yên hưởng lương đâm ra sinh tật --=0
 
Lần chỉnh sửa cuối:
Nghĩa là phải làm thủ công à bác :(

Của em đến 35 nghìn bản ghi, huhu :(

Yêu cầu của bạn không thể thực hiện một cách đứng đắn. 35 nghìn bản ghi cũng phải chịu khó dò tìm. Trừ phi bạn chấp nhận chỉ đúng khoảng 75%.

Ví dụ tên Le Nguyen thì biết lấy họ là Le hay Nguyen ?
(trong bài của bạn tên Wayne Jackson Rooney tách ra FirstName: Rooney và LastName: Wyane Jackson là sai phương pháp tách tên ngoại)
Ví dụ địa chỉ ở HN, SG thì còn biết Quận, nếu ở tỉnh khác thì làm sao nhận ra thế nào là Quận Huyện?
Ngay cả số ĐT cũng chỉ có thể miễn cưỡng dò. Nhưng không thể nào bảo đảm đúng 100%

Tóm lại, dữ liệu của bạn là loại chỉ dùng cho data mining. Mò được chút nào hay chút nấy.
 
thích thì chiều à , làm được chứ sao ko+-+-+-+

xem file có đúng yêu cầu ko nhe

các câu còn lại tự làm thêm nhe, có mẫu rồi làm tương tự, bằng ko làm hết rồi bạn ko có việc làm ngồi yên hưởng lương đâm ra sinh tật --=0


Cảm ơn bác, nhưng với tên Tuan, Tran Anh thì tách nhầm rồi ạ
Em đọc cm của bác VetMini và nhận raTên ngoại quốc em viết nhầm

Wayne Jackson Rooney -> Wayne - firstname, Jackson Rooney - firstname

Em up lai file mẫu ạ
 

File đính kèm

Cảm ơn bác, nhưng với tên Tuan, Tran Anh thì tách nhầm rồi ạ
Em đọc cm của bác VetMini và nhận raTên ngoại quốc em viết nhầm

Wayne Jackson Rooney -> Wayne - firstname, Jackson Rooney - firstname

Em up lai file mẫu ạ
chẳng lẽ bạn nhập tên ko có 1 quy tắc nào phân biệt hả, phải chăng mới lớp 1 á+-+-+-+
làm bất kỳ cái gì cũng phải có quy tắc nhất là 1 công ty lơn, như bạn nói kiểu ấy chắc công ty ấy chuận bị ...... rồi " nhân viên ko có 1 chút kiến thức cơ bản nào :=\+"
ví dụ : người nước ngoài có thể là vây:
Tuan-tran van
còn tên người việt nam thì :
Trần Anh Tuấn

đó cũng là 1 quy tắc vậy, du sao đi chăng nữa việc nhập phải theo 1 luật nhất định, nếu công ty bạn muốn gì ghi đó, ai muốn làm gì thì làm thì bạn chuẩn bị sẵn hồ sơ mới đi là vừa
 
Lần chỉnh sửa cuối:
chẳng lẽ bạn nhập tên ko có 1 quy tắc nào phân biệt hả, phải chăng mới lớp 1 á+-+-+-+
làm bất kỳ cái gì cũng phải có quy tắc nhất là 1 công ty lơn, như bạn nói kiểu ấy chắc công ty ấy chuận bị ...... rồi " nhân viên ko có 1 chút kiến thức cơ bản nào :=\+"
ví dụ : người nước ngoài có thể là vây:
Tuan-tran van
còn tên người việt nam thì :
Trần Anh Tuấn

đó cũng là 1 quy tắc vậy, du sao đi chăng nữa việc nhập phải theo 1 luật nhất định, nếu công ty bạn muốn gì ghi đó, ai muốn làm gì thì làm thì bạn chuẩn bị sẵn hồ sơ mới đi là vừa

Vâng! đúng như bác nói ạ, em không phải là người nhập từ đầu và trước đây không có ai quy định rõ rành, hướng dẫn thế nào ....
Em vừa vào nhận làm nhiệm vụ này, và được coi là người có kiến thức :) nhận ra được vấn đề sai
Và em muốn khắc phục, làm lại cho có kiến thức ạ

Cảm ơn các bác giúp đỡ
 
Vâng! đúng như bác nói ạ, em không phải là người nhập từ đầu và trước đây không có ai quy định rõ rành, hướng dẫn thế nào ....
Em vừa vào nhận làm nhiệm vụ này, và được coi là người có kiến thức :) nhận ra được vấn đề sai
Và em muốn khắc phục, làm lại cho có kiến thức ạ


Cảm ơn các bác giúp đỡ
xem file đúng yêu cầu chưa????, các phần còn lai tự xử lấy
 
Có mấy tên tiếng nước ngoài chưa đúng bác ạ
Tên nước ngoài thì tách theo dạng:

Full name (First name + Lastname) -> cột Firstname và cột Lastname

Công nhận ko có quy định thì tách khó quá
Ví dụ tên nếu fullname mà viết như bên dưới

Mr. Tuấn Trần Anh -> Mr + Tuấn + Trần Anh
Mr. Tuấn, Trần Anh -> Mr + Tuấn + Trần Anh
David Luis -> David + Luis

Thì đúng là ko tách được
Em thử dựa vào file của bác để làm với số điện thoại và địa chỉ nhưng ko ra được

Em nghỉ chắc em phải làm thủ công bằng tay thôi, 35 nghìn chắc phải trong vòng 3 tháng

@: em đang muốn tuyển 1 bạn vào làm tạm để xử lý lại 35nghìn bản ghi này về yêu cầu như trên
Yêu cầu:
1. Thứ nhất là phải kiên trì (mới gõ lại được 35 nghìn bản ghi này)
2. Biết và có kỹ năng về excel
3. Thời gian: làm trong vòng 2-3 tháng sau khi xử lý xong dữ liệu
4. Lương: 1 Triệu VND/ tháng
5. Cái này chắc chỉ thích hợp với các bạn sinh viên và các bạn đang chờ việc làm ... :(
6. Ai quan tâm xin gửi lại cho em email để liên hệ ạ

Cảm ơn các bác đã giúp em
 
Lần chỉnh sửa cuối:
Có mấy tên tiếng nước ngoài chưa đúng bác ạ
Tên nước ngoài thì tách theo dạng:

Full name (First name + Lastname) -> cột Firstname và cột Lastname

Công nhận ko có quy định thì tách khó quá
Ví dụ tên nếu fullname mà viết như bên dưới

Mr. Tuấn Trần Anh -> Mr + Tuấn + Trần Anh
Mr. Tuấn, Trần Anh -> Mr + Tuấn + Trần Anh
David Luis -> David + Luis

Thì đúng là ko tách được
Em thử dựa vào file của bác để làm với số điện thoại và địa chỉ nhưng ko ra được

Em nghỉ chắc em phải làm thủ công bằng tay thôi, 35 nghìn chắc phải trong vòng 3 tháng

@: em đang muốn tuyển 1 bạn vào làm tạm để xử lý lại 35nghìn bản ghi này về yêu cầu như trên
Yêu cầu:
1. Thứ nhất là phải kiên trì (mới gõ lại được 35 nghìn bản ghi này)
2. Biết và có kỹ năng về excel
3. Thời gian: làm trong vòng 2-3 tháng sau khi xử lý xong dữ liệu
4. Lương: 1 Triệu VND/ tháng
5. Cái này chắc chỉ thích hợp với các bạn sinh viên và các bạn đang chờ việc làm ... :(
6. Ai quan tâm xin gửi lại cho em email để liên hệ ạ

Cảm ơn các bác đã giúp em
đã xem file mới vùa tải chưa?................
số điện thoại cũng chẳng có gì khó cả, cái quan trọng là ngay cả ví dụ cũng ghi sai, (số di động có số 1 đầu tiên là số có 10) mà chi ví dụ có 7 hay 8 số thì phải
gửi ý vài điều để tách nè, số di đọng hiện giờ gồm 9 số và 10 số ko tính số 0 đầu, nó vậy bạn biết cái mấu chốt để tách rồi chứ
 
Lần chỉnh sửa cuối:
Em xem rồi ạ, tên nước ngoài vẫn chưa đúng ạ

Nếu như bên dưới thì liệu có nhận dạng được ko bác

Mr. Tuấn Trần Anh -> Mr + Tuấn + Trần Anh
Mr. Tuấn, Trần Anh -> Mr + Tuấn + Trần Anh

Còn về điện thoại em ghi đúng mà, có 2 cột, 1 cột là điện thoại cố định, 1 cột là di động (có 9 số mà 10 số ạ)
 

File đính kèm

Lần chỉnh sửa cuối:
Em xem rồi ạ, tên nước ngoài vẫn chưa đúng ạ

Nếu như bên dưới thì liệu có nhận dạng được ko bác

Mr. Tuấn Trần Anh -> Mr + Tuấn + Trần Anh
Mr. Tuấn, Trần Anh -> Mr + Tuấn + Trần Anh
1 vài trường hợp như thế bạn phải rà lại, và nhập bằng tay, mình đã nói rồi tên Tây và Ta phải có chút gì để phân biệt máy mới hiểu, chứ ko phải là ngươ ì,
còn mr. Tuấn, trần văn ====> nó ra tốt đấy chứ , còn cái đầu tiên nó ko có gì phân biệt nên nó hiểu là Ta, đùng nói là máy , người nhìn vào đôi lúc còn ko biết cái nào là họ cái nào là tên : vd
"Tô Nguyễn", bạn cho mình biết cái nào là họ cái nào là tên, kiểu này bó tay công ty bạn luôn, đầu đuôi đảo lộn
 
Vâng ạ, em cảm ơn bác
Còn về điện thoại em ghi đúng mà, có 2 cột, 1 cột là điện thoại cố định, 1 cột là di động (có 9 số mà 10 số ạ)
 
Vâng ạ, em cảm ơn bác
Còn về điện thoại em ghi đúng mà, có 2 cột, 1 cột là điện thoại cố định, 1 cột là di động (có 9 số mà 10 số ạ)
cho thêm 1 gửi ý nè : khu vực thì nếu chỉ là VN thì 84 rồi làm chi cho mệt "cach lam co trong file" nữa
còn số fone di động thì thế này

Vâng! đúng như bác nói ạ, em không phải là người nhập từ đầu và trước đây không có ai quy định rõ rành, hướng dẫn thế nào ....
Em vừa vào nhận làm nhiệm vụ này, và được coi là người có kiến thức :) nhận ra được vấn đề sai
Và em muốn khắc phục, làm lại cho có kiến thức ạ

Cảm ơn các bác giúp đỡ
như cái đỏ đỏ đó chúc bạn làm tốt công việc
 
Lần chỉnh sửa cuối:
Có mấy tên tiếng nước ngoài chưa đúng bác ạ
Tên nước ngoài thì tách theo dạng:

Full name (First name + Lastname) -> cột Firstname và cột Lastname

Công nhận ko có quy định thì tách khó quá
Ví dụ tên nếu fullname mà viết như bên dưới

Mr. Tuấn Trần Anh -> Mr + Tuấn + Trần Anh
Mr. Tuấn, Trần Anh -> Mr + Tuấn + Trần Anh
David Luis -> David + Luis

Thì đúng là ko tách được
Em thử dựa vào file của bác để làm với số điện thoại và địa chỉ nhưng ko ra được

Em nghỉ chắc em phải làm thủ công bằng tay thôi, 35 nghìn chắc phải trong vòng 3 tháng

@: em đang muốn tuyển 1 bạn vào làm tạm để xử lý lại 35nghìn bản ghi này về yêu cầu như trên
Yêu cầu:
1. Thứ nhất là phải kiên trì (mới gõ lại được 35 nghìn bản ghi này)
2. Biết và có kỹ năng về excel
3. Thời gian: làm trong vòng 2-3 tháng sau khi xử lý xong dữ liệu
4. Lương: 1 Triệu VND/ tháng
5. Cái này chắc chỉ thích hợp với các bạn sinh viên và các bạn đang chờ việc làm ... :(
6. Ai quan tâm xin gửi lại cho em email để liên hệ ạ


Cảm ơn các bác đã giúp em
chưa nay mình ko có để ý cái dòng màu đỏ " để các sinh viên có điều kiện nên mình mạn phép hạ file đính kèm "


kiểu ấy 3 tháng gì 3 ngày là xong
 
Lần chỉnh sửa cuối:
35 nghìn dòng hay 3500 dòng gì cũng vậy thôi. Tôi đã giải thích là dữ liệu của bạn chỉ có thể làm đúng đến một mức đô nào đó.

Gặp trường hợp như thế này, người ta phải viết VBA code làm thử qua một lượt, nếu viết giỏi thì đúng được khoảng 75%. Đây là số dữ liệu chuẩn, vd Nguyen van Em. Sau đó đọc kết quả, rút ra những quy luật điều chỉnh khi gặp những dữ liệu không chuẩn, vd tên Tran Nguyen thì Tran là họ, Nguyen là name. Sau vài lần quy luật thì sẽ tuiến tới đạt khoảng 95%-98%. Vài phần trăm còn lại bạn phải chấp nhận không thể nào biết nổi, người hay máy cũng phải chịu thua, vd Ông Văn Thái thì Ông hay Văn là họ?
 
Nếu tuyển 1 nhân viên vào ngồi gõ lại thì phải thêm 1 người ngồi bên cạnh để phân biệt cái nào là tên cái nào là họ. Khiếp thật
nghe ông Anh này nói kiểu này khủng kiếp quá " tức 3 tháng lương cho 2 nhân viên"
cái này do chủ thớt lười thôi, chỉ cần chỉnh lý dự liệu lại 1 chút rồi dùng công tách chữ làm 1 phát xong chứ gì
" dùng chức năng find and replace để chỉnh lý cái tên tiếng anh thêm 1 cái ký tự nào đó để phân biệt tên Tây và Ta" xong rồi dùng công thức tách cái tên ấy chắc tầm 1 - 2 ngày là xong"

35 nghìn dòng hay 3500 dòng gì cũng vậy thôi. Tôi đã giải thích là dữ liệu của bạn chỉ có thể làm đúng đến một mức đô nào đó.

Gặp trường hợp như thế này, người ta phải viết VBA code làm thử qua một lượt, nếu viết giỏi thì đúng được khoảng 75%. Đây là số dữ liệu chuẩn, vd Nguyen van Em. Sau đó đọc kết quả, rút ra những quy luật điều chỉnh khi gặp những dữ liệu không chuẩn, vd tên Tran Nguyen thì Tran là họ, Nguyen là name. Sau vài lần quy luật thì sẽ tuiến tới đạt khoảng 95%-98%. Vài phần trăm còn lại bạn phải chấp nhận không thể nào biết nổi, người hay máy cũng phải chịu thua, vd Ông Văn Thái thì Ông hay Văn là họ?

dùng VBA cũng thế thôi bạn ơi, VBA có thể phân biệt được tên Tây hay Ta ko???? nếu dự liệu ko được chỉnh lý .
nếu dự liệu được chỉnh lý thì công thức cũng xơi ngọt chứ ko cần tới VBA
do thấy chủ thớt ko cần tới nên mình đã hạ file, nhưng hình như đây là vấn đề chung của nhiều người, gửi lên để mọi người tham khảo : mình đã làm 2 khau tách tên và tách số điện thoại
 

File đính kèm

Lần chỉnh sửa cuối:
Web KT

Bài viết mới nhất

Back
Top Bottom