trích xuất email trong 1 cột excel

Liên hệ QC

nguyentrongtien

Thành viên mới
Tham gia
18/8/07
Bài viết
17
Được thích
4
Kính chào các bác!
Em có 1 file excel do bên nhân sự đưa qua, mà oái oăm 1 nỗi e muốn lấy email trong cái cột D ra mà chả biết làm sao cả
mong các bác cứu vớt cuộc đời em với
file excel: File nhân sự

uid-email.png
 
Lần chỉnh sửa cuối:
Trong cái list nhân sự trên, 10 người có đến 9 thừa khả năng "cứu vớt cuộc đời" bạn. Sao không hỏi họ?
Bụt nhà không thiêng hở?

Dùng hàm Mid kết hợp Find sẽ làm được, bạn không đưa file lên nên tôi chỉ gợi ý vậy.
Cái này là data mining mờ. File chứa dữ liệu này là hàng có giá, đâu thể quảng bá tùm lum được.
 
Dùng hàm Mid kết hợp Find sẽ làm được, bạn không đưa file lên nên tôi chỉ gợi ý vậy.
cảm ơn bạn, mình vừa úp file excel lên gg drive, mong được bạn giúp
Bài đã được tự động gộp:

Trong cái list nhân sự trên, 10 người có đến 9 thừa khả năng "cứu vớt cuộc đời" bạn. Sao không hỏi họ?
Bụt nhà không thiêng hở?


Cái này là data mining mờ. File chứa dữ liệu này là hàng có giá, đâu thể quảng bá tùm lum được.
data mining là gì mình ko hiểu, đây chỉ đơn giản là 1 file do nhân sự đưa qua mình mà thôi, có cái form trên web và các ứng viên điền thông tin ứng tuyển vào, hơi tiếc là mục ghi chú họ ghi lộn xộn quá nên dữ liệu đổ về google sheet nó hơi lộn xộn 1 chút
 
Trong cái list nhân sự trên, 10 người có đến 9 thừa khả năng "cứu vớt cuộc đời" bạn. Sao không hỏi họ?
Bụt nhà không thiêng hở?


Cái này là data mining mờ. File chứa dữ liệu này là hàng có giá, đâu thể quảng bá tùm lum được.
chức năng bên nhân sự chỉ đơn giản là ghi nhận lại cái google sheet rồi chuyển qua IT để gửi email đến ứng viên, chứ nhân sự họ ko làm được mới nhờ mình đấy chứ, mà mình thì đoạn này cũng mù tịt hihihhiihihii
Bài đã được tự động gộp:

Xin lỗi mình không có tài khoản email nên không xem sửa được dữ liệu của bạn.
mình share file ấy full quyền mà, bạn bấm vào là down về được mà
 
chức năng bên nhân sự chỉ đơn giản là ghi nhận lại cái google sheet rồi chuyển qua IT để gửi email đến ứng viên, chứ nhân sự họ ko làm được mới nhờ mình đấy chứ, mà mình thì đoạn này cũng mù tịt hihihhiihihii
Bài đã được tự động gộp:


mình share file ấy full quyền mà, bạn bấm vào là down về được mà
Ô A2 gõ công thức như sau:
Mã:
=IFERROR(MID(A2,FIND(":",A2)+2,FIND("gmail.com",A2)-FIND(":",A2)+7),"")
Fill công thức xuống phía dưới.
 

File đính kèm

  • nhan su ung tuyen thang 11.xlsx
    29 KB · Đọc: 6
Lần chỉnh sửa cuối:
Đây nhé, chỗ ông người Hàn thì sửa thủ công nhé bạn
 

File đính kèm

  • nhan su ung tuyen thang 11.xlsx
    33 KB · Đọc: 9
Đây nhé, chỗ ông người Hàn thì sửa thủ công nhé bạn
Tôi không kiểm tra để biết "ông người Hàn" ở chỗ nào nhưng nếu phải sửa thủ công thì sẽ phải sửa hết tất cả các kết quả. Vì các kết quả có dạng:

: ittroller8@gmail (D2)
n Skype: alexnguyenth96@gmail (D9)
me.my email address is jahongmin@gmail (D57)

Khó có thể công nhận 3 kết quả trên là e-mail. Đó là cả một câu có nhiều từ. Thậm chí đoạn e-mail còn bị cắt cụt.

Không thể
chuyển qua IT để gửi email đến ứng viên
nếu không sửa tay từng kết quả ở trên.

Ngoài ra tôi thấy là mọi người đến từ khắp thế giới, không phải ai cũng có gmail mà có thể rất khác nhau.
 
Lần chỉnh sửa cuối:
Kính chào các bác!
Em có 1 file excel do bên nhân sự đưa qua, mà oái oăm 1 nỗi e muốn lấy email trong cái cột D ra mà chả biết làm sao cả
mong các bác cứu vớt cuộc đời em với
file excel: File nhân sự

View attachment 229291
Thử code này
Mã:
Option Explicit

Sub Mail_()
Dim SArr
Dim Result
Dim rws, i, j, k, x, z, t
SArr = Sheet1.Range("A2", Sheet1.Range("A2").End(xlDown))
rws = UBound(SArr)
ReDim Result(1 To rws, 1 To 1)
With CreateObject("VbScript.RegExp")
    .Pattern = "[^\s\:]+[@]\w+\.\w+"
    .Global = True
    For i = 1 To rws
        If .test(SArr(i, 1)) Then
            Set t = .Execute(SArr(i, 1))
            For j = 0 To t.Count - 1
                Result(i, 1) = Result(i, 1) & " " & t(j)
            Next j
            Result(i, 1) = Trim(Result(i, 1))
        End If
    Next i
    Sheet1.Range("C2").Resize(rws, 1) = Result
End With
End Sub
 
Một trong những công việc "Data mining" là vét ở đâu đó về một cụm dữ liệu rồi tìm trong đó cái tin tức mà mình muốn.
Ở cấp thấp thì có một chủ ý nhất định và tìm đúng ngay chủ ý đó (như email ở đây)
Ở cấp cao thì liên hệ đến trí tuệ nhân tạo, người ta tự mò lấy những dữ liệu, những sự liên hệ và thống kê lại.

Như cái ảnh thớt đưa ra bên trên thì cơ quan của thớt có cái phần mềm. Hình như họ đang tuyển người làm Ai Ti gì đó. Bên ứng viên đưa một link mạng xã hội của mình (theo như cách hành văn trong ảnh thì đại khái nó theo kiểu LinkedIn). Bên tuyển vào đó hốt tin tức về và lọc ra khoảng 10 người để phỏng vấn.
Cũng có thể là họ đọc cái cover letter (bức thư xin việc) bằng Word hay PDF gì đó rồi túm cái phần giữa "Dear..." và "Yours..." đưa vào.

Câu hỏi tôi đặt ra là:
1. nếu cần thì người ta phân tách thêm những yếu tố khác, điển hình số năm làm việc, độ chuyên môn,... Chứ đâu chỉ có cái email.
(Hầu hết những trường hợp chỉ tách lấy email là do người ta muốn soạn một danh sách email để xì pem hoặc bán lại cho các công ty chuyên xì pem)
2. 9 trên 10 người trong danh sách kia là dân Ai Ti tầm cỡ. Chứng tỏ cơ quan của thớt cũng phải có nhân viên Ai Ti đại khái đủ để nói chuyện với họ. Thế thì tại sao công việc này không giao cho người ấy, lại để cho một tay mơ Excel lên dễn đàn GPE xin "cứu mạng"? Chẳng nhẽ cơ quan này nó không có tự trọng?

@CHAOQUAY:
1. Bạn đã thử \w với tiếng Việt chưa? (tôi chỉ hỏi chứ chưa thử)
2. Có một vài cái domain (.com) bị dính với từ khác. Ngay dòng đầu: "ittroller8@gmail.comkinh nghiệm"
3. Nếu dùng dấu chấm để loại domain cũng không được. Vì có một số superdomain là viết tắt của quốc gia, ví dụ .co.uk (Anh quốc). Trừ phi bạn bảo đảm là danh sách không có người dùng email Âu-Úc.
Túm lại, cái danh sách thớt đưa ra là một thử thách cho Ai Ti. Nó có thể dùng làm để tài thi tuyển cho chính những người trong danh sách.
 
Lần chỉnh sửa cuối:
...
@CHAOQUAY:
1. Bạn đã thử \w với tiếng Việt chưa? (tôi chỉ hỏi chứ chưa thử)
2. Có một vài cái domain (.com) bị dính với từ khác. Ngay dòng đầu: "ittroller8@gmail.comkinh nghiệm"
3. Nếu dùng dấu chấm để loại domain cũng không được. Vì có một số superdomain là viết tắt của quốc gia, ví dụ .co.uk (Anh quốc). Trừ phi bạn bảo đảm là danh sách không có người dùng email Âu-Úc.
Túm lại, cái danh sách thớt đưa ra là một thử thách cho Ai Ti. Nó có thể dùng làm để tài thi tuyển cho chính những người trong danh sách.
1.Tiếng Việt chưa thử bác ạ. Nhưng đoạn mẫu [] trước ký tự @ chắc có lẽ vẫn nhận diện được. Việc này phải có mẫu mới khẳng định được.
2.Cái "ittroller8@gmail.comkinh nghiệm": Giữa "....com" & "kinh nghiệm" nó có 1 ký tự Chr(10) nên mẫu lọc được bác ạ.
3.Cái này thớt không đưa lên thì họ nhận vậy thôi bác, chắc khách tuyển đặc biệt họ đưa người khác xử lý, không tới lượt thớt cũng nên.

Việc lọc mail với dữ liệu kiểu này thì làm cách gì cũng chắc không bao giờ được 100%, xác định vậy nên viết cho đỡ lụt thôi bác ạ.
 
...
Việc lọc mail với dữ liệu kiểu này thì làm cách gì cũng chắc không bao giờ được 100%, xác định vậy nên viết cho đỡ lụt thôi bác ạ.
Tôi chỉ nhắc những chỗ có thể chủ quan thôi.
Một khi bạn xác định là chỉ "tạm vá víu" thì đương nhiên vấn đề coi như đã giải quyết.
Tuy nhiên, nếu lần sau bạn thêm một câu: "giải pháp này có lẽ lấy ra đúng được 90% con số cần thiết" thì sẽ giúp cho những bạn khác học code của bạn.
Biết dùng cái nhìn khách quan để tự đặt giới hạn và tầm vực của sản phẩm (code) của mình cũng là một kỹ năng quan trọng của cấp quản lý.
 
Web KT

Bài viết mới nhất

Back
Top Bottom