Tạo khoảng cách giữa các từ

Liên hệ QC

babykokoro

Thành viên mới
Tham gia
22/2/08
Bài viết
23
Được thích
29
Em chào các bác.

Em có 1 file gồm 5000 dòng cả tiếng Anh và tiếng Việt.Thế nhưng các từ cứ "dính vào nhau".

VD :"Mybookisnice" hoặc "emtôi".

Có bác nào biết cách tách chúng ra không? Vì em làm thủ công nên lâu quá. Hơn nữa em thường xuyên gặp vấn đề này trong công việc hàng ngày.

Em mong các bác giúp em.

Đa tạ cả nhà.
 
Bạn thử đưa khoảng 100 dòng lên đây xem nào! Nói rõ dự tính muốn làm gì sẽ dể hình dung hơn
 
Em đưa thử file đính kèm các bác giúp em nhé.

Bác Tuấn ơi bác có nghiên cứu vụ này giúp em.

Thank kiu cả nhà
 

File đính kèm

Em đưa thử file đính kèm các bác giúp em nhé.

Bác Tuấn ơi bác có nghiên cứu vụ này giúp em.

Thank kiu cả nhà

Bạn ơi, ngay cả mình còn không bít được là nên tách bắt đầu từ ký tự nào và kết thúc ở ký tự nào nữa thì e là khó làm lắm, phải có ký tự để tách biệt từ như ,. hay ký tự nào đó làm mốc chứ một lèo vậy thì e là phải làm tay
 
Em đưa thử file đính kèm các bác giúp em nhé.

Bác Tuấn ơi bác có nghiên cứu vụ này giúp em.

Thank kiu cả nhà
Khả năng tách được là rất khó, vì ko có quy luật chung cho cả đoạn văn bản ! (kể cả dùng đến đao to VBA)
 
Ùh tại vì chiều dài giữa các ký tự không giống nhau. Mình toàn phải làm thủ công. Vì thế mình nhờ diễn đàn mong mọi người biết thì chỉ giúp. Nghe chừng có vẻ khó.
 
Ùh tại vì chiều dài giữa các ký tự không giống nhau. Mình toàn phải làm thủ công. Vì thế mình nhờ diễn đàn mong mọi người biết thì chỉ giúp.

Mờicácbạnthamdựchươngtrìnhserminacủachúngtôivàongày25/05/2008xinvuilòngliênhệVõTuấnKiệt.

Tách thành:

Mời các bạn tham dự chương trình sermina của chúng tôi vào ngày 25/05/2008 xin vui lòng liên hệ Võ Tuấn Kiệt.

Làm thử cái này rồi nói tiếp.

Khó thiệt chứ nghe chừng gì bạn. Việc này có thể phải lập cả một dự án viết phần mềm nhận dạng tiếng việt chứ chẳng chơi.
 
Em cũng biết là khó lắm chứ bộ. Chắc phải bó tay thôi.

Em đang phải ngồi làm thủ công 1 list dài gần 5000 dòng. Mệt quá.
 
Em cũng biết là khó lắm chứ bộ. Chắc phải bó tay thôi.

Em đang phải ngồi làm thủ công 1 list dài gần 5000 dòng. Mệt quá.

Thay vì bít mạch ngược, bạn có thể cho biết file của bạn là sản phẩm của chương trình gì? hay là sau 1 loạt động tác từ file nào mà thành ra như vậy?

Nếu bạn cho biết điều này thì may ra có thể có giải pháp (chốt lại ở 5000 dòng này chứ nếu không thì có thể bạn còn phải làm nhiều lần 5000 dòng như thế)
 
Có thể tách được nếu babykokoro làm thế này:
Tại 1 cột nào đó (ví dụ cột C) nhập 1 từ tiếng Việt có trong cột B vào 1 ô (số lượng từ chắc không nhiều) rồi dùng vòng lặp For Next thay thế các từ trong cột C vào cột B.
Ví dụ thay "Bộ" bằng "Bộ " thì chữ tách ra ngay.

Mã:
Sub TachTiengViet()
Dim r As Integer, rc As Integer, tv As String
rc = Cells(1, 3).End(xlDown).Row
For r = 2 To rc
  tv = Trim(Cells(r, 3))
  Columns("B").Replace What:=tv, Replacement:=tv & " "
Next
rc = Cells(1, 2).End(xlDown).Row
For r = 2 To rc
  Cells(r, 2) = Application.WorksheetFunction.Trim(Cells(r, 2))
Next
End Sub
 

File đính kèm

Có thể tách được nếu babykokoro làm thế này:
Tại 1 cột nào đó (ví dụ cột C) nhập 1 từ tiếng Việt có trong cột B vào 1 ô (số lượng từ chắc không nhiều) rồi dùng vòng lặp For Next thay thế các từ trong cột C vào cột B.
Ví dụ thay "Bộ" bằng "Bộ " thì chữ tách ra ngay.

thế thì nhiều lắm bác Long ah,

vì phải lập hẳn 1 từ điển lun, chưa kể có khi nhầm chữ bội thành bộ

chắc là có TV nào đó có từ điển tiếng việt k nhỉ, khi đó sẽ giúp việc nhập này

hi iiiiiiii túm lại là tác giả lấy đâu ra các dòng này nhỉ, và tách làm gì nhỉ????
 
Lần chỉnh sửa cuối:
thế thì nhiều lắm bác Long ah,

vì phải lập hẳn 1 từ điển lun, chưa kể có khi nhầm chữ bội thành bộ

chắc là có TV nào đó có từ điển tiếng việt k nhỉ, khi đó sẽ giúp việc nhập này

hi iiiiiiii túm lại là tác giả lấy đâu ra các dòng này nhỉ, và tách làm gì nhỉ????
Không lập được list thì chịu thua. Còn bội hay bộ thì có thể khắc phục được bằng cách sắp list theo số ký tự lớn > nhỏ. Bắt bội phải thay trước bộ
 
Không lập được list thì chịu thua. Còn bội hay bộ thì có thể khắc phục được bằng cách sắp list theo số ký tự lớn > nhỏ. Bắt bội phải thay trước bộ

Vậy thầy định cho BộItế =>> BộI tế chăng (?)
Chắc phần mền nhận dạng tiếng Việt xong thì mới xong cái này;
Theo mình cái này còn khó hơn cái phần mền mình vừa nêu, không biết sao, trật thì xin lỗi các bạn!
 
Vậy thầy định cho BộItế =>> BộI tế chăng (?)
Chắc phần mền nhận dạng tiếng Việt xong thì mới xong cái này;
Theo mình cái này còn khó hơn cái phần mền mình vừa nêu, không biết sao, trật thì xin lỗi các bạn!
Lại thêm một cái mới mà nghĩ chưa tới. Vậy thì thay nguyên cụm từ trước, xong cụm từ mới tới từ. Nhờ nhiều người, nhiều ý làm cho cách nhìn vấn đề phong phú hơn. Chỉ liệu là babykokoro có can đảm nhặt hết các từ cần thay ra không?
 
Vậy thầy định cho BộItế =>> BộI tế chăng (?)
Chắc phần mền nhận dạng tiếng Việt xong thì mới xong cái này;
Theo mình cái này còn khó hơn cái phần mền mình vừa nêu, không biết sao, trật thì xin lỗi các bạn!

oh, BộYTế mới đúng chứ bác SA?

quả là khó tổng quát, quan trọng là bạn ý mục đích làm gì, và lấy số liệu từ đâu mà bị vậy??? -> sẽ có cách tối ưu hơn
 
Web KT

Bài viết mới nhất

Back
Top Bottom