LuisNguyen
Thành viên mới

- Tham gia
- 24/8/15
- Bài viết
- 8
- Được thích
- 0
mình có 1 file chứa danh mục thuốc được sử dụng trong 1 bệnh viện
vấn đề là ở chỗ dữ liệu này là người dùng đưa lên bằng nhiều cách khác nhau: copy paste, nhập tay, xuất ra từ phần mềm... nên sẽ có tình trạng 1 ô có chứa text dạng unicode tổ hợp, ô khác lại chứa text dạng unicode dựng sẵn. chưa kể còn 1 số trường hợp dữ liệu bị khoảng trắng ở giữa, đầu, cuối đoạn text, ký tự xuống dòng giữa đoạn text
vì thế khi dùng file excel này mà import vào phần mềm của mình thì sẽ bị loạn dữ liệu, so sánh 1 chuỗi với 1 chuỗi khác bị sai. vậy cho mình hỏi có cách nào để chuẩn hoá dữ liệu từng cell trong file đó không? đoạn nào có font unicode thì convert hết về unicode dựng sẵn, đoạn nào có ký tự trắng ở đầu, cuối, giữa, ký tự xuống dòng thì trim white space các kiểu đi để nó về dạng thường. không biết trong excel có hỗ trợ cái này không?
thanks
vấn đề là ở chỗ dữ liệu này là người dùng đưa lên bằng nhiều cách khác nhau: copy paste, nhập tay, xuất ra từ phần mềm... nên sẽ có tình trạng 1 ô có chứa text dạng unicode tổ hợp, ô khác lại chứa text dạng unicode dựng sẵn. chưa kể còn 1 số trường hợp dữ liệu bị khoảng trắng ở giữa, đầu, cuối đoạn text, ký tự xuống dòng giữa đoạn text
vì thế khi dùng file excel này mà import vào phần mềm của mình thì sẽ bị loạn dữ liệu, so sánh 1 chuỗi với 1 chuỗi khác bị sai. vậy cho mình hỏi có cách nào để chuẩn hoá dữ liệu từng cell trong file đó không? đoạn nào có font unicode thì convert hết về unicode dựng sẵn, đoạn nào có ký tự trắng ở đầu, cuối, giữa, ký tự xuống dòng thì trim white space các kiểu đi để nó về dạng thường. không biết trong excel có hỗ trợ cái này không?
thanks