Và có 1 nhận xét thế này: Bảng mã Unicode có 2 bảng mã con.
Chả nhẽ tôi học thêm được điều mới?
Theo tôi bạn phát biểu không chính xác.
Khái niệm tổ hợp và dựng sẵn chỉ có khi ta nói tới cách biểu diễn một chuỗi ký tự. Chuỗi ở đây được hiểu là 1 ký tự hoặc nhiều ký tự.
Trong bảng mã unicode mỗi "phần tử" là
1 ký tự duy nhất (ký tự chứ không phải chuỗi) và có điểm mã là một con số 2 bai. Vậy bạn có thể chỉ ra cho tôi 1 ký tự trong bảng mã Unicode được công bố mà theo bạn thì đó là unicode tổ hợp được không?
Khi tôi cần biểu diễn 1 ký tự mà có hình hài - glyph - "như thế này" thì nhiều khi tôi có 2 cách biểu diễn. "
Nhiều khi" vì có khi chỉ có 1 cách biểu diễn duy nhất - vd. ký tự "a" trong bảng mã unicode. Vd. ký tự mà ta nhìn thấy là "
ồ". Tôi có thể biểu diễn "nó" bằng 1 ký tự unicode duy nhất mà trong bảng mã unicode có điểm mã là &H1ED3 (2 bai): ChrW(&H1ED3) = ChrW(7891). Nhưng ai đó có thể biểu diễn ký tự mà mắt nhìn thấy là "
ồ" bằng 2 ký tự mà trong bảng mã unicode có điểm mã là ChrW(&HF4) và ChrW(300) (2 + 2 = 4 bai): ChrW(&HF4) & ChrW(300) = ChrW(244) & ChrW(768). Trong trường hợp này ta "lắp ráp" (tổ hợp) 2 ký tự là "
ô" (điểm mã 244) và "
dấu huyền" (điểm mã 768) để có ký tự mà mắt nhìn thấy là "
ồ".
Tóm lại nếu có một ký tự nào đó trong bảng mã unicode (2 bai) mà ta có thể biểu diễn bằng cách dùng 2, 3 ký tự khác cũng của bảng mã unicode thì có thể nói là cách thứ 2 biểu diễn ký tự (có cùng glyph như cách thứ nhất) bằng cách dùng unicode tổ hợp (luôn dùng > 2 bai). Riêng về bảng mã unicode thì chỉ có 1, mỗi ký tự là unicode - chả dựng sẵn mà cũng chả tổ hợp - 2 bai. Cùng lắm theo tôi thì nói mỗi ký tự trong bảng mã unicode là unicode dựng sẵn. Theo tôi không có cái gọi là "Bảng mã Unicode có
2 bảng mã con"