Bảng tra cứu tiếng Việt

Liên hệ QC

Ngô Hải Đăng

Thành viên hoạt động
Tham gia
31/8/17
Bài viết
180
Được thích
244
Donate (Paypal)
Donate
Donate (Momo)
Donate
Giới tính
Nam
Mình hệ thống hóa lại các chữ trong tiếng Việt lên 1 bảng Excel, còn nhiều quy tắc nữa nhưng mình nhìn công thức xong là chóng mặt rồi. Không biết là còn chữ nào lọt ra khỏi bảng tra này không. Nếu bạn nào muốn xử lý tiếng Việt thì có thể tham khảo bảng tra này.
 

File đính kèm

  • Tieng Viet.xlsx
    27.3 KB · Đọc: 23
Mình hệ thống hóa lại các chữ trong tiếng Việt lên 1 bảng Excel, còn nhiều quy tắc nữa nhưng mình nhìn công thức xong là chóng mặt rồi. Không biết là còn chữ nào lọt ra khỏi bảng tra này không. Nếu bạn nào muốn xử lý tiếng Việt thì có thể tham khảo bảng tra này.
Bạn tự hệ thống lại? Có tham khảo nguồn nào không?
 
Mình hệ thống hóa lại các chữ trong tiếng Việt lên 1 bảng Excel, còn nhiều quy tắc nữa nhưng mình nhìn công thức xong là chóng mặt rồi. Không biết là còn chữ nào lọt ra khỏi bảng tra này không. Nếu bạn nào muốn xử lý tiếng Việt thì có thể tham khảo bảng tra này.
"xử lý" có nghĩa là làm gì?

Rất tiếc là file tôi tải về, mở lên một đống #NAME? hoàn toàn chả xem được cái gì cả cho nên không đoán được sẽ sử lý cái gì.
 
"xử lý" có nghĩa là làm gì?

Rất tiếc là file tôi tải về, mở lên một đống #NAME? hoàn toàn chả xem được cái gì cả cho nên không đoán được sẽ sử lý cái gì.
1605780658241.png
Em thử tải file trên diễn đàn thì vẫn xem được bình thường.
Công thức trong file
Mã:
=IF(NOT(OR(AND($B3="a",OR($B$1={"a","ă","â"})),AND($B3="o",OR($B$1={"o","ô","ơ"})),$B3=$B$1)),IF(NOT(AND(OR($B3={"c","ch","p","t"}),NOT(OR(RIGHT($C$1,1)=UNICHAR(769),RIGHT($C$1,1)=UNICHAR(803))))),IF(NOT(OR(AND(OR(C$2={"c","g","ng"}),(OR(LEFT($B$2,1) = {"i","e","ê"}))),AND(OR(C$2={"k","gh","ngh"}),NOT(OR(LEFT($B$2,1) = {"i","e","ê"}))))),IF(AND($B3="",$A$1<>"",NOT(OR($B$1={"ê","ơ"}))),C$2&$A$1&RIGHT($C$1)&$B$1&$B3,C$2&$B$2&$B3),""),""),"")
 
Công thức trong file
Mã:
=IF(NOT(OR(AND($B3="a",OR($B$1={"a","ă","â"})),AND($B3="o",OR($B$1={"o","ô","ơ"})),$B3=$B$1)),IF(NOT(AND(OR($B3={"c","ch","p","t"}),NOT(OR(RIGHT($C$1,1)=UNICHAR(769),RIGHT($C$1,1)=UNICHAR(803))))),IF(NOT(OR(AND(OR(C$2={"c","g","ng"}),(OR(LEFT($B$2,1) = {"i","e","ê"}))),AND(OR(C$2={"k","gh","ngh"}),NOT(OR(LEFT($B$2,1) = {"i","e","ê"}))))),IF(AND($B3="",$A$1<>"",NOT(OR($B$1={"ê","ơ"}))),C$2&$A$1&RIGHT($C$1)&$B$1&$B3,C$2&$B$2&$B3),""),""),"")
Có thể phiên bản thấp nên không có hàm UNICHAR.

Cái này dùng làm gì? Cái trong khung đỏ dùng để làm gì?

vn.jpg
 
Có thể phiên bản thấp nên không có hàm UNICHAR.

Cái này dùng làm gì? Cái trong khung đỏ dùng để làm gì?

View attachment 249660
Khung đỏ là liệt kê các trường hợp âm đầu ghép với vần và thanh, bảng này nếu thêm một số quy tắc nữa thì nó chỉ hiện các chữ theo đúng chính tả. Em chỉ làm được một số quy tắc đơn giản.
 
Khung đỏ là liệt kê các trường hợp âm đầu ghép với vần và thanh, bảng này nếu thêm một số quy tắc nữa thì nó chỉ hiện các chữ theo đúng chính tả. Em chỉ làm được một số quy tắc đơn giản.
Thế bạn có các quy tắc đó chưa?
 
Có thể phiên bản thấp nên không có hàm UNICHAR.
...
Chiếu theo điều kiện này thì thớt nên đưa điều kiện phiên bản kèm theo file.

...
Cái này dùng làm gì? Cái trong khung đỏ dùng để làm gì?
...
Bác chiếu ngay đúng cái nách (chỗ nhột) của tiếng Việt.
Nách bên phải là cách dùng y, và yê. Nách bên trái là cách dùng gi.
Muốn làm việc với tiếng Việt thì ít nhất phải biết rõ hai cái nách này.

Ngoài cái nách, còn cái mũi (cái va vào cột đầu tiên nếu trời tối). Điển hình là bộ "b, d, k, l, q, s, v, x". Bộ này luôn luôn đi đầu từ, không bao giờ ở vị trí khác.
Và còn nhiều bộ phận khác, ở đây khó kể hết.
 
Thế bạn có các quy tắc đó chưa?
Mới có mấy cái quy tắc thôi anh, như: phân biệt c,k - g,gh - ng,ngh; các từ kết thúc bằng c,ch,p,t thì chỉ đi được với dấu sắc và nặng; vần chính với âm cuối không được giống nhau; bỏ dấu vào vần chính (há, hán), nếu có âm đệm mà không có vần cuối thì bỏ dấu vào âm đệm (hóa), trường hợp vần chính là ê, ơ thì bỏ dấu vô ê, ơ (Huế, thuở)
 
Mới có mấy cái quy tắc thôi anh, như: phân biệt c,k - g,gh - ng,ngh; các từ kết thúc bằng c,ch,p,t thì chỉ đi được với dấu sắc và nặng; vần chính với âm cuối không được giống nhau; bỏ dấu vào vần chính (há, hán), nếu có âm đệm mà không có vần cuối thì bỏ dấu vào âm đệm (hóa), trường hợp vần chính là ê, ơ thì bỏ dấu vô ê, ơ (Huế, thuở)
Bạn xem thêm bài 9 của anh @VetMini
Ngoài ra còn nhiều, thí dụ:
- phụ âm 3 "ngh" ở đầu chỉ đi với e, ê, i, iê, còn lại đi với phụ âm đôi "ng", không có "y"
- phụ âm k đi với y, e, ê, iê, còn lại đi với c, không có "i" (1)
- ...

_________
(1) trừ tiếng Việt hiện tại kể cả sách giáo khoa: kĩ thuật, kì cục, tự kỉ, ...
 
Bạn xem thêm bài 9 của anh @VetMini
Ngoài ra còn nhiều, thí dụ:
- phụ âm 3 "ngh" ở đầu chỉ đi với e, ê, i, iê, còn lại đi với phụ âm đôi "ng", không có "y"
- phụ âm k đi với y, e, ê, iê, còn lại đi với c, không có "i" (1)
- ...

_________
(1) trừ tiếng Việt hiện tại kể cả sách giáo khoa: kĩ thuật, kì cục, tự kỉ, ...
Trong file thì em có tách ra âm đầu với âm cuối rồi (theo cột và hàng). K vẫn đi được với i nếu có thêm âm cuối (Kim, kính)
Bài đã được tự động gộp:

Thêm sau ...:

Đắk Lắk, Kon Tum
Xoong nồi, boong tàu.
Ôi tiếng Việt ...
 
Thêm sau ...:

Đắk Lắk, Kon Tum
Xoong nồi, boong tàu.
1. nếu kể cả tên riêng thì cứ cho chúng vào nhóm "tên riêng có những trường hợp ngoại lệ".

2. oong:
nằm trong luật: tiếng Việt không bao giờ có trường hợp hai ký tự giống nhau đi đôi. Trường hợp ngoại lệ duy nhất là âm "oong"
(tôi nghĩ mấy vị sáng tạo tiếng Việt ngày xưa đến đây thì bí, ba âm "on", "ong", và "oong" cần phân biệt nên bắt buộc phải phá lệ. Lưu ý là người Nam đọc âm "on" và "oong" rất gần nhau cho nên có mọt số người nghĩ rằng hai âm này là một)

...
- phụ âm 3 "ngh" ở đầu chỉ đi với e, ê, i, iê, còn lại đi với phụ âm đôi "ng", không có "y"
...
ngh là do luật của gh.
Ở bài #9 tôi có đề cập chỗ nhột (cái nách bên trái) của tiếng Việt, cách dùng gi. Thực ra tôi hải nói "cách dùng "g, gi, và gh".
- g đi trước e bắt buộc phải có h xen giữa. Luật này áp dụng cho cả ng
- g đi trước i thì có h xen giữa hay không tuỳ theo cách đọc. Nếu i thuộc về nhiệm vụ nguyên âm thì giống như e, bắt buộc phải có h xen giữa. Nếu i làm nmhieejm vụ đổi cách đọc g từ "gờ" thành "giờ" thì không có h xen giữa.

Trường hợp yê như bài #6 đưa ra là được giải quyết bằng luật:
yê ở đầu từ thì được.
ở giữa từ, nó dùng để diễn tả âm "uyê". Và vì vậy bắt buộc phải có u.
"uyê" thuộc về nhóm phải uốn miệng khá nhiều đẻ phát âm. Nhóm này có 3 nguyên âm đi kề nhau.

Tại lúc nhỏ bạn coi thường môn Văn cho nên không chịu học kỹ. Tiếng Việt thuộc loại khá dễ.

Muốn biết tiếng Việt dễ cỡ nào thì thử tiếng Anh xem:
I before e, except after c
Or when sounded as 'a' as in 'neighbor' and 'weigh'
Unless the 'c' is part of a 'sh' sound as in 'glacier'
Or it appears in comparatives and superlatives like 'fancier'
And also except when the vowels are sounded as 'e' as in 'seize'
Or 'i' as in 'height'
Or also in '-ing' inflections ending in '-e' as in 'cueing'
Or in compound words as in 'albeit'
Or occasionally in technical words with strong etymological links to their parent languages as in 'cuneiform'
Or in other numerous and random exceptions such as 'science', 'forfeit', and 'weird'.

And that doesn't even rhyme.
(nguồn: Merriam-Webster)
Chú: từ điển Merriam-Webster lf của Mỹ, có vài chỗ sẽ khác từ điển Anh một chút.
 
Mình hệ thống hóa lại các chữ trong tiếng Việt lên 1 bảng Excel, còn nhiều quy tắc nữa nhưng mình nhìn công thức xong là chóng mặt rồi. Không biết là còn chữ nào lọt ra khỏi bảng tra này không. Nếu bạn nào muốn xử lý tiếng Việt thì có thể tham khảo bảng tra này.
Cám ơn bạn đã chia sẻ. Trước mình có dùng qua một app kiểm tra chính tả bằng cách dùng data từ từ điển tiếng Việt, cơ mà lâu quá không nhớ tên app là gì.
 
Tại lúc nhỏ bạn coi thường môn Văn cho nên không chịu học kỹ. Tiếng Việt thuộc loại khá dễ.
Không phải coi thường mà là do ngày xưa em học môn Văn giáo viên chỉ đọc và chép nên không hứng thú lắm. Hình như là môn Văn lúc đó có tách ra Văn học với Ngữ pháp. Mấy cái quy tắc này thuộc về Ngữ pháp, có những từ mình ít sử dụng, nay nhắc lại thì mới nhớ ra là đã có học rồi.
Bài đã được tự động gộp:

Cám ơn bạn đã chia sẻ. Trước mình có dùng qua một app kiểm tra chính tả bằng cách dùng data từ từ điển tiếng Việt, cơ mà lâu quá không nhớ tên app là gì.
Vẫn còn nhiều quy tắc chưa được bổ sung vào, mình sẽ hoàn thiện dần dần.
 
Không phải coi thường mà là do ngày xưa em học môn Văn giáo viên chỉ đọc và chép nên không hứng thú lắm. Hình như là môn Văn lúc đó có tách ra Văn học với Ngữ pháp. Mấy cái quy tắc này thuộc về Ngữ pháp, có những từ mình ít sử dụng, nay nhắc lại thì mới nhớ ra là đã có học rồi.
Giáo viên dạy Toán, Lý, ... của tôi cũng "chỉ đọc và chép"
Những gì tôi hiểu, và khả năng giải Toán của tôi là do về nhà suy nghĩ và tìm tòi. Học sinh không suy nghĩ về bài học là do lười.
Văn cũng vậy.
 
Giáo viên dạy Toán, Lý, ... của tôi cũng "chỉ đọc và chép"
Những gì tôi hiểu, và khả năng giải Toán của tôi là do về nhà suy nghĩ và tìm tòi. Học sinh không suy nghĩ về bài học là do lười.
Văn cũng vậy.
Toán, Lý thì còn suy nghĩ và tìm tòi cách giải. Còn môn Văn thì em không biết phải tìm tòi cái gì, phân tích bài văn học thì giáo viên định hướng sẵn rồi, mình tìm tòi cái mới thì có khi ... lạc đề. Mà em cũng lười học Văn thật.
 
Toán, Lý thì còn suy nghĩ và tìm tòi cách giải. Còn môn Văn thì em không biết phải tìm tòi cái gì, phân tích bài văn học thì giáo viên định hướng sẵn rồi, mình tìm tòi cái mới thì có khi ... lạc đề. Mà em cũng lười học Văn thật.
Thì cái phương pháp học Toán kia nó hiện lên trên cái đồ án "ráp tiếng Việt" này của bạn.
Bạn chỉ chú tâm về cái khung, cái giao diện của đồ án.
Cái dữ liệu (tức là cấu trúc tiếng Việt) thì bạn không quan tâm tìm hiểu.

Chú: Toán vẫn có khi giải sai như thường. Học Văn mà sợ lạc đề thì một là cái cớ, hai là do nhút nhát sợ sai.
Người ta thấy môn Văn cứ theo sát Thầy/Cô là được cho nên tự tâm lý không muốn suy nghĩ thêm.
Cái tâm lý này nó càng hiện rõ lên khi tôi dạy môn Lập Trình Hướng Đối Tượng. Hầu hết học sinh VN không có được một chủ tâm về thiết kế lớp. Toàn là học sẵn lớp này thì làm vầy, lớp kia thì như kia.
 
Chủ topic nên tham khảo : Cách đọc theo âm tiết của tiếng việt lớp 1 mới hiện nay
 
Web KT
Back
Top Bottom