em có file dữ liệu từ điển (từ và nghĩa của từ nằm trên 1 dòng, mỗi dòng gồm 2 cột từ và nghĩa của từ)
tuy nhiên có nhiều từ trùng nhau
em muốn lọc bớt những từ này
ví dụ:
1 hello xin chào
2 hello biểu thị gây sự chú ý
3 hello xin chào, biểu thị gây sự chú ý
4 hello
5
..
em muốn bỏ hai hàng 1,2 và 4, vì từ thứ 3 có bao gồm đủ nghĩa rồi
tức là lọc sao cho ở cột mới chỉ giữ lại từ nào mà ở phần nghĩa của nó là dài nhất.
em xin hết ạ.
tuy nhiên có nhiều từ trùng nhau
em muốn lọc bớt những từ này
ví dụ:
1 hello xin chào
2 hello biểu thị gây sự chú ý
3 hello xin chào, biểu thị gây sự chú ý
4 hello
5
..
em muốn bỏ hai hàng 1,2 và 4, vì từ thứ 3 có bao gồm đủ nghĩa rồi
tức là lọc sao cho ở cột mới chỉ giữ lại từ nào mà ở phần nghĩa của nó là dài nhất.
em xin hết ạ.