Gửi BTC,
Cho em hỏi, mỗi token trong bộ dữ liệu train, private test mà ban tổ chức cung cấp là duy nhất?. Ví dụ: "32 1042 2524" có thể là câu "tôi đi làm". Giả sử mỗi từ trong câu trên được coi là 1 token, với 32 tương ứng với token "tôi", 1042 tương ứng với "đi", 2524 tương ứng với "làm", và sẽ không có token nào khác tương ứng với 32 ngoài token "tôi" hay không?