Viettel AI Challenge: Classification of Encrypted Texts Forum

Go back to competition Back to thread list Post in this thread

> Về việc token đã được mã hóa

Gửi BTC,
Cho em hỏi, mỗi token trong bộ dữ liệu train, private test mà ban tổ chức cung cấp là duy nhất?. Ví dụ: "32 1042 2524" có thể là câu "tôi đi làm". Giả sử mỗi từ trong câu trên được coi là 1 token, với 32 tương ứng với token "tôi", 1042 tương ứng với "đi", 2524 tương ứng với "làm", và sẽ không có token nào khác tương ứng với 32 ngoài token "tôi" hay không?

Posted by: tienpm @ Oct. 30, 2024, 9:06 a.m.
Post in this thread