Viettel AI Challenge: Image Translation Forum

Go back to competition Back to thread list Post in this thread

> Các loại mô hình hợp lệ và inference trên dữ liệu private test

Kính gửi BTC,

Theo như quy định của BTC về viêc sử dụng các mô hình diffusion, thì em có các câu hỏi như sau ạ:
1. Ý của BTC tức là toàn bộ các mô hình biến thể có sử dụng phương pháp diffusion, đều chỉ được phép sử dụng pretrained của stable-diffusion-v1-4 đúng không ạ? Vì em biết có một vài mô hình không phải stable-diffusion nhưng trong đó có sử dụng phương pháp diffusion thì cũng sẽ không hợp lệ đúng không ạ?
2. Nếu chúng em sử dụng pretrained để finetune thì có hợp lệ hay không?
3. Nếu trong trường hợp (2) không hợp lệ thì việc huấn luyện trên mô hình gốc mà không sử dụng pretrained có hợp lệ hay không?
4. Về việc inference trên tập private test, nếu tập private test được cung cấp cho các đội thi, thì chúng em có được phép sử dụng private test để huấn luyện chung vào mô hình hoặc là gán nhãn thủ công bằng tay private test để phục vụ cho việc đạt kết quả inference cao nhất hay không ạ? Hay là chúng em có thể làm bất cứ điều gì với private test miễn là không điều chỉnh kết quả được sinh ra từ mô hình. Vì em đang thấy trong rule BTC không nói rõ ràng phần này ạ.

Em mong BTC làm rõ các thắc mắc trên của chúng em, em xin cảm ơn BTC ạ.

Posted by: duongnh32 @ Nov. 7, 2024, 9:46 a.m.

Em cũng có chung câu hỏi số 4. Ví dụ bây giờ em gán nhãn tay bounding box hoặc caption, rồi chạy qua mô hình sinh ra một cách tự động không chỉnh sửa. Vậy đây có được tính là hợp lệ hay không?

Posted by: duonglh9 @ Nov. 7, 2024, 10:20 a.m.

Thưa ban tổ chức, từ câu hỏi 2+3 của bạn trên và câu trả lời của ban tổ chức, thì em vẫn chưa rõ ràng lắm. Em có thể lấy 1 ví dụ cụ thể là giả sử em muốn sử dụng mô hình stable diffusion 2.0, thì em có thể fine-tuning với pretrained của mô hình rồi sử dụng được không ạ? Hay là em cần phải train lại mô hình stable diffusion 2.0 từ đầu thì sẽ hợp lệ để sử dụng ạ?

Posted by: TNam @ Nov. 8, 2024, 1:20 a.m.

1. Ý của BTC tức là toàn bộ các mô hình biến thể có sử dụng phương pháp diffusion, đều chỉ được phép sử dụng pretrained của stable-diffusion-v1-4 đúng không ạ? Vì em biết có một vài mô hình không phải stable-diffusion nhưng trong đó có sử dụng phương pháp diffusion thì cũng sẽ không hợp lệ đúng không ạ?
2. Nếu chúng em sử dụng pretrained để finetune thì có hợp lệ hay không?
3. Nếu trong trường hợp (2) không hợp lệ thì việc huấn luyện trên mô hình gốc mà không sử dụng pretrained có hợp lệ hay không?
4. Về việc inference trên tập private test, nếu tập private test được cung cấp cho các đội thi, thì chúng em có được phép sử dụng private test để huấn luyện chung vào mô hình hoặc là gán nhãn thủ công bằng tay private test để phục vụ cho việc đạt kết quả inference cao nhất hay không ạ? Hay là chúng em có thể làm bất cứ điều gì với private test miễn là không điều chỉnh kết quả được sinh ra từ mô hình. Vì em đang thấy trong rule BTC không nói rõ ràng phần này ạ.

1. Đề nói rất rõ, nếu muốn sử dụng pretrained diffusion model, các bạn chỉ được sử dụng các phiên bản mà BTC cung cấp, nếu bạn muốn sử dụng các phương pháp diffusion khác ngoài stable diffusion, các bạn sẽ phải train lại. Việc này không khó vì có rất nhiều dataset được public.
2 + 3: Bạn có thể finetune, train lại từ đầu, ..., nhưng technical report phải nói rõ và model bạn sử dụng phải được reproduce lại được từ code được submit.
4. Việc thêm gán nhãn thủ công bằng tay như vậy không hợp lệ các bạn nhé. Nếu làm như vậy được chấp nhận thì tôi có thể làm như sau để lách luật, tôi dùng photoshop để sửa tất cả ảnh test bằng tay sau đó đưa qua một mô hình đồng nhất (Identity model f(x) = x).

Posted by: ViettelAIChallenge @ Nov. 8, 2024, 5:42 a.m.

2 + 3: Bạn có thể finetune, train lại từ đầu, ..., nhưng technical report phải nói rõ và model bạn sử dụng phải được reproduce lại được từ code được submit.
BTC cho em hỏi thêm về việc finetune các model diffusion KHÔNG thuộc các phiên bản được chấp nhận:
Việc train các thành phần đi kèm với stable diffusion như lora, ip-adapter, controlnet... có được xem là finetune/train lại từ đầu hay không? Ví dụ em train lora, controlnet, ip-adapter... dựa trên SDXL, sau đó kết hợp với SDXL hoặc một phiên bản stable diffusion khác để sinh ảnh thì cách làm này có được xem là hợp lệ hay không ạ?
Em xin cảm ơn!

Posted by: lucnq1 @ Nov. 8, 2024, 8:31 a.m.

Đề đã ghi rất rõ rồi mà bạn. Bạn train các thành phần đi kèm hay làm bất cứ điều gì sử dụng pretrained diffusion model khác ngoài 4 phiên bản btc cung cấp cũng không hợp lệ.

Posted by: ViettelAIChallenge @ Nov. 9, 2024, 12:18 a.m.
Post in this thread