Hướng dẫn sử dụng model ChatGPT miễn phí ngay trên máy tính mac/win của bạn
Cụ thể thì 2 model reasoning mà OpenAI hôm nay phát hành là GTP-OSS-120B, 120 tỷ tham số, cần GPU rất mạnh để vận hành và model GPT-OSS-20b, 20 tỷ tham số. Cái 20 tỷ mới là cái chúng ta cần quan tâm bởi nó chạy được trên GPU hay laptop phổ thông, chỉ cần 16GB RAM là chạy được. 2 model này đều phát hành dưới dạng giấy phép Apache 2.0, nghĩa là cho chúng ta tự tải về, triển khai, fine tune và dĩ nhiên là tự kiểm soát dữ liệu, triển khai thương mại mà không bị ràng buộc như Llama của Meta.
Một khi tự host một model, thí dụ như GPT-OSS, chúng ta sẽ đảm bảo mọi data đưa cho model đều được kiểm soát, tuyệt đối riêng tư, không sợ data đi đâu mà chúng ta không biết (thuyết âm mưu là được dùng để train cho model online). Đồng thời chúng ta sẽ xài ChatGPT mà không tốn tiền API hay nộp tiền cho OpenAI. OpenAI hôm nay còn phát hành cả bộ tokenizer gần như là hiệu quả nhất thị trường. Nôm na cho bạn nào lỡ quên thì đây là kỹ thuật bẻ chữ ra thành các đoạn nhỏ hơn và đưa vào model để train / truy vấn. Do tokenizer của OpenAI được phát triển dựa trên ký tự latin nên tiếng Việt của chúng ta chắc chắn được hỗ trợ hiệu quả, không cần phải đi finetune lại bằng tập data tiếng Việt nữa. Cái này thì đi xa quá rồi, nào có dịp mình sẽ share với mọi người về câu chuyện fine tune này nọ nha.