Thứ sáu, 19/09/2025
|
Các mô hình OpenAI phù hợp với hiệu suất của o3 và o3-Mini
OpenAI đã ra mắt GPT-OSS-120B và GPT-OSS-20B cùng lúc. Cả hai mô hình đều cho kết quả tương tự như o3 và o3-mini. Các mô hình này dựa trên thiết kế MoE (Hỗn hợp Chuyên gia).

Hình ảnh : Openai
Thiết kế này giúp chúng nhanh và hiệu quả hơn trong khi sử dụng ít tài nguyên hơn. Các mô hình này được phép sử dụng cho mục đích thương mại và cá nhân theo giấy phép Apache 2.0.
GPT-OSS-120B sử dụng 5,1 tỷ tham số hoạt động cho mỗi token. GPT-OSS-20B sử dụng 3,6 tỷ tham số hoạt động cho mỗi token. Mô hình lớn hơn có tổng cộng 117 tỷ tham số. Phiên bản nhỏ hơn chứa tổng cộng 21 tỷ tham số. Các mô hình này có thể xử lý tối đa 128.000 token có độ dài nội dung. Cả hai mô hình đều được đào tạo chủ yếu bằng văn bản tiếng Anh.
Khóa đào tạo tập trung vào khoa học, lập trình, toán học và các chủ đề chung. Sau khi đào tạo, cả hai mô hình đều được tinh chỉnh nâng cao. OpenAI đã sử dụng học tăng cường để cải thiện kỹ năng của mô hình. Các mô hình đã được kiểm tra và hoạt động tốt trên nhiều tác vụ.
Hỗ trợ công cụ, lý luận và sử dụng cục bộ
OpenAI đã thiết kế những mô hình này phù hợp để sử dụng ngoại tuyến. Chúng hoạt động mà không cần internet hoặc truy cập máy chủ. GPT-OSS-20B chỉ chạy trên 16GB RAM. GPT-OSS-120B có thể chạy trên một GPU Nvidia duy nhất. Điều này giúp chúng rất dễ sử dụng tại nhà hoặc văn phòng.
Các mô hình này hoạt động với API Phản hồi của OpenAI. Chúng cũng phù hợp với các hệ thống dựa trên tác nhân. Chúng có thể chạy mã Python và thực hiện tìm kiếm trên web. Khả năng suy luận của chúng linh hoạt tùy thuộc vào loại tác vụ. Chúng có thể đưa ra câu trả lời nhanh hoặc giải pháp chi tiết từng bước.
Chúng hỗ trợ lập luận chuỗi suy nghĩ để đưa ra lời giải thích rõ ràng. Người dùng có thể thiết lập chúng phản hồi nhanh hoặc sâu. Các mô hình này có sẵn trên Hugging Face, Azure, AWS và Databricks. Bất kỳ ai cũng có thể tải xuống và bắt đầu sử dụng ngay hôm nay.

Kết quả đào tạo an toàn và chuẩn mực
OpenAI đã bổ sung các tính năng an toàn mạnh mẽ vào các mô hình này. Nội dung độc hại đã được lọc trong quá trình đào tạo ban đầu, bao gồm dữ liệu về mối đe dọa hóa học, sinh học và hạt nhân. Các mô hình được thiết kế để loại bỏ các lời nhắc không an toàn hoặc có hại.
Chúng được bảo vệ khỏi việc bị tiêm mã độc và sử dụng sai mục đích. Mặc dù là mã nguồn mở, chúng không thể được tinh chỉnh cho các tác vụ nguy hiểm. GPT-OSS-120B hoạt động rất tốt trong việc mã hóa và sử dụng công cụ. Nó vượt trội hơn o3-mini trong các tác vụ Codeforces và MMLU.
Nó có kết quả thấp hơn một chút trong các bài kiểm tra GPQA Diamond. Nhưng nhìn chung, nó mang lại kết quả mạnh mẽ và đáng tin cậy. Giám đốc điều hành OpenAI, Sam Altman, cho biết nó cũng hoạt động tốt trong các chủ đề về sức khỏe. Những mô hình này cho thấy sự cân bằng tuyệt vời giữa tính an toàn và hiệu suất thông minh.
OpenAI phát hành hai mô hình AI nguồn mở có hiệu năng ngang bằng với o3, o3-mini. Các mô hình này cung cấp khả năng suy luận thông minh, sử dụng ngoại tuyến và hỗ trợ công cụ. Chúng an toàn, nhanh chóng và sẵn sàng cho các nhà phát triển.
Với giấy phép Apache 2.0, người dùng Ấn Độ giờ đây có thể khám phá AI mạnh mẽ. OpenAI đã cung cấp AI tiên tiến cho mọi người sử dụng miễn phí.
Md Guddu