OpenAI phát hành hai mô hình AI nguồn mở: Mọi thứ bạn cần biết

Thứ sáu, 19/09/2025

Các mô hình OpenAI phù hợp với hiệu suất của o3 và o3-Mini

OpenAI đã ra mắt GPT-OSS-120B và GPT-OSS-20B cùng lúc. Cả hai mô hình đều cho kết quả tương tự như o3 và o3-mini. Các mô hình này dựa trên thiết kế MoE (Hỗn hợp Chuyên gia).

Hình ảnh : Openai

Thiết kế này giúp chúng nhanh và hiệu quả hơn trong khi sử dụng ít tài nguyên hơn. Các mô hình này được phép sử dụng cho mục đích thương mại và cá nhân theo giấy phép Apache 2.0.

GPT-OSS-120B sử dụng 5,1 tỷ tham số hoạt động cho mỗi token. GPT-OSS-20B sử dụng 3,6 tỷ tham số hoạt động cho mỗi token. Mô hình lớn hơn có tổng cộng 117 tỷ tham số. Phiên bản nhỏ hơn chứa tổng cộng 21 tỷ tham số. Các mô hình này có thể xử lý tối đa 128.000 token có độ dài nội dung. Cả hai mô hình đều được đào tạo chủ yếu bằng văn bản tiếng Anh.

Khóa đào tạo tập trung vào khoa học, lập trình, toán học và các chủ đề chung. Sau khi đào tạo, cả hai mô hình đều được tinh chỉnh nâng cao. OpenAI đã sử dụng học tăng cường để cải thiện kỹ năng của mô hình. Các mô hình đã được kiểm tra và hoạt động tốt trên nhiều tác vụ.

Hỗ trợ công cụ, lý luận và sử dụng cục bộ

OpenAI đã thiết kế những mô hình này phù hợp để sử dụng ngoại tuyến. Chúng hoạt động mà không cần internet hoặc truy cập máy chủ. GPT-OSS-20B chỉ chạy trên 16GB RAM. GPT-OSS-120B có thể chạy trên một GPU Nvidia duy nhất. Điều này giúp chúng rất dễ sử dụng tại nhà hoặc văn phòng.

Các mô hình này hoạt động với API Phản hồi của OpenAI. Chúng cũng phù hợp với các hệ thống dựa trên tác nhân. Chúng có thể chạy mã Python và thực hiện tìm kiếm trên web. Khả năng suy luận của chúng linh hoạt tùy thuộc vào loại tác vụ. Chúng có thể đưa ra câu trả lời nhanh hoặc giải pháp chi tiết từng bước.

Chúng hỗ trợ lập luận chuỗi suy nghĩ để đưa ra lời giải thích rõ ràng. Người dùng có thể thiết lập chúng phản hồi nhanh hoặc sâu. Các mô hình này có sẵn trên Hugging Face, Azure, AWS và Databricks. Bất kỳ ai cũng có thể tải xuống và bắt đầu sử dụng ngay hôm nay.

Kết quả đào tạo an toàn và chuẩn mực

OpenAI đã bổ sung các tính năng an toàn mạnh mẽ vào các mô hình này. Nội dung độc hại đã được lọc trong quá trình đào tạo ban đầu, bao gồm dữ liệu về mối đe dọa hóa học, sinh học và hạt nhân. Các mô hình được thiết kế để loại bỏ các lời nhắc không an toàn hoặc có hại.

Chúng được bảo vệ khỏi việc bị tiêm mã độc và sử dụng sai mục đích. Mặc dù là mã nguồn mở, chúng không thể được tinh chỉnh cho các tác vụ nguy hiểm. GPT-OSS-120B hoạt động rất tốt trong việc mã hóa và sử dụng công cụ. Nó vượt trội hơn o3-mini trong các tác vụ Codeforces và MMLU.

Nó có kết quả thấp hơn một chút trong các bài kiểm tra GPQA Diamond. Nhưng nhìn chung, nó mang lại kết quả mạnh mẽ và đáng tin cậy. Giám đốc điều hành OpenAI, Sam Altman, cho biết nó cũng hoạt động tốt trong các chủ đề về sức khỏe. Những mô hình này cho thấy sự cân bằng tuyệt vời giữa tính an toàn và hiệu suất thông minh.

OpenAI phát hành hai mô hình AI nguồn mở có hiệu năng ngang bằng với o3, o3-mini. Các mô hình này cung cấp khả năng suy luận thông minh, sử dụng ngoại tuyến và hỗ trợ công cụ. Chúng an toàn, nhanh chóng và sẵn sàng cho các nhà phát triển.

Với giấy phép Apache 2.0, người dùng Ấn Độ giờ đây có thể khám phá AI mạnh mẽ. OpenAI đã cung cấp AI tiên tiến cho mọi người sử dụng miễn phí.

Md Guddu

Technology Central Công nghệ mới

Tin liên quan

Chuyện xảy ra khi Cookie dần biến mất Công Nghệ Theo Dõi nào sẽ thay thế?

06/10/2025

Cookie – những "tệp nhỏ" được lưu lại trên trình duyệt của bạn – từ lâu đã là xương sống cho việc theo dõi người dùng trên Internet. Chúng giúp các doanh nghiệp hiểu bạn là ai, bạn thích gì và quảng cáo gì nên hiện ra với bạn. Nhưng cookie, đặc biệt là third-party cookies (cookie của bên thứ ba), đang dần bị khai tử.

Chi tiết

Chatbot và sự phát triển của Công Nghệ AI trong dịch vụ Khách Hàng

29/07/2024

Trong những năm gần đây, công nghệ AI (Trí tuệ nhân tạo) đã có những bước tiến vượt bậc, đặc biệt trong lĩnh vực dịch vụ khách hàng. Một trong những ứng dụng nổi bật của AI chính là chatbot – những phần mềm được lập trình để tương tác và trò chuyện với con người. Với sự gia tăng của công nghệ, chatbot đã trở thành một công cụ quan trọng trong việc giải quyết các thắc mắc của khách hàng, mang lại nhiều lợi ích cho doanh nghiệp cũng như người tiêu dùng.

Chi tiết

Nguyên nhân khiến mạng xã hội Facebook sập toàn cầu đã phần nào được hé lộ, dù hãng điều hành Meta vẫn còn kín tiếng về vụ việc này

08/03/2024

Nhóm tin tặc (hacker) nào đã nhận trách nhiệm...

Chi tiết

Thông tin doanh nghiệp

Cơ cấu tổ chức

Sứ mệnh tầm nhìn