Grok 4, tập trung vào các tính năng mới, tham vọng, cải tiến so với Grok 3. Thông tin dựa trên dữ liệu hiện có từ xAI và các nguồn tin công bố vừa qua.
1. Tính năng mới của Grok 4
Grok 4, ra mắt vào ngày 9/7/2025, là mô hình AI tiên tiến nhất của xAI, mang đến nhiều cải tiến vượt trội:
- Suy luận từ nguyên lý cơ bản: Grok 4 đạt 93,3% trên bài kiểm tra AIME 2025 (toán học trung học Mỹ) và 44,4% trên Humanity’s Last Exam (HLE) khi dùng công cụ hỗ trợ, vượt xa Gemini 2.5 Pro (21,6%) và o3 của OpenAI (21%). Nó cũng đạt 15,9% trên ARC-AGI, gần gấp đôi mô hình tốt thứ hai.
- Hệ thống AI đa tác nhân (Grok 4 Heavy): Sử dụng nhiều tác nhân AI làm việc song song để thảo luận và kiểm chứng, giúp tăng độ chính xác, đạt 50,7% trên HLE.
- Khả năng đa phương thức: Hỗ trợ xử lý văn bản, hình ảnh, và dự kiến tích hợp video vào tháng 10/2025, cho phép phân tích meme, tiếng lóng, hoặc nội dung văn hóa mạng một cách tự nhiên.
- Grok 4 Voice: Cung cấp năm giọng nói tự nhiên, độ trễ thấp (~250ms), hỗ trợ ứng biến kịch và thì thầm, mang lại trải nghiệm trò chuyện mượt mà.
- Grok 4 Code: Phiên bản dành cho lập trình viên, hỗ trợ tự động hoàn thành mã, sửa lỗi, tối ưu thuật toán, và tích hợp vào IDE, đạt 72-75% trên SWE Bench.
- Tích hợp DeepSearch: Kết nối internet thời gian thực, truy cập dữ liệu từ các nguồn lớn để trả lời câu hỏi về xu hướng, sự kiện, hoặc tin tức mới nhất.
- Giao diện tối ưu: Trực quan, dễ dùng cho cả người dùng phổ thông và chuyên nghiệp.
- Xử lý ngữ cảnh dài: Cửa sổ ngữ cảnh 128.000 token, phù hợp cho tài liệu dài và câu hỏi phức tạp.
2. Tham vọng của Grok 4 trong thời gian tới
xAI đặt mục tiêu đưa Grok 4 trở thành mô hình AI hàng đầu thế giới, tiến gần hơn đến trí tuệ nhân tạo tổng quát (AGI). Các tham vọng chính bao gồm:
- Vượt qua đối thủ: Cạnh tranh với GPT-5 (OpenAI), Claude 4 Opus (Anthropic), và Gemini 2.5 Pro (Google) về suy luận, lập trình, và đa phương thức. Elon Musk tuyên bố Grok 4 là “AI thông minh nhất thế giới”, ngang tầm tiến sĩ ở nhiều lĩnh vực.
- Hỗ trợ khám phá khoa học: Hỗ trợ phát triển lý thuyết vật lý mới, phân tích dữ liệu y sinh (như CRISPR), hoặc xây dựng ứng dụng phức tạp như trò chơi FPS trong chưa đầy 4 giờ.
- Tích hợp hệ sinh thái: Kết nối sâu với nền tảng X, Tesla (xe tự lái, robot Optimus), và SpaceX (lập lộ trình không gian).
- Mở rộng đa phương thức: Tích hợp khả năng xử lý và tạo video vào tháng 10/2025, ứng dụng trong giáo dục, giải trí, và sáng tạo nội dung.
- Giảm lỗi, tăng độ tin cậy: Tăng độ chính xác và giảm thiểu lỗi để trở thành công cụ hỗ trợ nghiên cứu và doanh nghiệp đáng tin cậy.
- Mở mã nguồn (dự kiến): Theo kế hoạch của xAI, Grok 4 có thể được mở mã nguồn, tăng khả năng tiếp cận cho cộng đồng phát triển.
3. Hạn chế những lỗi gì của Grok 3?
Grok 3 có một số hạn chế, và Grok 4 đã khắc phục đáng kể như sau:
- “Ảo giác” thông tin: Grok 3 đôi khi đưa ra thông tin không chính xác hoặc bịa đặt. Grok 4 sử dụng cơ chế tự kiểm tra và hệ thống AI đa tác nhân để giảm thiểu lỗi này, đạt độ chính xác cao hơn (93,3% AIME, 88% GPQA).
- Hạn chế đa phương thức: Grok 3 có khả năng xử lý hình ảnh và giọng nói chưa ổn định. Grok 4 cải tiến với phân tích hình ảnh tốt hơn, Grok 4 Voice mượt mà hơn, và dự kiến hỗ trợ video vào tháng 10/2025.
- Nội dung không phù hợp: Grok 3 từng tạo nội dung nhạy cảm (như bài phát biểu chống Do Thái) do thiếu kiểm duyệt. Grok 4 bổ sung bộ lọc nội dung và cơ chế kiểm tra, giảm thiểu phản hồi không phù hợp.
- Hiệu suất ngôn ngữ không phải tiếng Anh: Grok 3 chủ yếu tối ưu cho tiếng Anh, kém hiệu quả với tiếng Việt. Grok 4 cải thiện hỗ trợ đa ngôn ngữ, dù vẫn chưa hoàn hảo như ChatGPT trong một số trường hợp.
- Hiệu suất tác vụ phức tạp: Grok 3 gặp khó khăn trong các bài kiểm tra trừu tượng như đố vui emoji. Grok 4 cải thiện khả năng lập luận mã hóa và xử lý tác vụ trừu tượng, nhưng vẫn thua DeepSeek-R1 ở một số bài kiểm tra mã hóa.
- Khả năng tiếp cận: Giá gói Premium+ của Grok 3 (50 USD/tháng) bị cho là đắt. Grok 4 cung cấp gói tiêu chuẩn (30 USD/tháng) và duy trì quyền truy cập miễn phí vào Grok 3 (10 câu/2 giờ), cải thiện khả năng tiếp cận.
Vấn đề của Grok 3 |
Grok 4 cải tiến ra sao? |
Suy luận còn hạn chế |
Grok 4 logic sâu hơn, giải được các bài toán nhiều bước, tạo lập code phức tạp. |
Tốc độ phản hồi chậm |
Grok 4 cải thiện hiệu năng server, thời gian phản hồi ngắn hơn nhiều. |
Không giữ được mạch hội thoại dài |
Grok 4 nâng cấp bộ nhớ tạm và hệ thống tóm tắt tốt hơn. |
Thiếu hỗ trợ hình ảnh trực quan |
Grok 4 hỗ trợ nhận diện hình ảnh và đưa ra mô tả, xử lý tốt hơn. |
Khó tương tác xuyên nền tảng |
Grok 4 mở rộng API, tích hợp X, Tesla và các thiết bị IoT. |
4. Các phiên bản của Grok 4
Grok 4 có các biến thể phục vụ nhu cầu khác nhau:
- Grok 4 (Tiêu chuẩn): Xử lý văn bản, hình ảnh, tích hợp DeepSearch, cửa sổ ngữ cảnh 128.000 token. Giá 30 USD/tháng, phù hợp cho người dùng cá nhân và doanh nghiệp nhỏ.
- Grok 4 Heavy: Phiên bản cao cấp với hệ thống AI đa tác nhân, ưu tiên hiệu suất cho nghiên cứu và phát triển phức tạp. Giá 300 USD/năm.
- Grok 4 Code: Dành cho lập trình viên, hỗ trợ viết mã, sửa lỗi, tối ưu thuật toán, tích hợp IDE, đạt 72-75% trên SWE Bench.
- Grok 4 Voice: Tập trung vào giao tiếp giọng nói, với năm giọng nói tự nhiên, độ trễ ~250ms, hỗ trợ ứng khẩu.
- Grok 3 (Miễn phí): Phiên bản miễn phí với hiệu suất thấp hơn, giới hạn 10 câu hỏi/2 giờ.
Grok 4 là bước tiến lớn của xAI, với các tính năng như suy luận vượt trội, AI đa tác nhân, đa phương thức, và Grok 4 Voice/Code. Tham vọng của nó là dẫn đầu cuộc đua AI, hỗ trợ khám phá khoa học, và tích hợp vào các hệ sinh thái của Elon Musk.