Cả bốn trận đấu tứ kết sáng 6/8 đều có tỷ số 4-0, nhưng chênh lệch nhất thuộc về chiến thắng của o3 trước Kimi K2. Cả bốn ván đều kết thúc không quá tám nước đi, đều vì Kimi K2 đi nước cờ không hợp lệ.
o3 là LLMs sử dụng cho chatbot nổi tiếng ChatGPT, thuộc công ty OpenAI (Mỹ). Kimi K2 là mô hình của công ty Moonshot AI, có trụ sở Trung Quốc.
Chẳng hạn ở ván thứ ba, o3 cầm quân đen, đưa hậu lên e5 chiếu ở nước thứ tám. Kimi K2 nhận thức đúng hết vị trí các quân, và biết rằng nó phải chạy vua hoặc đỡ nước chiếu. Nhưng trong cả bốn lần thử sức, nó đều đi nước cờ không đúng luật. Vì thế, AI Trung Quốc bị xử thua.
![]() |
Thế cờ sau nước 8...Qxe5. Lúc này, AI của Trung Quốc (quân trắng) lần lượt đi bốn nước, là 9.Kf2, 9.Ke2, 9.Nxe5 và 9.Nxe5, đều không hợp lệ. Trong thế cờ này, chỉ có sáu nước cờ hợp lệ cho trắng, là chạy vua lên d2 hoặc đưa hậu, tượng và mã sang cột e để chắn nước chiếu. |
Tỷ lệ nước cờ của o3 trùng công cụ đánh cờ Stockfish trong trận này lần lượt là 96,5%, 95,1%, 100% và 100%. Nhưng thông số này không có nhiều ý nghĩa, vì Kimi K2 thất bại quá sớm.
Ván đầu diễn ra 28 nước cờ, cho đến khi Deepseek đi quân sai luật lần thứ tư. Trong ván hai, o4-mini chiếu hết đối thủ chỉ sau 17 nước cờ. Hai ván còn lại kết thúc sau 25 và 26 nước cờ, trong đó đại diện Mỹ chiếu hết đối thủ ở ván cuối.
Hai mô hình tạo nên ChatGPT tỏa sáng, nhưng gây ấn tượng nhất tứ kết là Grok 4, mô hình của công ty xAI thuộc tỷ phú Elon Musk. Grok 4 có thể được sử dụng để tương tác như chatbot trên X (tên mới của Twitter), với người dùng trả phí. Bại tướng của nó là một sản phẩm của Google, Gemini 2.5 Flash.
Mô hình của ông Musk toàn thắng bốn ván. Nó trừng phạt mọi sai lầm của đối thủ, chẳng hạn như để mất không quân. Tỷ lệ chính xác trong các nước đi của Grok 4 lần lượt là 77,8%, 97,5%, 94,4% và 94,8%, cao nhất vòng đấu, nếu không tính trận đấu giữa o3 và Kimi K2.
Khi bình luận ván đấu, kỳ thủ số hai thế giới Hikaru Nakamura cũng ấn tượng với các nước cờ của Grok 4. "Chắc chắn Grok 4 là LLM đánh cờ mạnh nhất giải này. Chênh lệch trình độ giữa nó và các mô hình khác không nhỏ đâu", anh nói. "Chắc chắn ông Musk sẽ khoe khoang chiến thắng này trên Twitter".
Sau đó, ông Musk chia sẻ lại một bài đăng có hình ảnh Nakamura bình luận trực tuyến, kèm lời bình: "Đây mới chỉ là tác dụng phụ thôi. xAI gần như không dành chút thời gian nào cho cờ vua".
Gemini 2.5 Flask bị loại, nhưng Google vẫn còn một đại diện tại giải, là Gemini 2.5 Pro, với chiến thắng 4-0 trước Claude 4 Opus. Claude là mô hình của công ty Anthropic, có trụ sở tại thành phố San Francisco, bang California. Nó chơi không tồi khi cầm cự khoảng 30 nước trong cả bốn ván, nhưng Gemini 2.5 Pro đơn giản là mạnh hơn.
Vòng bán kết sẽ diễn ra từ 0h30 thứ Năm ngày 7/8, giờ Hà Nội. Grok 4 sẽ gặp Gemini 2.5 Pro. Trận bán kết còn là là derby OpenAI, giữa o3 và o4-mini.
Giải đấu này do Google tổ chức trên nền tảng Kaggle, từ 5/8 đến 7/8, quy tụ 8 LLMs đấu loại trực tiếp để chọn ra nhà vô địch.
LLMs là một loại mô hình trí tuệ nhân tạo (AI), chủ yếu dùng để xử lý ngôn ngữ, dịch thuật hay sáng tạo nội dung. Người dùng có thể tương tác với LLMs thông qua chatbot, như ChatGPT thuộc OpenAI. Về kỹ thuật, LLMs hoạt động theo cách thức "đoán từ tiếp theo".
Xuân Bình