Google DeepMind, phòng thí nghiệm nghiên cứu AI hàng đầu của Google, vừa chính thức công bố rằng hệ thống AI của họ, AlphaGeometry2, đã vượt qua các thí sinh huy chương vàng Olympic Toán quốc tế (IMO) trong việc giải quyết các bài toán hình học. Hệ thống mới này được xem như phiên bản cải tiến của AlphaGeometry, đã được giới thiệu vào tháng 1 năm nay. Theo một nghiên cứu mới được công bố, AlphaGeometry2 đã giải quyết được 84% các bài toán hình học trong Olympic Toán quốc tế trong suốt 25 năm qua, từ 1997 đến 2022. Điều này không chỉ cho thấy khả năng vượt trội của AI trong lĩnh vực toán học mà còn mở ra một cuộc thảo luận mới về tiềm năng của AI trong giải quyết các vấn đề phức tạp hơn.
Lý do mà DeepMind quan tâm đến một kỳ thi toán học cấp trung học có thể nằm trong những thách thức mà các bài toán hình học đặt ra. Việc chứng minh các định lý toán học hay giải thích logic về lý do mà một định lý là đúng, như định lý Pythagore, đòi hỏi không chỉ suy luận mà còn khả năng lựa chọn giữa một loạt các bước để đi đến lời giải. Những kỹ năng giải quyết vấn đề này, theo DeepMind, có thể trở thành thành phần hữu ích trong các mô hình AI tổng quát trong tương lai.
Trong mùa hè vừa qua, DeepMind đã trình diễn một hệ thống kết hợp AlphaGeometry2 với AlphaProof, một mô hình AI dành cho lý luận toán học, để giải quyết bốn trong số sáu bài toán từ IMO 2024. Điều đặc biệt ở đây là tiếp cận này không chỉ dừng lại ở hình học mà còn có thể mở rộng sang các lĩnh vực toán học và khoa học khác, chẳng hạn như hỗ trợ trong các phép tính kỹ thuật phức tạp.
AlphaGeometry2 bao gồm nhiều thành phần cốt lõi, trong đó có một mô hình ngôn ngữ thuộc gia đình AI Gemini của Google và một “công cụ biểu tượng”. Mô hình Gemini giúp công cụ biểu tượng, sử dụng các quy tắc toán học để suy diễn các giải pháp vấn đề, đạt được những chứng minh khả thi cho một định lý hình học nhất định. Hệ thống này hoạt động bằng cách gợi ý các bước và cấu trúc bằng một ngôn ngữ toán học chính thức mà công cụ có thể lấy làm tham chiếu để thực hiện suy diễn.