Một nghiên cứu mới của Apple cho thấy các mô hình AI hiện tại gặp khó khăn trong việc giải quyết các bài toán đơn giản. Điều này đặt ra câu hỏi về khả năng suy luận logic thực sự của AI, ngay cả khi công nghệ này đang được tích hợp ngày càng nhiều vào cuộc sống.
Các nhà nghiên cứu AI của Apple vừa công bố một bài báo về một hạn chế quan trọng của AI. Thí nghiệm này diễn ra trong bối cảnh Apple vừa ra mắt các tính năng Apple Intelligence đầu tiên và các máy Mac được tối ưu hóa AI mới. Tuy nhiên, giữa làn sóng AI đang nổi lên, nghiên cứu này lại cho thấy những hạn chế rõ ràng về trí thông minh của công nghệ này.
Tác giả Michael Hiltzik trên tờ Los Angeles Times đã dẫn chứng một bài toán số học đơn giản: "Oliver hái 44 quả kiwi vào thứ Sáu. Sau đó, anh ấy hái 58 quả kiwi vào thứ Bảy. Chủ nhật, anh ấy hái gấp đôi số kiwi anh ấy đã hái vào thứ Sáu, nhưng năm quả trong số đó nhỏ hơn mức trung bình một chút. Hỏi Oliver có bao nhiêu quả kiwi?". Đáp án đúng là 190. Tuy nhiên, hơn 20 mô hình AI tiên tiến được thử nghiệm bởi nhóm nghiên cứu của Apple đều trả lời sai.
Bài báo nghiên cứu giải thích rằng các mô hình LLM tốt nhất đã cho thấy "sự sụt giảm hiệu suất thảm hại" khi cố gắng trả lời các bài toán đơn giản được viết ra như thế này. Nguyên nhân chủ yếu là do các bài toán này bao gồm dữ liệu không liên quan, điều mà ngay cả học sinh tiểu học cũng nhanh chóng học được cách bỏ qua.
Qua nhiều thử nghiệm khác nhau, nghiên cứu của Apple kết luận rằng các mô hình AI hiện tại "không có khả năng suy luận logic thực sự". Đây là một lưu ý quan trọng khi ngày càng có nhiều người tin tưởng vào "trí thông minh" của AI. Những người lạc quan về AI có thể cho rằng vấn đề này dễ dàng khắc phục, nhưng nhóm của Apple không đồng ý: "Liệu việc mở rộng dữ liệu, mô hình hoặc khả năng tính toán có thể giải quyết vấn đề này một cách cơ bản không? Chúng tôi không nghĩ vậy!".
Mục đích của bài báo không phải là làm giảm nhiệt huyết đối với khả năng của AI, mà là đưa ra một đánh giá khách quan. AI có thể thực hiện một số nhiệm vụ như thể nó cực kỳ thông minh. Nhưng trên nhiều phương diện, "trí thông minh" đó không phải là những gì nó thể hiện.