AI cần 92.000 năm mới học ngôn ngữ giỏi bằng… một đứa trẻ

Một nghiên cứu mới đã ước tính rằng hệ thống công nghệ AI như ChatGPT cần tới 92.000 năm mới có thể đạt tốc độ học ngôn ngữ tương đương một đứa trẻ bình thường.
Nghiên cứu mới từ giáo sư Caroline Rowland tại Viện Tâm lý học ngôn ngữ Max Planck (Hà Lan) chỉ ra rằng trẻ em học ngôn ngữ hiệu quả hơn rất nhiều so với công nghệ AI hiện nay.
Trẻ không chỉ hấp thụ ngôn ngữ mà tự xây dựng hệ thống thông qua tương tác, cảm xúc và trải nghiệm sống động.Trong khi đó, công nghệ AI vẫn gặp khó khăn trong việc kết nối thông tin đa giác quan.
Nghiên cứu này không chỉ giúp hiểu rõ sự phát triển ngôn ngữ ở trẻ mà còn mở ra hướng đi mới cho việc cải tiến công nghệ AI trong tương lai.
Trẻ em "sống trong ngôn ngữ", AI chỉ "xử lý dữ liệu"
Theo giáo sư Rowland, trẻ em "sống trong ngôn ngữ", còn AI chỉ "xử lý dữ liệu". Chính sự tham gia chủ động vào thế giới: từ việc bò, chạm, nghe, nhìn, cho đến hỏi han và bắt chước đã giúp não bộ trẻ kết nối ngôn ngữ với cảm xúc, cử chỉ và ngữ cảnh một cách tự nhiên.
Thậm chí, nghiên cứu ước tính rằng một hệ thống AI như ChatGPT cần tới 92.000 năm mới có thể đạt tốc độ học ngôn ngữ tương đương một đứa trẻ bình thường.
Các nhà khoa học đã tìm ra lời giải thích cho lý do vì sao trẻ em học ngôn ngữ nhanh và hiệu quả hơn nhiều so với các hệ thống trí tuệ nhân tạo (AI). Theo đó, não bộ con người sở hữu những cơ chế học tập đặc biệt mà máy móc vẫn chưa thể mô phỏng, tập trung vào ba điểm khác biệt then chốt: cách tiếp nhận thông tin, sự tương tác xã hội và cơ chế tự kiến tạo ngôn ngữ.
Trẻ em không chỉ học ngôn ngữ từ dữ liệu văn bản mà còn kết hợp thông tin từ nhiều giác quan cùng lúc: nghe, nhìn, chạm, thậm chí ngửi và nếm. Ví dụ, khi một em bé học từ "con chó", não bộ đồng thời ghi nhớ âm thanh tiếng sủa, hình ảnh của chú chó, cảm giác bộ lông mềm và cả cảm xúc vui vẻ khi chơi cùng.
Chính sự kết hợp đa tầng này giúp trẻ hiểu và ghi nhớ ngôn ngữ một cách sâu sắc, tạo ra những liên kết giữa âm thanh, hình ảnh, cảm xúc và ý nghĩa. Trong khi đó, các hệ thống AI hiện nay vẫn chủ yếu xử lý dữ liệu văn bản tĩnh và thiếu khả năng kết nối thông tin từ nhiều giác quan, điều khiến máy móc khó đạt đến độ hiểu biết tự nhiên như con người.
Bối cảnh "học" khác nhau
Một yếu tố then chốt khác nằm ở việc trẻ học ngôn ngữ trong ngữ cảnh sống động. Khi cha mẹ đọc sách, khi chỉ tay hỏi về một con chim trên bầu trời hay khi chơi cùng bạn bè, trẻ liên tục tiếp nhận thông tin từ âm thanh, hình ảnh, cử chỉ và cảm xúc. Điều này giúp não bộ hình thành mạng lưới kết nối phong phú, từ đó học và vận dụng ngôn ngữ tự nhiên hơn.
Ngược lại, AI học từ dữ liệu văn bản tĩnh và thiếu yếu tố cảm xúc, cử chỉ, sắc thái xã hội, những thành phần cốt lõi giúp con người diễn đạt và thấu hiểu ngôn ngữ.
Bên cạnh đó, trẻ em không "nạp sẵn" kiến thức như AI mà tự xây dựng hệ thống ngôn ngữ của riêng mình thông qua thử nghiệm và sai sót.
Chẳng hạn trẻ có thể tự thêm những từ ngữ thể hiện một hành động trong thì quá khứ dù chưa từng được dạy chính thức, như từ "đã…rồi": "Con đã ăn cơm rồi ạ". Đây là quá trình kiến tạo từng bước, phát triển liên tục và hoàn thiện theo thời gian, một khả năng mà AI vẫn chưa thể tái tạo.