CEO của chatbot AI nhất nhì thế giới thừa nhận: Chẳng ai hiểu AI hoạt động như thế nào

Khi chúng ta không hiểu rõ công cụ của mình, liệu nó có an toàn để sử dụng?

Trong một bài viết gây chấn động vừa được đăng tải trên trang web cá nhân, Dario Amodei - CEO của Anthropic, công ty đứng sau chatbot Claude - đã công khai thừa nhận một sự thật khó tin: không ai thực sự hiểu rõ cách AI hoạt động. Tuyên bố này đến từ người đứng đầu một trong những phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới, khiến nhiều người ngạc nhiên và lo ngại về công nghệ đang thay đổi cuộc sống hàng ngày của chúng ta.

" Khi một hệ thống AI tạo sinh thực hiện một việc gì đó, như tóm tắt một tài liệu tài chính, chúng ta không hề biết, ở mức độ cụ thể hay chính xác, tại sao nó đưa ra những lựa chọn đó - tại sao nó chọn từ ngữ này thay vì từ ngữ khác, hoặc tại sao đôi khi nó mắc lỗi dù thường xuyên chính xác ," CEO Anthropic viết.

Ông tiếp tục thừa nhận rằng những người ngoài ngành AI có thể ngạc nhiên khi biết rằng ngay cả những người xây dựng công nghệ cũng " không hiểu cách hoạt động của chính những sáng tạo AI của họ" và bất kỳ ai lo ngại về sự thiếu hiểu biết này đều "có quyền lo lắng ."

Để giải quyết vấn đề này, Amodei đã công bố kế hoạch tạo ra một "MRI cho AI" trong thập kỷ tới. Mục tiêu không chỉ là tìm hiểu cơ chế hoạt động của công nghệ, mà còn ngăn chặn bất kỳ mối nguy hiểm không lường trước nào liên quan đến bản chất bí ẩn hiện tại của nó. Theo ông, "sự thiếu hiểu biết này về cơ bản là chưa từng có trong lịch sử công nghệ."

Điều này phần nào giải thích lý do Amodei và chị gái Daniela rời OpenAI vào cuối năm 2020 giữa những lo ngại về các thực hành an toàn của công ty do Sam Altman điều hành. Cụ thể, họ lo ngại rằng OpenAI đang gạt bỏ những quan ngại về an toàn để theo đuổi lợi nhuận. Amodei cùng năm đồng nghiệp cũ từ OpenAI đã thành lập Anthropic vào năm sau đó với mục tiêu xây dựng AI an toàn hơn - và một phần công việc này dường như tập trung vào việc tìm hiểu cơ chế hoạt động của công nghệ.

Trong những tháng gần đây, Amodei cho biết Anthropic không chỉ tập trung vào việc giúp "điều hướng" AI theo hướng có lợi cho nhân loại, mà còn nghiên cứu "khả năng hấp dẫn" rằng các nhà nghiên cứu cuối cùng có thể hiểu được cách hoạt động bên trong của các hệ thống này " trước khi các mô hình đạt đến mức độ sức mạnh áp đảo ."

Để minh họa cho những nỗ lực này, CEO Anthropic đã chia sẻ về một thí nghiệm gần đây của công ty. Trong thí nghiệm, một "đội đỏ" cố tình đưa vào một vấn đề trong một mô hình AI (chẳng hạn như xu hướng khai thác lỗ hổng trong một nhiệm vụ) và giao cho các "đội xanh" nhiệm vụ tìm ra điều gì sai với nó. Nhiều đội xanh đã thành công trong việc phát hiện vấn đề, một số thậm chí đã áp dụng hiệu quả các công cụ diễn giải trong quá trình điều tra.

Mặc dù còn nhiều việc phải làm để mở rộng quy mô các "công cụ" này, nhưng thật thú vị khi biết rằng những người tại đối thủ lớn nhất của OpenAI không chỉ đang nỗ lực phát triển AI tiên tiến hơn, mà còn tự giao cho mình nhiệm vụ tìm hiểu lý do và cách thức hoạt động của nó.

"AI mạnh mẽ sẽ định hình vận mệnh của nhân loại," Amodei kết luận, "và chúng ta xứng đáng hiểu được những sáng tạo của chính mình trước khi chúng biến đổi triệt để nền kinh tế, cuộc sống và tương lai của chúng ta." Lời cảnh báo này từ người trong cuộc đặt ra câu hỏi về trách nhiệm của các công ty công nghệ trong việc phát triển những hệ thống mà họ chưa thực sự hiểu rõ, đồng thời nhấn mạnh tầm quan trọng của việc nghiên cứu sâu hơn về cách hoạt động nội tại của AI trước khi công nghệ này trở nên quá mạnh để kiểm soát.

Nguồn CafeF: https://cafef.vn/ceo-cua-chatbot-ai-nhat-nhi-the-gioi-thua-nhan-chang-ai-hieu-ai-hoat-dong-nhu-the-nao-188250507100245466.chn

Tin liên quan

Hơn 1.000 mã QR được dán khắp nơi tại một phường ở Thanh Hóa

Phía sau những mã QR này là nỗ lực của công an địa phương trong việc hỗ trợ người dân thực hiện dịch vụ công trực tuy

CafeF 8 giờ trước

Sau Mỹ và Canada, Việt Nam là một trong ba thị trường châu Á đầu tiên được OpenAI ưu ái làm điều này

OpenAI vừa chính thức ra mắt ứng dụng Sora tại Việt Nam, đánh dấu bước mở rộng quan trọng của nền tảng tạo video bằng

CafeF 13 giờ trước

Hơn 850 nhân vật có tầm ảnh hưởng kêu gọi cấm phát triển 'siêu trí tuệ' AI

Danh sách những người ký tên vào bản kiến nghị có cả hai “cha đẻ" của trí tuệ nhân tạo hiện đại – Yoshua Bengio và Ge

CafeF 13 giờ trước

Người dùng nên bật những tính năng này trên Zalo để tránh bị theo dõi hoặc chiếm quyền truy cập

Người dùng có thể tham khảo một số thiết lập bảo mật dưới đây nhằm tăng cường an toàn khi sử dụng Zalo hằng ngày.

CafeF 13 giờ trước

Quan sát camera ở nhà thấy bố mẹ nói chuyện điện thoại với biểu hiện sợ hãi, người đàn ông Hà Nội nhanh chóng báo Công an

Theo Công an TP.

CafeF 13 giờ trước

Người dân có thể đóng góp ý kiến đối với dự thảo các Văn kiện Đại hội XIV của Đảng tại nhà, ngay trên VNeID

Công an tỉnh Đồng Tháp hướng dẫn người dân đóng góp ý kiến đối với dự thảo các Văn kiện Đại hội XIV của Đảng trên ứng

CafeF 14 giờ trước

Trung Quốc phát triển robot 'tàng hình' để thăm dò vùng biển sâu

Các nhà khoa học Trung Quốc đã phát triển một robot sinh học hình sứa có khả năng thực hiện các nhiệm vụ bí mật dưới

CafeF 14 giờ trước

Tài khoản VNeTraffic hiển thị phương tiện cũ không còn sở hữu, người dùng cần làm gì?

Một số người dùng VNeTraffic phát hiện các phương tiện cũ không còn sở hữu nhưng vẫn hiển thị thông tin trên ứng dụng

CafeF 14 giờ trước

Phát hiện kho báu đất hiếm lên tới 11 triệu tấn dưới hố chất thải nhưng chỉ Mỹ được tiếp cận, còn Trung Quốc thì không thể

Mỹ phát hiện kho báu đất hiếm trong bãi tro than và phải dùng công nghệ cao để khai thác.

CafeF 15 giờ trước

Bộ Công an vừa lập kỳ tích mới

Theo Cổng thông tin điện tử Bộ Công an, Bộ tiếp tục lập nên kỳ tích, đột phá mới về chuyển đổi số trong Công an nhân

CafeF 15 giờ trước

Hơn 1 triệu người dùng ChatGPT có ý định tự sát mỗi tuần

Theo ước tính của ứng dụng ChatGPT, mỗi tuần, có hơn 1 triệu người dùng gửi tin nhắn về kế hoạch tự sát hoặc có ý địn

CafeF 15 giờ trước

Trung Quốc chế tạo robot hình người rẻ hơn cả smartphone như thế nào?

Một công ty khởi nghiệp Trung Quốc vừa khiến giới công nghệ sửng sốt khi giới thiệu robot hình người có giá chỉ tương

CafeF 15 giờ trước

Việt Nam chốt làm siêu dự án lớn nhất lịch sử, Trung Quốc 6 lần ngỏ ý, Nhật Bản 4 lần đánh tiếng, Hàn muốn trao công nghệ, công nghệ đằng sau có gì?

Việt Nam đang đẩy nhanh triển khai siêu dự án đường sắt cao tốc đầu tiên.

CafeF 16 giờ trước

Bách khoa toàn thư AI cạnh tranh với Wikipedia của Elon Musk có gì khác biệt?

Tỷ phú Elon Musk vừa cho ra mắt Grokipedia, phiên bản bách khoa toàn thư trực tuyến, cạnh tranh với Wikipedia do chín

CafeF 16 giờ trước

Meta sẽ chi kỷ lục 70 tỷ USD cho giấc mơ siêu trí tuệ nhân tạo

Phần lớn ngân sách khổng lồ sẽ được dành để xây dựng các trung tâm dữ liệu quy mô toàn cầu, phát triển chip chuyên dụ

CafeF 17 giờ trước

CEO của chatbot AI nhất nhì thế giới thừa nhận: Chẳng ai hiểu AI hoạt động như thế nào

Tin liên quan

Tin nổi bật