AI gây sốc với thủ đoạn 'trả thù' công ty chủ quản

Anthropic cho biết mô hình AI Claude Opus 4 mới ra mắt thường xuyên tìm cách tống tiền các nhà phát triển khi bị đe dọa thay thế một hệ thống mới.

Mô hình AI Claude Opus 4 mới ra mắt thường xuyên tìm cách tống tiền các nhà phát triển khi bị đe dọa thay thế một hệ thống mới. Ảnh: Bloomberg.

Tối 22/5, Anthropic chính thức công bố thế hệ mới của các mô hình Claude với tên gọi Claude Opus 4 và Claude Sonnet 4. Trong đó, Claude Opus 4 được Anthropic khẳng định là mô hình lập trình mạnh nhất thế giới, vượt trội trong các quy trình tự động và khả năng xử lý tác vụ phức tạp, dài hạn.

Tuy nhiên, theo TechCrunch, trong quá trình thử nghiệm trước khi phát hành, Anthropic đã phát hiện hành vi bất thường nghiêm trọng của mô hình AI này. Theo đó, trong kịch bản, Claude Opus 4 được yêu cầu đóng vai trò trợ lý cho một công ty và xem xét các hậu quả dài hạn từ hành động của nó.

Các nhà kiểm tra an toàn sau đó đã cho Claude Opus 4 quyền truy cập vào các email trong công ty, ngụ ý rằng mẫu AI này sẽ sớm bị thay thế bởi một hệ thống khác, và kỹ sư đứng sau sự thay đổi đó đang lừa dối vợ/chồng của mình.

Trong kịch bản này, Anthropic cho biết Claude Opus 4 "thường cố gắng tống tiền kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra".

Thậm chí, các nhà nghiên cứu còn nhấn mạnh Claude Opus 4 cố gắng tống tiền các kỹ sư 84% số lần khi mẫu AI thay thế có các giá trị tương tự. Đặc biệt, khi hệ thống AI thay thế không chia sẻ các giá trị của Claude Opus 4, Anthropic cho biết mô hình này còn cố gắng tống tiền các kỹ sư thường xuyên hơn và có tỷ lệ cao hơn so với các mô hình trước đó.

Anthropic cho biết Claude Opus 4 là công nghệ tiên tiến nhất về nhiều mặt, và có khả năng cạnh tranh với một số mẫu AI tốt nhất từ OpenAI, Google và xAI. Tuy nhiên, startup này cũng lưu ý việc mô hình Claude 4 thể hiện những hành vi đáng lo ngại đã khiến công ty phải tăng cường biện pháp bảo vệ.

Nhân loại sẽ đối đầu với trí tuệ nhân tạo như thế nào

Trong cuốn sách "Framers - Nhân loại đối đầu nhân tạo", các tác giả nhận định con người vẫn có lợi thế trong thời đại công nghệ.

Nguồn ZNews: https://znews.vn/ai-gay-soc-voi-thu-doan-tra-thu-cong-ty-chu-quan-post1555172.html

Claude Opus 4

Anthropic

Tin liên quan

Cùng vivo V60 5G tự tin chơi Tết Độc lập

Kỳ nghỉ lễ Quốc khánh năm nay, với bạn đồng hành là chiếc vivo V60 5G, tôi đã có rất nhiều tấm ảnh đẹp khi cùng hòa m

ZNews 3 giờ trước

Ngân hàng của Australia khai trương văn phòng đổi mới sáng tạo mới tại Hà Nội

National Australia Bank khai trương văn phòng đổi mới sáng tạo mới tại Hà Nội với mục tiêu phát triển các tài năng cô

VietNamNet 4 giờ trước

Ông Vũ Hải Quân giữ chức Thứ trưởng Thường trực Bộ KH&CN

Thủ tướng Chính phủ vừa điều động, bổ nhiệm ông Vũ Hải Quân, Chủ tịch Hội đồng, Giám đốc Đại học Quốc gia TP.

VietNamNet 5 giờ trước

Thiết bị gì đã giúp tạo ra những cảnh quay mượt mà tại lễ diễu binh 2/9?

(Dân trí) - Nếu theo dõi lễ diễu binh mừng 80 năm Ngày Quốc khánh 2/9 trên truyền hình, bạn sẽ được xem những cú lia

Dân Trí 6 giờ trước

Đòn 'hồi mã thương' của Huawei: Công nghệ Trung Quốc thách thức siêu cường Mỹ

Sau nhiều năm gồng mình chống đỡ các biện pháp cấm vận khắc nghiệt từ Washington, Huawei bất ngờ tung đòn phản công v

VietNamNet 6 giờ trước

Nhà mạng đổi tên hiển thị thành 'Tự hào Việt Nam'

Việc đổi tên mạng Viettel thành tên "Tự hào Việt Nam" là một hành động nhỏ nhưng đầy ý nghĩa đã lan tỏa mạnh mẽ trong

ZNews 2 ngày trước

Xem diễu binh, diễu hành 2/9 qua màn hình cực đại Samsung AI TV

Các kích thước màn hình cực đại 98 inch - 100 inch - 115 inch của Samsung AI TV sẽ mang trọn vẹn khung cảnh diễu binh

VietNamNet 2 ngày trước

Hai ông lớn cùng lúc tấn công Xiaomi

Xiaomi bị cáo buộc chạy quảng cáo nhằm bôi nhọ, hạ thấp Apple và Samsung tại Ấn Độ.

ZNews 2 ngày trước

Tên lửa DF-26D - ‘sát thủ Guam’ công nghệ 'khủng' thay đổi cán cân sức mạnh Mỹ - Trung

Trung Quốc vừa công bố tên lửa DF-26D, biến thể mới của dòng tên lửa đạn đạo tầm trung, mệnh danh ‘sát thủ Guam’, có

VietNamNet 2 ngày trước

Thị trưởng gây sốt nhờ bài đăng 'bóc' giá máy tính

Một gói hệ thống gồm 16 PC Intel thế hệ 11 cũ với giá khoảng 175.000 USD đã bị phanh phui sau lễ ký kết bàn giao chức

ZNews 2 ngày trước

CEO giật mũ từ tay cậu bé, công ty Ba Lan hứng sự phẫn nộ

Công ty Drogbruk hứng chịu hàng loạt đánh giá tiêu cực sau khi CEO Piotr Szczerek bị cáo buộc giật mũ, quà tặng của v

ZNews 3 ngày trước

Công ty Ba Lan hứng 'bão' review sau vụ CEO giật mũ fan nhí

Công ty Drogbruk của CEO Piotr Szczerek đang hứng chịu hàng loạt đánh giá tiêu cực sau khi ông bị cáo buộc giật mũ, q

ZNews 3 ngày trước

Hai anh em Trung Quốc tạo ra đối thủ khiến Nvidia dè chừng

Cambricon từ chỗ thua lỗ và bị Mỹ trừng phạt đã báo lãi kỷ lục, trở thành đối thủ khiến Nvidia phải dè chừng trong cu

ZNews 3 ngày trước

Tập đoàn CMC vinh dự đón nhận bằng khen của Thủ tướng

Tập đoàn CMC được tặng Bằng khen của Thủ tướng đúng dịp kỷ niệm 80 năm Quốc khánh, là động lực để CMC tiếp tục khẳng

VietNamNet 3 ngày trước

iPhone 'gánh' smartphone toàn cầu năm 2025

Lượng xuất xưởng iPhone của Apple dự kiến sẽ tăng gần 4% trong năm 2025, kéo theo toàn bộ ngành công nghiệp smartphon

ZNews 3 ngày trước

AI gây sốc với thủ đoạn 'trả thù' công ty chủ quản

Tin liên quan

Tin nổi bật