Nhảy đến nội dung
 

Kỹ thuật mới giúp ngăn chặn AI học hỏi từ dữ liệu không được phép

Các nhà khoa học Australia vừa mới phát triển một kỹ thuật mới, có khả năng ngăn chặn các hệ thống Trí tuệ Nhân tạo (AI) học hỏi trái phép từ hình ảnh, tác phẩm nghệ thuật và các nội dung trực tuyến khác.

Theo Cơ quan Khoa học Quốc gia Australia (CSIRO), kỹ thuật này thay đổi một cách tinh vi nội dung của hình ảnh để khiến các mô hình AI không thể đọc được, trong khi vẫn không thay đổi đối với mắt người. Đây là dự án được phát triển bởi CSIRO, cùng với sự hợp tác của Trung tâm Nghiên cứu Hợp tác An ninh mạng (CSCRC) của Australia và Đại học Chicago (Mỹ).

Các tác giả cho biết sáng kiến đột phá này có thể giúp các nghệ sĩ, tổ chức và người dùng mạng xã hội bảo vệ tác phẩm, cũng như dữ liệu cá nhân của họ khỏi việc bị sử dụng để đào tạo các hệ thống AI hoặc tạo ra các sản phẩm deepfake - các video, hình ảnh hoặc âm thanh giả mạo được AI tạo ra một cách cực kỳ chân thực. 

Chẳng hạn, người dùng có thể tự động áp dụng một lớp bảo vệ đối với hình ảnh trước khi đăng tải, ngăn AI học các đặc điểm khuôn mặt để tạo ra các sản phẩm deepfake.

Tương tự, các tổ chức quốc phòng có thể bảo vệ hình ảnh vệ tinh nhạy cảm hoặc dữ liệu về các mối đe dọa trên không gian mạng.

Theo Tiến sĩ Derui Wang, nhà khoa học của CSIRO, phương pháp này sử dụng một cơ sở toán học vững chắc để đảm bảo rằng các mô hình AI không thể học được từ nội dung đó, hay nói cách khác kỹ thuật này làm cho dữ liệu trở nên "không thể học được" đối với AI ở một mức độ đủ để bảo vệ quyền riêng tư và bản quyền, trong khi vẫn giữ nguyên tính hữu dụng cho con người.

Ông cho biết thêm sự bảo vệ này vẫn có hiệu lực ngay cả khi AI cố gắng thích ứng hoặc được đào tạo lại.

Tiến sĩ Wang cho biết kỹ thuật này có thể được áp dụng tự động trên quy mô lớn. Ông cho biết một nền tảng hoặc trang web truyền thông xã hội có thể nhúng lớp bảo vệ này vào tất cả hình ảnh được tải lên. Điều này có thể hạn chế sự gia tăng của deepfake, giảm trộm cắp tài sản trí tuệ và giúp người dùng giữ quyền kiểm soát nội dung của họ.

Mặc dù phương pháp này hiện chỉ áp dụng cho hình ảnh, các nhà nghiên cứu có kế hoạch mở rộng sang văn bản, âm nhạc và video. Công nghệ này hiện vẫn đang trong giai đoạn lý thuyết và chỉ mới được chứng minh là hoạt động hiệu quả trong môi trường thử nghiệm tại phòng thí nghiệm.

Công trình khoa học trên, với tên gọi "Provably Unlearnable Data Examples" đã được trao Giải thưởng Nghiên cứu Xuất sắc tại Hội nghị chuyên đề về An ninh Mạng và Hệ thống Phân tán (NDSS) năm 2025.

 
 
 
logo
CÔNG TY CỔ PHẦN XÂY DỰNG SẢN XUẤT VÀ THƯƠNG MẠI ĐẠI SÀN

GPĐKKD: 0103884103 do sở KH & ĐT TP Hà Nội cấp lần đầu ngày 29/06/2009.

Địa chỉ: Gian số L4-07 tầng 4, nơ-2 - Gold Season,  47 Nguyễn Tuân, Thanh Xuân, Hà Nội

MIỀN BẮC

Địa chỉ Showroom: D11-47 KĐT Geleximco Lê Trọng Tấn, Hà Đông, Hà Nội

Điện thoại  Điện thoại: 1900 98 98 36

MIỀN NAM

Địa chỉ VPGD: 57/1c, Khu phố 1, Phường An Phú Đông, Quận 12, Thành phố Hồ Chí Minh

Điện thoại  Email: info@daisan.vn