OpenAI ra mắt Sora 2: Biến văn bản thành video trong chớp mắt, khó phân biệt thật giả

OpenAI vừa giới thiệu Sora 2, công cụ tạo video bằng trí tuệ nhân tạo với độ chân thực cao đến mức khó phân biệt thật giả. Phiên bản mới này bổ sung âm thanh, khẩu hình chuẩn xác và khả năng dựng cảnh nhanh chóng, mở ra nhiều cơ hội lẫn rủi ro.
Sora là hệ thống chuyển văn bản thành video do OpenAI phát triển, lần đầu xuất hiện vào năm 2024. Công nghệ này cho phép mô tả bằng chữ và nhận về một đoạn phim sống động, tạo cảm giác như đang xem cảnh quay thực tế.
Với phiên bản Sora 2, năng lực dựng cảnh được nâng lên tầm cao mới, hướng đến việc biến trí tưởng tượng của con người thành hình ảnh và âm thanh sát thực tế hơn bao giờ hết.
Cho phép đưa gương mặt, giọng nói người dùng vào video AI
Sora 2 được chú ý nhờ khả năng biến lời mô tả thành video kèm âm thanh có độ chân thực cao. Người dùng nhập một đoạn văn bản, hệ thống sẽ tạo ra cảnh quay động với nhân vật, khung cảnh và lời thoại đồng bộ.
Điểm tiến bộ lớn là khẩu hình nhân vật khớp với nhiều ngôn ngữ khác nhau, khiến video thuyết phục hơn và khó phân biệt thật giả.
Một tính năng mới là cameos, cho phép người dùng đồng ý để gương mặt hoặc giọng nói của mình xuất hiện trong video AI. Đây là bước mở cho việc cá nhân hóa nội dung, song chỉ hoạt động khi có sự chấp thuận rõ ràng nhằm hạn chế nguy cơ giả mạo.
Khả năng kiểm soát cảnh quay cũng được cải thiện. Người tạo có thể lựa chọn không gian, thời lượng, hiệu ứng chuyển cảnh, nhờ vậy video trở nên liền mạch và giàu chi tiết hơn.
Bên cạnh đó, OpenAI áp dụng bộ quy tắc kiểm duyệt, ngăn chặn các yêu cầu tạo nội dung nhạy cảm hoặc sử dụng hình ảnh người nổi tiếng mà chưa có sự đồng ý.
Từ báo chí, giáo dục đến doanh nghiệp nhỏ: cơ hội với Sora 2
Khả năng tạo video nhanh của Sora 2 mở ra nhiều ứng dụng trong đời sống. Người sáng tạo nội dung có thể tiết kiệm thời gian và chi phí khi dựng cảnh minh họa cho kịch bản. Một nhà báo có thể biến đoạn mô tả ngắn thành clip minh họa sinh động, hay một giáo viên lịch sử có thể tái hiện sự kiện cổ đại giúp học sinh dễ hình dung hơn.
Doanh nghiệp nhỏ cũng có thể sản xuất quảng cáo đơn giản mà không cần trường quay hay diễn viên.
OpenAI đang hướng tới tích hợp Sora 2 vào ChatGPT và ứng dụng di động, giúp người dùng phổ thông tiếp cận dễ dàng. Ý tưởng biến công cụ này thành một nền tảng chia sẻ video giống mạng xã hội cũng được thử nghiệm, hứa hẹn mang lại cách sáng tạo nội dung hoàn toàn mới. Microsoft thậm chí đã thử đưa công nghệ vào Bing, cho phép tạo video ngắn trực tiếp trên điện thoại.
Với những bước đi này, Sora 2 không chỉ là công cụ dành cho chuyên gia mà còn là trợ lý sáng tạo cho mọi người trong nhiều lĩnh vực.
Rủi ro video giả và quyền riêng tư
Dù vậy, Sora 2 vẫn tồn tại những hạn chế. Một số video thử nghiệm cho thấy chuyển động nhân vật chưa hoàn toàn tự nhiên, có chi tiết "nhảy hình" hoặc không tuân theo quy luật vật lý. Khi quay cận mặt, ánh sáng và biểu cảm có lúc chưa thật sự chuẩn xác. Đây là dấu hiệu cho thấy trí tuệ nhân tạo vẫn chưa thể hiểu sâu hoàn toàn về thế giới vật chất.
Nguy cơ lớn hơn nằm ở việc công nghệ có thể bị lợi dụng để tạo video giả mạo. Các clip được dựng từ Sora 2 quá giống thật, dễ gây hiểu lầm nếu được chia sẻ rộng rãi trên mạng xã hội. Điều này đặt ra thách thức cho cả nhà quản lý và cộng đồng khi phải đối diện với nguy cơ thông tin sai lệch lan nhanh.
Bên cạnh đó còn có câu hỏi về quyền riêng tư và bản quyền. Nếu một đoạn phim tái hiện gương mặt hoặc giọng nói của ai đó, ai sẽ sở hữu quyền hình ảnh đó và ai chịu trách nhiệm nếu nó bị dùng sai mục đích?