Nvidia ra mắt công nghệ AI mới sửa đổi giọng nói

Thứ ba - 26/11/2024 17:05

Biểu tượng của Tập đoàn Nvidia tại triển lãm máy tính ở Đài Loan (Trung Quốc), ngày 5/1/2024. Ảnh minh họa: REUTERS/TTXVN

Công nghệ mới của Nvidia có tên Fugatto, viết tắt của Foundational Generative Audio Transformer Opus 1, cùng với các công nghệ khác mà những công ty khởi nghiệp như Runway và các công ty lớn hơn như Meta Platforms có thể tạo âm thanh hoặc video từ lời nhắc văn bản.

Công nghệ của Nvidia tạo ra hiệu ứng âm thanh và âm nhạc từ mô tả văn bản, bao gồm cả những âm thanh mới lạ như biến âm thanh của một cây kèn trumpet thành tiếng như chó sủa.

Điều khiến cho Fugatto khác biệt so với các công nghệ AI khác là khả năng tiếp nhận và sửa đổi âm thanh hiện có như có thể biến một đoạn nhạc chơi trên piano thành giọng hát của con người, hoặc chuyển đổi giọng nói đã ghi âm với giọng điệu và cảm xúc khác biệt.

Phó Chủ tịch nghiên cứu học sâu ứng dụng tại Nvidia, Bryan Catanzaro, cho rằng AI có tính sáng tạo sẽ mang lại những khả năng mới cho âm nhạc, trò chơi điện tử và cho những người bình thường muốn sáng tạo mọi thứ.

Trong khi các công ty như OpenAI đang đàm phán với các hãng phim Hollywood về việc liệu AI có thể được sử dụng trong ngành giải trí hay không và bằng cách nào, mối quan hệ giữa ngành công nghệ và Hollywood đã trở nên căng thẳng, đặc biệt sau khi ngôi sao Hollywood Scarlett Johansson cáo buộc OpenAI bắt chước giọng nói của cô.

Mô hình mới của Nvidia đã được đào tạo về dữ liệu nguồn mở và tập đoàn cho biết vẫn đang tranh luận về việc liệu có nên phát hành một cách hay không và bằng cách nào.

Theo ông Catanzaro, bất kỳ công nghệ tạo sinh nào cũng luôn tiềm ẩn một số rủi ro. Đây là lý do tại sao Nvidia chưa có kế hoạch ngay lập tức phát hành công nghệ mới.

Lê Minh/TTXVN (Theo Reuters)