O Vidu, um grande modelo de geração de vídeo desenvolvido pela empresa chinesa de inteligência artificial (IA) ShengShu Technology e pela Universidade Tsinghua, que pode criar vídeo a partir do texto e imagem, tornou-se recentemente disponível para uso global.
O Vidu pode criar um clipe de 4 segundos em apenas 30 segundos e tem a capacidade de gerar vídeos de até 32 segundos em uma única vez.
“O Vidu pode simular o mundo físico real, criando cenas detalhadas que aderem às leis físicas, como iluminação natural e efeitos de sombra, bem como expressões faciais intrincadas. Além disso, pode gerar conteúdo surrealista com profundidade e complexidade”, disse Zhu Jun, vice-diretor do Instituto de Inteligência Artificial de Tsinghua.
Zhu mencionou que o Vidu pode produzir cenas para diversos gêneros, como ficção científica, romance e animação, capturando a essência de cada um e criando efeitos cinematográficos de alta qualidade, como fumaça e reflexos de lente.
Usuários têm a opção de fazer upload de retratos ou imagens de personagens personalizados e utilizar descrições textuais para comandar os personagens a executar qualquer ação em diversas cenas. Esta funcionalidade simplifica o processo de produção de vídeos e expande a liberdade criativa.
Foi informado que a arquitetura principal do Vidu foi proposta inicialmente em 2022.