A OpenAI, criadora do robô ChatGPT, revelou nesta quinta-feira (15) um modelo de inteligência artificial que cria vídeos realistas a partir de comandos em texto. Batizado de Sora, ele foi liberado para análises de especialistas e ainda não está disponível ao público.
“O Sora pode criar vídeos de até 60 segundos com cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes”, explica a OpenAI.
“O modelo entende não apenas o que o usuário pediu no prompt [comando], mas também como essas coisas existem no mundo físico”.
Demonstrações de criações do Sora incluem tanto animações quanto vídeos com estilo realista (veja exemplos). Um deles mostra o que seria um casal andando em Tóquio – o vídeo não foi gravado por humanos, e sim, gerado por inteligência artificial, segundo a OpenAI.
A empresa disse que disse que vai adotar várias medidas de segurança antes de disponibilizar o Sora em seus produtos. Isso inclui o trabalho com especialistas em áreas como desinformação, conteúdo de ódio e preconceito.
Além disso, um grupo de artistas visuais, como designers e cineastas, recebeu acesso à ferramenta para darem suas contribuições do que pode ser feito para torná-la útil para suas criações.
Como funciona o Sora
O Sora usa uma técnica chamada “difusão”, que cria imagens a partir de pontos aleatórios. No começo do processo, o vídeo tem uma aparência de ruído estático, o efeito de TVs antigas que estão sem sinal. E, aos poucos, o visual é transformado em algo que pode ser reconhecido por um ser humano.
A técnica é parecida com a de robôs como DALL-E, Midjourney e Stable Diffusion, que conseguem criar fotos a partir de descrições dos usuários.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024