Close Menu
Diário de Goiânia
    • Home
    • Contato
    • Politica de Privacidade
    • Termos de Uso
    Diário de Goiânia
    sexta-feira, maio 23
    • Turismo
    • Marketing
    • Mundo
    • Entretenimento
    • Municípios
    • Saúde
    • Política
    • Tecnologia
    Diário de Goiânia
    Home | Tecnologia | Texto para vídeo de personagens de IA que falam
    Tecnologia

    Texto para vídeo de personagens de IA que falam

    Redação Diário de GoiâniaBy Redação Diário de Goiânia05/04/20254 Mins Read
    Compartilhar WhatsApp Facebook Twitter Pinterest Copy Link LinkedIn Tumblr Email VKontakte Telegram
    Prompt examples for Meta’s MoCha AI video generator. Image source: Arxiv
    compartilhe
    WhatsApp Facebook Twitter Pinterest Copy Link

    O ChatGPT, famoso pela sua capacidade de gerar texto, agora está em evidência pelo seu novo recurso de criação de imagens e deepfakes, que geraram bastante discussão. A ferramenta lançada pela OpenAI está sendo tão usada que isso afeta o funcionamento básico do ChatGPT, prejudicando a experiência dos usuários.

    Mas não é só isso que está chamando a atenção no mundo da inteligência artificial. O modelo de vídeo Runway Gen-4 permite que você crie clipes incríveis a partir de apenas um texto e uma foto. Ele mantém a continuidade de personagens e cenários, algo inovador que poucos poderiam imaginar.

    Os vídeos que a Runway apresentou reuniram a galera, já que qualquer pessoa pode criar clipes de qualidade cinematográfica com essas ferramentas, caso estejam em funcionamento adequado. No mínimo, a IA pode ajudar a diminuir os custos de efeitos especiais em muitos filmes.

    Além do Runway, a Meta também está investindo pesado em sua própria tecnologia, chamada MoCha. Esse produto faz com que personagens de vídeo se movimentem e falem, a ponto de enganar quem assistir. É um verdadeiro avanço!

    MoCha não é só um erro de escrita para “mocha”, mas sim uma abreviação para “Movie Character Animator”. É um projeto de pesquisa da Meta em parceria com a Universidade de Waterloo. A proposta do modelo é simples: você dá um texto descrevendo o vídeo e um exemplo de fala, e a IA cria um clipe onde os personagens “falam” de forma quase perfeita!

    Os pesquisadores mostraram muitos exemplos que destacam as habilidades avançadas do MoCha. Os resultados são muito bons, com cenas em que protagonistas, sejam eles reais ou animados, falam exatamente as falas do áudio. A IA considera emoções e pode lidar com vários personagens ao mesmo tempo.

    Apesar de tudo, os vídeos ainda apresentam algumas falhas. Movimentos dos olhos e dos rostos podem dar pistas de que estamos vendo algo criado por IA. Embora a sincronização labial com a fala esteja bem ajustada, a movimentação da boca é exagerada e não condiz com a naturalidade dos humanos.

    Com a experiência que já tenho, vi muitos modelos semelhantes e alguns bem convincentes. Primeiro, vamos falar do Runway Gen-4, mencionado na semana passada. Os clipes de demonstração parecem mais aprimorados que o MoCha. Porém, MoCha tem potencial de melhorar quando for comercializado.

    Partindo para outro modelo, sempre comparo novas ferramentas que sincronizam personagens gerados por IA com amostras de áudio com o VASA-1 da Microsoft, que foi apresentado em abril passado. O VASA-1 transforma fotos estáticas de pessoas em vídeos de personagens que falam, desde que você forneça um áudio.

    A Microsoft nunca liberou o VASA-1 para o público, já que esse tipo de tecnologia pode ser muito mal utilizada. Por outro lado, o ByteDance, dono do TikTok, também apresentou uma IA parecida que transforma uma única foto em um vídeo totalmente animado.

    Essa tecnologia, chamada OmniHuman-1, faz animações de movimentos do corpo, assim como vimos na demonstração do MoCha. Isso possibilitou ver a Taylor Swift cantando a música tema de Naruto em japonês. E sim, é um deepfake, já chego nesse ponto!

    Ferramentas como VASA-1, OmniHuman-1 e MoCha, além do Runway Gen-4, podem ser usadas para criar deepfakes que confundirão muitos.

    Os pesquisadores que estão à frente do MoCha e de outros projetos precisam discutir publicamente esses aspectos, especialmente quando o modelo for lançado comercialmente. Se você observar as amostras do MoCha disponíveis online, pode notar algumas inconsistências, mas se assistir no celular, essas falhas podem passar batido.

    E dependendo do seu nível de compreensão sobre a geração de vídeos por IA, talvez você acredite que esses clipes foram realmente filmados com câmeras.

    Outra questão importante é a divulgação dos dados usados para treinar essa IA. O estudo sobre o MoCha revelou que foram usados cerca de 500 mil amostras, somando 300 horas de vídeos de fala de alta qualidade, mas não informou a origem desses dados. Isso é um problema comum na indústria, onde a origem dos dados não é sempre informada, e isso levanta questões éticas.

    A discussão sobre essas tecnologias é vasta e coloca em pauta a necessidade de supervisão e transparência no uso de dados para o treinamento de IAs, já que isso impacta diretamente na ética de como essas ferramentas são desenvolvidas e utilizadas.

    Share. WhatsApp Facebook Twitter Telegram Copy Link
    logo assinatura diário de Goiânia
    Redação Diário de Goiânia

    Notícias atualizadas sobre política, economia, cultura, esportes e muito mais em Goiânia e região. Acompanhe as notícias de quem vive e respira o cotidiano goianiense.

    Posts Relacionados

    Tecnologia

    11 motivos para atualizar seu Mac para o macOS Sequoia agora mesmo

    06/05/2025
    Tecnologia

    Meta Llama 2025: A Tsunami de IA de Código Aberto

    05/05/2025
    Tecnologia

    6 recursos rumores para o Apple Watch SE 3

    04/05/2025
    Tecnologia

    Este avanço chinês pode revolucionar os microprocessadores para sempre.

    03/05/2025
    Tecnologia

    Estudo aponta que a IA ainda não está substituindo empregos nem melhorando salários.

    02/05/2025
    Tecnologia

    Sensor de frequência cardíaca do Apple Watch Series 10 é um desastre

    01/05/2025
    Recentes

    Vale Tudo à Beira do Abismo: O Encontro Fatal que Pode mudar o Destino do Vasco.

    23/05/2025

    Campeã paralímpica de judô é excluída por simular deficiência visual

    23/05/2025

    Por que Reinaldo Gottino decidiu arriscar uma fortuna para trocar a CNN pela Record? O que está por trás dessa reviravolta?

    23/05/2025

    Segredos Reveladores e Viradas Surpreendentes: O Que Acontecerá no Próximo Capítulo da Novela das Sete?

    23/05/2025
    Diversos

    Descubra como os cenários de ‘Wicked’ conquistaram o Oscar e desafiaram as leis da gravidade!

    03/03/2025

    Por que Chef Rita Lobo decidiu deixar a Globo após uma década de sucessos?

    05/02/2025

    A crise no sistema prisional é resultado de escolhas políticas.

    28/02/2025

    Descubra o Segredo Por Trás da Cidade Catarinense que Conquista Corações ao Redor do Mundo!

    29/01/2025

    Fique por dentro das últimas notícias de Goiânia e região no Diário de Goiânia. Informações atualizadas sobre política, economia, cultura, esportes e muito mais!

    Posts Recentes

    Vale Tudo à Beira do Abismo: O Encontro Fatal que Pode mudar o Destino do Vasco.

    23/05/2025

    Campeã paralímpica de judô é excluída por simular deficiência visual

    23/05/2025
    Diversos

    Prepare-se: Um Segredo Revelador Agita o Novo Capítulo da Novela Nesta Quinta!

    07/05/2025

    LinkedIn Permite que Usuários Adicionem Nomes Secundários para Verificação de Identidade

    29/04/2025
    © 2025 Diário de Goiânia. Todos os Direitos Reservados
    • Home
    • Contato
    • Politica de Privacidade
    • Termos de Uso

    Type above and press Enter to search. Press Esc to cancel.