Por que os geradores de imagem AI lutam com as mãos

Por que os geradores de imagem AI lutam com as mãos
Leitores como você ajudam a apoiar o MUO. Quando você faz uma compra usando links em nosso site, podemos ganhar uma comissão de afiliado. Consulte Mais informação.

Os geradores de IA evoluem diante de nossos olhos em um ritmo assustador, mas ainda apresentam falhas. Detectar detalhes estranhos em imagens de IA é realmente muito engraçado. É por isso que as mãos no meio da jornada se tornaram um assunto importante, um problema comum em muitos motores.





Vamos explicar por que as mãos desafiam tanto os geradores de imagens de IA. Seus programadores já estão corrigindo esse problema digno de meme, mas é interessante pensar em como a inteligência artificial aprende, sem falar no que atrapalha.





MAKEUSEDO VÍDEO DO DIA ROLE PARA CONTINUAR COM O CONTEÚDO

Por que as mãos geradas por IA causaram agitação

Qualquer pessoa que use mecanismos de IA para criar imagens deve ter notado que as mãos raramente saem certas, mas o problema chamou a atenção quando um monte de 'fotos' apareceu no Twitter.





sites legais para quando você está entediado

Em uma inspeção mais detalhada, as mãos estranhas das pessoas os entregaram como imagens geradas por IA. O fato de que esta foi a tentativa de Midjourney em mãos tornou a situação mais interessante.

Um dos melhores mecanismos de IA do mercado não conseguia lidar com a complexidade das mãos humanas, então as capacidades do Midjourney e de seus concorrentes foram postas à prova. É verdade que até DALL-E é propenso a dedos e unhas irrealistas.



  de pessoas apertando as mãos no DALL-E

O hype estava fora de proporção, considerando que mãos geradas por IA sempre foram um problema, mas a atenção extra levou ao lançamento de Midjourney v5 para melhorar a v4 .

A nova versão fez questão de aprimorar o design das mãos, uma indicação clara de que os engenheiros de IA prestaram atenção à agitação hilária e decidiram atualizar os recursos do software.





Outros motores demoram a seguir o exemplo do Midjourney, então corrigindo arte de IA com o Photoshop continua sendo uma habilidade inestimável. O principal obstáculo para os programadores é o quão complicado é treinar a inteligência artificial para desenhar mãos convincentes.

Por que os geradores de imagem AI lutam com as mãos?

Os mecanismos de IA usam redes adversárias generativas (GANs) ou difusão estável para produzir imagens. Ambas as tecnologias exigem extensos materiais de origem, treinamento e poder de processamento para criar até mesmo as obras de arte mais básicas.





Como as imagens pré-existentes são fundamentais para o treinamento de uma IA, os programadores precisam alimentar seu software com milhares, senão milhões, de imagens junto com prompts - repetindo o processo várias vezes até que o mecanismo entenda a que uma determinada palavra se refere e como representá-la. aquele objeto.

Mas as imagens de origem com as quais uma IA aprende são principalmente 2D, onde as mãos são representadas em várias posições. Seja reto ou enrolado, mostrando cinco ou três dedos.

No final das contas, uma máquina não entende realmente o conceito de mãos, e as imagens com as quais ela aprende nem sempre apresentam as mãos de forma clara ou consistente o suficiente. É por isso que as mãos no meio da jornada podem ser tão feias: confusão de IA.

Tão válido quanto As preocupações de Elon Musk sobre o desenvolvimento da IA pode ser, algumas partes da tecnologia ainda têm muito a aprender. E seus obstáculos vão além de exemplos insuficientes de mãos.

Outras razões pelas quais os geradores de imagens AI demoram a melhorar

  Mulher codificando no computador

Olhando para modelos de midjourney , v5 oferece coerência avançada entre prompts de texto e imagens produzidas, bem como maior resolução e ferramentas adicionais. Mas essas conquistas não são baratas.

Treinar uma IA para fazer melhor com as mãos requer alimentá-la com imagens melhores, especialmente em 3D. Isso significa que muito tempo e mão de obra são gastos em processos, desde a aquisição de materiais de origem até a melhoria da codificação e a repetição do treinamento até que a IA acerte.

Mesmo assim, o software pode cometer erros em obras de arte impressionantes. Além de ser um trabalho enorme e complexo, é caro. Então, não espere geradores gratuitos de texto para imagem de IA para subir ao calibre de Midjourney ainda.

Simplificando, o problema com os mecanismos de IA não é apenas a incapacidade desses programas de computador de entender completamente como as características humanas, como mãos e pés, parecem ou funcionam. Também se resume ao custo e ao acesso da tecnologia a imagens 3D e técnicas de aprendizado de máquina que podem ajudar os geradores a obter uma compreensão mais realista do mundo ao seu redor.

Geradores de imagem AI não vão lutar para sempre

As mãos são um conceito complicado para a inteligência artificial envolver sua cabeça binária, mas as soluções para o problema já estão funcionando. Midjourney, DALL-E 2 e outras plataformas eventualmente serão capazes de manter os dedos peculiares no mínimo, se não erradicá-los completamente.

Avanços em outros campos da IA ​​garantem que a tecnologia esteja em constante evolução, e seus desenvolvedores sempre aprendendo novas maneiras de aplicá-la e melhorá-la.