Qwen Image Edit: Tudo Sobre Edição de Imagens com IA


Qwen Image Edit: Tudo Sobre Edição de Imagens com IA

Se liga, a Alibaba está revolucionando a maneira como lidamos com edição de imagens! Eles acabam de lançar o Qwen Image Edit, um modelo inovador que edita qualquer imagem do jeito que você quiser. O melhor? É gratuito e super fácil de usar. Vamos conferir de perto essa funcionalidade do Qwen e ver se realmente ele está à altura da competição.

O que é o Qwen’s Image Edit?

O Image Edit é a versão de edição de imagens do modelo de geração de imagens lançado recentemente pelo Qwen, chamado Qwen-Image. Com este modelo, você pode editar qualquer imagem exatamente como deseja. Basta fornecer um texto explicando o que você espera do resultado e, em segundos, o modelo gera o resultado desejado.

Como funciona a funcionalidade de edição do Qwen Image Edit?

O modelo é construído sobre um modelo de geração de imagens muito compacto chamado “20B Qwen-Image”. Mas o modelo de edição estende as capacidades para tarefas de edição como renderização de texto, adição ou remoção de elementos, etc. Duas tarefas ocorrem simultaneamente dentro deste modelo de edição de imagens:

  • A imagem de entrada é alimentada no Qwen2.5-VL para permitir o controle semântico visual.
  • A imagem de entrada também é alimentada no VAE ou Variational Autoencoder para controlar a aparência visual das imagens geradas.

Isso permite que o modelo alcance um desempenho superior nas tarefas de edição: semântica e aparência.

Quais são os principais recursos do Qwen Image Edit?

Enquanto o modelo oferece um progresso emocionante nas capacidades de edição de imagens, alguns de seus principais destaques são:

  • Edição de Imagem Avançada: O modelo oferece edições visuais de baixa e alta complexidade. Na edição de baixo nível, ele atende a tarefas como adicionar, remover ou modificar elementos mantendo o resto da imagem como está. Na edição de alto nível, ele atende a tarefas como criação de IP, rotação de objetos ou transferência de estilo, mudando os pixels gerais da imagem.
  • Edição de Texto Superior: O modelo é excelente em editar texto dentro das imagens, seja adicionando certas seções, removendo-as ou simplesmente modificando o texto enquanto o estilo, tamanho e fonte original são mantidos.
  • Desempenho: O modelo alcança excelentes pontuações quando avaliado em diferentes tarefas de edição de imagens.

Como acessar o Qwen Image Edit?

Para acessar o modelo mais recente de Image Edit oferecido pelo Qwen:

  1. Acesse chat.qwen.ai
  2. Selecione qualquer modelo no menu dropdown (localizado no canto superior esquerdo)
  3. Qwen Image Edit Interface

  4. Em seguida, nas funcionalidades listadas abaixo da caixa de texto, selecione a opção “Image Edit”.
  5. Envie sua imagem e adicione seu texto de comando na caixa de texto.

Mãos na massa

Agora que já conhecemos todas as funcionalidades do modelo e como acessá-lo, vamos testar como ele se sai em tarefas reais. Para fins de demonstração, usaremos a interface web do modelo para obter as respostas. Isso facilitará seu acesso e análise subsequente. Vamos testar o modelo em três tarefas:

  • Adicionar/Remover objetos na imagem
    • Prompt: “Add a TV screen in the vacant space in the middle.”
    • Imagem com espaço vago: Imagem com espaço vago
    • Resposta: Resposta com TV adicionada
    • Observação: O modelo conseguiu adicionar uma TV no local desejado. Entretanto, o texto ao redor ficou um pouco desfocado, especialmente o texto. No geral, um bom resultado dado o breve comando.
    • Prompt: “Remove the white chair and replace it with a white couch.”
    • Imagem com cadeira branca: Imagem com cadeira branca
    • Resposta: Cadeira branca substituída por sofá branco
    • Observação: O modelo alterou a imagem de forma convincente. Mas como antes, algum texto ao redor ficou desfocado. No geral, um bom resultado.
  • Mudar o fundo
    • Prompt: “Change the background to an office building.”
    • Imagem interna: Imagem interna
    • Resposta: Fundo alterado para prédio de escritórios
    • Observação: Nah! O fundo foi mudado para o cenário correto, mas tudo o mais foi alterado. O sujeito da imagem (a garota), os detalhes das imagens atrás dela, tudo foi mudado. É como se, para compensar a mudança solicitada, a imagem inteira fosse recriada.
  • Mudar texto dentro da imagem
    • Prompt: “Change the text ‘Prompt Charades’ to ‘Guess that Word’.”
    • Imagem com texto Prompt Charades: Imagem com texto Prompt Charades
    • Resposta: Texto alterado para Guess that Word
    • Observação: O modelo fez um trabalho incrível ao alterar o texto fornecido sem afetar o texto ao redor. Bom resultado!

Qwen-Image-Edit: Desvantagens

O modelo é ótimo para editar imagens: seja adicionando um fundo, retrabalhando o texto ou modificando certas partes da imagem. Mas ainda há muitas áreas em que o modelo pode melhorar. Algumas das principais desvantagens que encontrei no modelo foram:

  • Atualmente, o modelo não permite selecionar uma seção específica da imagem para editar. Você dá o comando para a imagem inteira. Esse método depende da capacidade do modelo de discernir o ponto de interesse a partir da imagem fornecida, o que pode não ser confiável.
  • O modelo atualmente suporta apenas chinês e inglês para recursos de edição de texto.

Conclusão

O Qwen Image Edit é um grande passo à frente em tornar a edição de imagens com IA poderosa e acessível. Ele lida com muito processamento de imagem, desde adicionar novos objetos até modificar texto, surpreendentemente bem, considerando que é completamente gratuito. Claro, ele não é perfeito. Não é possível selecionar áreas específicas para editar com precisão e não suporta tantos idiomas quanto gostaríamos. Mas apesar dessas limitações, é claro que a Alibaba está genuinamente comprometida em trazer ferramentas práticas de IA generativa de acesso aberto para os usuários do dia a dia. Se você é minimamente curioso sobre design impulsionado por IA ou apenas quer brincar com edições criativas, o Image Edit vale a pena conferir.

Fonte: Analytics Vidhya

Perguntas Frequentes

O que é o Qwen Image Edit?

O Qwen Image Edit é um modelo da Alibaba que permite editar imagens facilmente através de comandos em texto.

Como posso acessar o Qwen Image Edit?

Acesse o site chat.qwen.ai, selecione o modelo de edição e envie sua imagem junto com o texto dos comandos.

Quais são os principais recursos do Qwen Image Edit?

Os principais recursos incluem edição de imagem avançada, edição de texto e bom desempenho em tarefas de edição.

O Qwen Image Edit é gratuito?

Sim, o Qwen Image Edit é totalmente gratuito para uso.

Quais idiomas são suportados pelo Qwen Image Edit?

Atualmente, o modelo suporta apenas chinês e inglês para recursos de edição de texto.

0 0 votes
Article Rating
Subscribe
Notify of
guest

0 Comentários
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
0
Deixe sua opinião, deixe um comentário!x