O MGIE, modelo com código aberto lançado pela Apple, permite aos usuários ajustarem imagens por meio de comandos de texto “natural”
A Apple lançou um modelo de inteligência artificial (IA) para edição de fotos por meio de comandos de texto (prompts). Chamado MGIE – Edição de Imagem Guiada por Modelo de Linguagem de Grande Escala Multimodal – o modelo, com código aberto, permite que o usuário use linguagem natural para dizer ao editor o que deseja alcançar.
Para quem tem pressa:
- A Apple lançou o MGIE, modelo de inteligência artificial (IA) de código aberto para edição de fotos, que permite aos usuários ajustarem usando comandos de texto em linguagem natural;
- Com o MGIE, os usuários podem instruir o editor a fazer alterações específicas, como “deixar o céu mais azul”, e o modelo traduzirá isso em ações de edição concretas;
- O MGIE destaca-se por sua capacidade de interpretar uma ampla gama de comandos e realizar ajustes complexos, desde edições básicas (cortar, redimensionar, aplicar filtros) até modificações avançadas (alterar fundos, adicionar ou remover objetos, aplicar efeitos artísticos);
- Além das funções tradicionais de edição, o MGIE é capaz de otimizar a qualidade geral da imagem, ajustando aspectos como brilho, contraste, nitidez e equilíbrio de cores;
- O modelo também permite edições direcionadas a regiões ou objetos específicos dentro da imagem, permitindo a personalização de atributos como forma, cor e textura.
Por exemplo: um usuário pode simplesmente dizer “deixe o céu mais azul” e o MGIE interpretará isso como “identificar e selecionar o céu, e então aumentar a saturação nesta área em 20%.” E, segundo o site VentureBeat, o MGIE consegue realizar uma impressionante gama de edições. E se o modelo não entregar o resultado esperado, o usuário pode refinar seu pedido ou desfazer o efeito e dar uma instrução diferente.
Editor com IA da Apple
O MGIE executa edições comuns ao estilo Photoshop – por exemplo: cortar, redimensionar, girar, inverter e adicionar filtros. E o modelo também aplica edições mais avançadas, como mudar o fundo, adicionar ou remover objetos e mesclar imagens.
Além disso, o modelo consegue otimizar a qualidade geral de uma foto por meio de ajustes no brilho, contraste, nitidez e equilíbrio de cores. O MGIE também aplica efeitos artísticos como esboço, pintura e desenho animado.
Por fim, o MGIE edita regiões ou objetos específicos em uma imagem – por exemplo: rostos, olhos, cabelos, roupas e acessórios. O modelo também consegue modificar os atributos dessas regiões ou objetos, como forma, tamanho, cor, textura e estilo.
No momento, o MGIE é um modelo de código aberto no Github. Mas há uma demo online na qual você pode carregar suas próprias imagens e brincar com ele.
Testes
O 9to5Mac também testou o editor de imagens com IA da Apple. “Uma experimentação breve mostra que definitivamente é uma versão beta inicial, mas certamente vejo o potencial”, publicou o site nesta quarta-feira (07).
No teste, o prompt foi: “deixe o céu levemente mais vermelho”. O MGIE interpretou como: “Deixe o céu na imagem com um tom avermelhado em vez de azulado. Aplique à paisagem urbana uma sombra.” No entanto, a imagem alterada sai cortada do editor, por razões desconhecidas.
Embora a edição do teste não seja utilizável, porque a demo só suporta saídas de muito baixa resolução, o site destacou a forma como a IA ajustou com precisão o reflexo no interior da moldura metálica para combinar com o céu.
Ainda não se sabe quando ou se a Apple vai adicionar essa capacidade ao iPhone conforme o modelo entregar resultados mais polidos. Mas a implementação faria sentido. Afinal, a empresa sempre mira automatizar fotografia com IA, deixando tudo o mais fácil de usar possível.
Por Pedro Spadoni