Definition of |  Générateur d’images IA – Text to image

[ad_1]

C’est une nouvelle génération d’application qui exploite l’intellegence artificielle comme jamais aupuravant : Dall.e 2, Stable Diffusion, MidJourney… Le principe : on tape un texte et une image est generéete. Oui mais… l’imaginaire est totalement au rendez-vous. On peut demander à generate un visuel de koala pilotant une moto, d’un micro-ordinateur de la renaissance period, de Mozart essayant un nouveau casque stereo sous le consider intrigued de Marilyn Monroe… Ou encore s’aventurer de la univers de science fiction, du jeu video, du street art. Et mélanger allègrement les styles, les époques, inventer des situations baroque et totalement surréalistes. À chaque fois, l’IA va satisfye nos désirs.

These applications of “image generation by AI” or “text-to-image” represent one of the first realizations accessible to all of the potentials of artificial intelligence.

OpenAI initiative

OpenAI was established in December 2015 in San Francisco, but is a non-profit organization. Son objectif est de pusher les limites de l’intelligence artificielle avec toutefois, une éthique assumée: l’IA se doit d’être sans danger et beneficiar pour l’humanité don’t elle voudrait contributar à “préservante la sécurité”.

She is presided over by :

  • programmer-entrepreneur Sam Altman, author of the Reddit Foundation;
  • le chercheur Greg Brockman, founder of Stripe, une entreprise de paiement en ligne.

OpenAI was initially founded on grants from personalities such as Altman and Brockman, but also Elon Musk, and later received a billion-dollar grant from Microsoft. It is also financially supported by partners such as Amazon Web Services or Infosys.

Dall.e 2

If OpenAI was first distinguished by the creation of tools for developers, from January 2021, it was able to present a concrete application of its research accessible to all: Dall.e. (the name of the creator of the surrealist Salvador Dalí and the Pixar anime robot Wall-E).

Le principe: on tape une phrase et Dall.e la transforme en image. Sur cette première version, le résultat laissait quelque peu à désirer.

In April 2022 Dall.e 2 a été prêtente au public et cette fois, les résultats ont été jugés bluffants : les réalisations sont à la fois originales et d’un niveau artistique patent. Les images sont de belle qualité et qui plus est, il ne faut qu’une dizaine de secondes pour les produire.

Dalle.e 2 a été l’une des premières manifestations visible par tous des prouesses de l’intelligence artificielle. Because il est possible de taper des frases highly surrealist et d’obtenir un résultat qui tient la route. Indeed, plus the request is specific and plus the result is impressive. Les images sont digne de ce que pourrait réaliser un artiste graphique de talent. They are both creative and aesthetic. Qui plus est, si l’utilisateur n’est pas pleineme satisfait, il peut generate des variations.

The only limitation à l’automne 2022 : Dall.e 2 et les diverses declinaisons présentées plus bas ne comprehend pour l’instant que des phrases formulées en anglais.

C’est peu dire que Dall.e 2 a séduit un très large public. In September 2022, the application in question has 1.5 million users and serves to generate another 2 million images per day.

OpenAI programs

Pour aboutir à une telle performance, OpenAI a mis au point deux technology advancedes :

  • GPT3 : une AI à même de comprendre des textes humanas.
  • Clip: a system of “vision” by computer, integrating an automated evaluation of what we consider aesthetic.

The GPT Project (Generative pre-prepared transformer) a pris naissance dès 2018. Il s’agit d’un système d’apprentissage automatique qui fonctionne en ponderant son acquisition de connaissances après evaluation de leur pertinence.

L’autre élément, Clip, intégré des centanes de milliards d’images assorties de leurs Légendes originating from la base de données Common Crawl. Il inclut l’analysis du style particulier à de très nombreux artistes. Dall.e repose sur le fruit de cette analyze pour proposer des images à l’ethétique proche d’un grand peintre ou d’un photographe de renom.

Stable diffusion

Stable Diffusion is une autre tentative fort réussie de generate des images d’aspect photographique fort réaliste à partir de texte. Britannique Initiative, l’outil Dream Studio de Stable Diffusion est apparu en aût 2022. Il produit des rendus particulierpressionnants au niveau artique. The site is available at: https://beta.dreamstudio.ai/dream.

On peut aisément spécifier avec cet tool un chiffre indicating the degree of creative freedom of IA. The site https://lexica.art presents a gallery of images generated with Stable Diffusion.

MidJourney

The third major application, MidJourney is the work of a research laboratory in IA founded by David Holz, a talented researcher from California, dépositaire d’un très grand nombre de brevets et qui définit la mission de MidJourney comme ” étendre les pouvoirs imaginatifs de l’espèce humaine “. Notable pour sa creativity, MidJourney peut être mis en pratique depuis le forum Discord de MidJourney, in the section ” beginners “. This forum has already attracted more than 2 million subscribers in the fall of 2022.

Une menace pour les artistes?

D’autres projets sont en cours, notably Imagen qui est mené par Google.

C’est peu dire que de constater que Dall.e 2 et ses avatars ont laissé le monde artistique interloqué. Frédéric Boisdron, specialist in AI and robotics, believes that these tools will gradually be integrated into the creative panel: Il est certain qu’une minority d’artistes se sentira en danger avec l’émergence de ces IA. Mais, d’autres les prendront pour ce qu’elles sont, des outils parfaits pour faire exploser leur inspirations, leur creativity. In the same way, professional chess and go players are now working with AI to discover new strategies that no one has thought of. »