Hva er VisualGPT – Alt du trenger å vite

Hva Er Visualgpt Alt Du Trenger A Vite



Microsofts VisualGPT lanserer en ny teknologi ' VisualGPT ” som er en fremgang av AI og åpner for muligheter for mer tiltalende og interaktive AI-opplevelser ved å bygge bro mellom det visuelle og språket.

Hva er VisualGPT?

VisualGPT er en utvidet versjon av ChatGPT som er basert på NLP (Natural Language Processing) modeller, men i VisualGPT brukes VFMS som kan konvertere tekstspørringer til bildeform. Det er slik at det er en kombinasjon/integrasjon av tekst- og bildespørringer.







Formålet med VisualGPT

Etter lanseringen av ChatGPT på markedet, som jobbet med tekstformatet som det eneste, for å oppnå neste utviklingsnivå er det perfekte verktøyet som vil fungere på tekstlig til grafisk format, etter alle disse grunnene og i kappløpet om AI fremskritt Microsoft lanserer VisualGPT hovedformålet med VisualGPT er å lage AI-bilder etter brukerens behov eller analysere bildet



Arkitektur av VisualGPT

VisualGPT inneholder User Query, Prompt Manager, Visual Foundation Models (VFMs), System Principle, History of Dialogue, History of Reasoning og Intermediate Answer.



Hvis vi spesifikt snakker om modellen, dvs. ' VFM-er (Visual Foundation Models) ”, nesten 22 VFM-er brukes, som BLIP (Bootstrapping Language-Image Pre-training), og Stable Diffusion.





Hvordan kjøre en Visual ChatGPT?

For å kjøre en Visual ChatGPT, vurder følgende trinn:

Trinn 1: Lag et miljø

For det første må du lage et miljø med Python versjon 3.8:



import sys

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

Trinn 2: Klon Visual ChatGPT-fil

Klon nå den visuelle ChatGPT-filen fra GitHub ved å bruke følgende kommando:

! git klone https: // github.com / deepanshu88 / visual-chatgpt.git

Trinn 3: Sett opp en ny katalog

Sett deretter opp en ny katalog via kommandoen nedenfor:

% cd visual-chatgpt

Trinn 4: Installer de nødvendige pakkene

Installer nå de nødvendige pakkene ved å bruke ' pip ' cmdlet:

! krøll https: // bootstrap.pypa.io / get-pip.py -O get-pip.py

! python3.8 get-pip.py

! python3.8 -m pip installere -r krav.txt

Trinn 5: Få tilgang til OpenAI API

Etter å ha installert innledende pakker, få tilgang til OpenAI API ved å skaffe en API-nøkkel fra 'platform.openai.com' og foreta autentiserte API-kall:

% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

Trinn 6: Velg modell

Til slutt, etter å ha tilgang til Openai velg modellen, er det mer enn 20 modeller som brukes i visualGPT, du kan velge i henhold til dine krav:

! python3.8. / visual_chatgpt.py --laste Text2Image_cuda: 0

I kommandoen ovenfor, ' Text2Image ” tilsvarer modellen som skal brukes. For mer informasjon sjekk denne Google Colab notisbok .

Konklusjon

ChatGPT ble introdusert for å få spesifikke svar om ethvert spørsmål, og nå har Microsoft lansert VisualGPT som er i stand til å håndtere tekstlige så vel som billeddata. Det er slik at brukeren ganske enkelt kan legge til sine krav i tekstform og få dens grafiske utdata.