Hva er VisualGPT – Alt du trenger å vite

Microsofts VisualGPT lanserer en ny teknologi ' VisualGPT ” som er en fremgang av AI og åpner for muligheter for mer tiltalende og interaktive AI-opplevelser ved å bygge bro mellom det visuelle og språket.

Hva er VisualGPT?

VisualGPT er en utvidet versjon av ChatGPT som er basert på NLP (Natural Language Processing) modeller, men i VisualGPT brukes VFMS som kan konvertere tekstspørringer til bildeform. Det er slik at det er en kombinasjon/integrasjon av tekst- og bildespørringer.

Formålet med VisualGPT

Etter lanseringen av ChatGPT på markedet, som jobbet med tekstformatet som det eneste, for å oppnå neste utviklingsnivå er det perfekte verktøyet som vil fungere på tekstlig til grafisk format, etter alle disse grunnene og i kappløpet om AI fremskritt Microsoft lanserer VisualGPT hovedformålet med VisualGPT er å lage AI-bilder etter brukerens behov eller analysere bildet

Arkitektur av VisualGPT

VisualGPT inneholder User Query, Prompt Manager, Visual Foundation Models (VFMs), System Principle, History of Dialogue, History of Reasoning og Intermediate Answer.

Hvis vi spesifikt snakker om modellen, dvs. ' VFM-er (Visual Foundation Models) ”, nesten 22 VFM-er brukes, som BLIP (Bootstrapping Language-Image Pre-training), og Stable Diffusion.

Hvordan kjøre en Visual ChatGPT?

For å kjøre en Visual ChatGPT, vurder følgende trinn:

Trinn 1: Lag et miljø

For det første må du lage et miljø med Python versjon 3.8:

import sys

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

Trinn 2: Klon Visual ChatGPT-fil

Klon nå den visuelle ChatGPT-filen fra GitHub ved å bruke følgende kommando:

! git klone https: // github.com / deepanshu88 / visual-chatgpt.git

Trinn 3: Sett opp en ny katalog

Sett deretter opp en ny katalog via kommandoen nedenfor:

% cd visual-chatgpt

Trinn 4: Installer de nødvendige pakkene

Installer nå de nødvendige pakkene ved å bruke ' pip ' cmdlet:

! krøll https: // bootstrap.pypa.io / get-pip.py -O get-pip.py

! python3.8 get-pip.py

! python3.8 -m pip installere -r krav.txt

Trinn 5: Få tilgang til OpenAI API

Etter å ha installert innledende pakker, få tilgang til OpenAI API ved å skaffe en API-nøkkel fra 'platform.openai.com' og foreta autentiserte API-kall:

% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

Trinn 6: Velg modell

Til slutt, etter å ha tilgang til Openai velg modellen, er det mer enn 20 modeller som brukes i visualGPT, du kan velge i henhold til dine krav:

! python3.8. / visual_chatgpt.py --laste Text2Image_cuda: 0

I kommandoen ovenfor, ' Text2Image ” tilsvarer modellen som skal brukes. For mer informasjon sjekk denne Google Colab notisbok .

Konklusjon

ChatGPT ble introdusert for å få spesifikke svar om ethvert spørsmål, og nå har Microsoft lansert VisualGPT som er i stand til å håndtere tekstlige så vel som billeddata. Det er slik at brukeren ganske enkelt kan legge til sine krav i tekstform og få dens grafiske utdata.

Hva er VisualGPT – Alt du trenger å vite

Hva er VisualGPT?

Formålet med VisualGPT

Arkitektur av VisualGPT

Hvordan kjøre en Visual ChatGPT?

Trinn 1: Lag et miljø

Trinn 2: Klon Visual ChatGPT-fil

Trinn 3: Sett opp en ny katalog

Trinn 4: Installer de nødvendige pakkene

Trinn 5: Få tilgang til OpenAI API

Trinn 6: Velg modell

Konklusjon

Kategori

Populære Innlegg

Slik sammenligner du ikke store og små bokstaver i strenger i JavaScript

Arduino Nano Sammenligning med Arduino Uno

Mestring av Android-alarmer: Still inn alarmer som en proff

Hvordan bruke AWS Lambda Layers for gjenbruk av kode?

Slik bruker du tekstdekorasjonstykkelse med medvindsbrytepunkter og medieforespørsler

Tilpass terminalen din med Oh My Zsh-temaer

Hvordan bruke negativ ledetekst i stabil diffusjon?

Linux-kommando for å lage tom fil i gjeldende katalog

Når skal du bruke margin vs padding i CSS

Hva er trinnene for å kjøre eksterne kommandoer i PowerShell?

Hva er Compress-Archive Cmdlet i PowerShell?

Hvordan gjøre PostgreSQL Auto Increment

Hvordan konfigurere Linux Cgroups

Hvordan installere og konfigurere Wine på Ubuntu 22.04

Hva er ESP32-DevKitC

SQL Outer Join

Slik løser du motorens 'node' er inkompatibel med 'Denne' modulfeil

Hvordan laste ned musikk til din Android-telefon?

Hva er Null Coalescing Operator i C#

Hvordan bruker jeg Node.js path.resolve()-metoden?