De 5 bästa AI-bildgeneratorerna med öppen källkod

De 5 bästa AI-bildgeneratorerna med öppen källkod

snabblänkar

AI-baserade text-till-bild-genereringsmodeller finns överallt och blir lättare att komma åt dagligen. Även om det är enkelt att bara besöka en webbplats och skapa bilden du letar efter, är text-till-bild-generatorer med öppen källkod det bästa alternativet om du vill ha mer kontroll över genereringsprocessen.





MAKEUSE AV DAGENS VIDEO SCROLL FÖR ATT FORTSÄTTA MED INNEHÅLL

Det finns dussintals gratis och öppen källkod AI text-till-bild-generatorer tillgängliga på internet som är specialiserade på specifika typer av bilder. Så vi har sållat igenom högen och hittat de bästa AI text-till-bild-generatorer med öppen källkod som du kan prova just nu.





1 Krita

  craiyon-hemsida

Craiyon är en av de mest lättillgängliga AI-bildgeneratorerna med öppen källkod. Den är baserad på DALL-E Mini, och medan du kan klona Github-förvaret och installera modellen lokalt på din dator, verkar Craiyon ha lagt ner detta tillvägagångssätt till förmån för sin webbplats.





Det officiella Github-förrådet har inte uppdaterats sedan juni 2022, men den senaste modellen är fortfarande tillgänglig gratis på officiella Craiyon-webbplats . Det finns inga Android- eller iOS-appar heller.

När det gäller funktionalitet kommer du att se alla vanliga alternativ som du förväntar dig av en AI-bildgenerator. När du har skrivit in din uppmaning och fått en bild kan du använda den exklusiva funktionen för att få en kopia med högre upplösning. Det finns tre stilar att välja mellan: konst, foto och teckning. Du kan också välja alternativet 'Ingen' om du vill att modellen ska avgöra.



  craiyon-genererad-bild

Dessutom låter 'Expertläge' dig inkludera negativa ord, vilket talar om för modellen att undvika specifika föremål. Det finns också en promptförutsägelsefunktion, som använder ChatGPT för att hjälpa användare att skriva de bästa och mest detaljerade uppmaningarna som möjligt. Slutligen kan de AI-drivna ta bort bakgrundsfunktioner hjälpa dig att spara tid och ansträngning genom att beskära bakgrunder ur bilder.

Och det är ungefär allt Craiyon gör. Det är inte den mest sofistikerade AI-bildgenereringsmodellen, men den gör sig bra som en grundmodell om du inte vill ha något detaljerat eller realistiskt.





Modellen är gratis att använda, men gratisanvändare är begränsade till nio gratisbilder åt gången inom en minut. Du kan prenumerera på deras Supporter- eller Professional-nivåer (prissatta till respektive per månad och faktureras årligen) för att få inga annonser eller vattenstämplar, snabbare generering och möjligheten att hålla dina genererade bilder privata. En anpassad prenumerationsnivå tillåter också anpassade modeller, integration, dedikerad support och privata servrar.

2 Stabil diffusion 1.5

Stable Diffusion är kanske en av de mest populära modellerna för generering av text-till-bild med öppen källkod. Den driver även andra modeller, inklusive de tre bildgeneratorerna som nämns nedan. Den släpptes 2022 och har haft många implementeringar sedan dess.





  stabil-diffusion-web-ui

Jag ska bespara dig de alltför tekniska detaljerna om hur modellen fungerar (som du kan kolla in deras officiellt Github-förråd ), men modellen är enkel att installera även för helt nybörjare och fungerar bra så länge du har en dedikerad GPU med minst 4 GB minne. Du kan också komma åt Stabil diffusion online, och vi har dig täckt om du vill kör Stable Diffusion på en Mac .

Det finns flera kontrollpunkter (betrakta dem som versioner) tillgängliga att använda för stabil spridning. Medan vi testade version 1.5, version 2.1 är också i aktiv utveckling och är mer exakt.

hur man spelar musik via bluetooth i bil android
  dreamshaper-ai-genererad-bild
Yadullah Abidi/MakeUseOf/DreamShaper

Att köra modellen är också ganska enkelt. Vi testade det med AUTOMATIC1111 Stable Diffusion webbanvändargränssnitt , och alla kontroller och parametrar fungerar bra. Det är också ganska NSFW-säkert tack vare LAION-5B-databasen som modellen tränade på (även om den inte är perfekt, märk väl). Även om generationstiden i sig kommer att variera beroende på din hårdvara, kan du förvänta dig att dina bilder är detaljerade och realistiska även med grundläggande uppmaningar.

3 DreamShaper

DreamShaper är en bildgenereringsmodell baserad på Stable Diffusion. Det var tänkt som ett alternativ med öppen källkod till MidJourney och fokuserar på fotorealism i de genererade bilderna, även om det kan hantera anime och målarstilar lika bra med några justeringar.

Modellen är mer kapabel än Stable Diffusion, vilket ger användarna mer frihet över den slutliga produktionen, allt från blixtförbättringar till lösare NSFW-restriktioner. Att köra modellen är också enkelt, med en nedladdningsbar, förutbildad version tillgänglig online för lokal åtkomst och en mängd webbplatser, inklusive Sinkin.ai , Slumpmässigt frö , och Mage.space (kräver ett grundläggande abonnemang) som låter dig köra modellen med GPU-acceleration.

  dreamshaper-stablediffusion-jämförelse

Som du antagligen kan gissa vid det här laget, tenderar bilder genererade av DreamShaper att se mer realistiska ut jämfört med Stable Diffusion. Även om du kör samma prompt på båda modellerna kommer DreamShaper-modellen sannolikt att vara mer realistisk, detaljerad och bättre upplyst.

Detta gäller särskilt för porträtt eller karaktärer, något jag fann att stabil diffusion saknade jämfört med samma prompt. Om dina bilder blir för realistiska, här är fyra sätt att identifiera en AI-genererad bild .

Du behöver inte heller en jättedator för att köra modellen. Min GTX 1650Ti med 4GB VRAM körde modellen perfekt. Generationstiden var lite längre, men det verkade inte påverka den faktiska produktionen. Som sagt, du kan behöva GPU:er med mer VRAM för att köra DreamShaper XL, som är baserad på Stable Diffusion XL-modellen.

4 InvokeAI

Invoke AI är en annan AI-baserad bildgenereringsmodell baserad på Stable Diffusion, med en XL-version baserad på Stable Diffusion XL. Den har också sitt eget webb- och kommandoradsgränssnitt, vilket innebär att du inte behöver hoppa i hop med saker som Stable Diffusion webbgränssnittet.

  invokeai-användargränssnitt-med-bild

Modellen fokuserar på att låta användare skapa bilder baserat på deras immateriella rättigheter med anpassade arbetsflöden. InvokeAI är en av de bästa AI-bildgenereringsmodellerna med öppen källkod för att träna anpassade modeller och arbeta med immateriella rättigheter.

Dess officiellt Github-förråd listar två installationsmetoder: att installera via InvokeAIs installationsprogram eller använda PyPI om du är bekväm med en terminal och Python och behöver mer kontroll över paketen som installeras med modellen.

Den extra kontrollen medför dock några begränsningar, framför allt strängare hårdvarukrav. InvokeAI rekommenderar en dedikerad GPU med minst 4 GB minne, med sex till åtta GB som rekommenderas för att köra XL-varianten. VRAM-kraven gäller för både AMD och Nvidia GPU:er. Du behöver också minst 12 GB RAM och 12 GB ledigt diskutrymme för modellen, dess beroenden och Python.

  invoke-ai-generated-image
Yadullah Abidi/MakeUseOf/InvokeAI

Även om dokumentationen inte rekommenderar Nvidias GTX 10 Series och 16 Series GPUs för deras brist på videominne, fungerade det medföljande installationsprogrammet bra. Även om din körsträcka kan variera, om du använder en lägre GPU, förvänta dig att vänta längre för att se dina meddelanden omvandlas till bilder. Slutligen, om du använder Windows, kan du bara använda en Nvidia GPU, eftersom det inte finns något stöd för AMD GPU för närvarande.

För bildgenereringsdelen tenderar modellen att luta mer mot konstnärliga stilar än fotorealism. Naturligtvis kan du träna modellen på din datauppsättning och få den att generera bilder närmare vad du vill, även om det involverar fotorealistiska bilder, särskilt om du arbetar i produktdesign, arkitektur eller butikslokaler. En viktig sak att komma ihåg är dock att InvokeAI i första hand är en bildgenereringsmotor, vilket innebär att du sannolikt måste använda dina egna modeller för bästa resultat (enkelt att hitta via modellhanteraren i webbgränssnittet) som standard modellen är ganska lik Stable Diffusion själv.

5 Openjourney

Openjourney är en gratis AI-bildgenereringsmodell med öppen källkod som återigen bygger på Stable Diffusion. Om du undrar varför modellen heter Openjourney så är det för att den tränades på Midjourney-bilder och kan härma sin stil i bilderna den genererar.

PromptHero , företaget bakom Openjourney, låter dig testa modellen tillsammans med andra modeller, inklusive Stable Diffusion (version 1.5 och 2), DreamShaper och Realistic Vision. När du registrerar dig får du 25 gratis krediter (en kredit för varje bild som genereras), varefter du måste prenumerera på deras Pro-prenumerationsnivå, som kostar i månaden och ger dig tillgång till 300 krediter varje månad med andra exklusiva funktioner.

  öppen resa-stabil diffusionsjämförelse

Men om du vill köra det lokalt och gratis kan du ladda ner modellfilen från HuggingFace och kör den med hjälp av webbgränssnittet Stable Diffusion. Openjourney är också den näst mest nedladdade AI-bildgenereringsmodellen på HuggingFace, precis bakom Stable Diffusion.

titta på videor samtidigt

Openjourney listar inga specifika hårdvarukrav för att köra modellen lokalt på sin webbplats, men du kan förvänta dig liknande hårdvarukrav som Stable Diffusion. Detta innebär en dedikerad grafikprocessor med 4 GB VRAM, 16 GB RAM och cirka 12 till 15 GB ledigt utrymme på din dator för att spara modellen och dess beroenden.

  openjourney-ai-generated-image
Yadullah Abidi/MakeUseOf/OpenJourney

Bilder som genereras av Openjourney tenderar att vara balanserade mellan fotorealism och konst om inget annat anges. Om du letar efter en allroundmodell och föredrar Midjourney-utseendet utan att betala för prenumerationen, är Openjourney ett av de bästa alternativen.