Google predstavlja Gemini 2.5 Flash Image, model, ki omogoča impresivno retuširanje s pomočjo umetne inteligence

Google je napovedal, da je avtor nano-banane, ki je nekaj dni vodila v lestvicah modelov za generiranje slik Gemini. Zdi se namreč, da se odlično spopada z vizualnim retuširanjem.

Po dolgem zaostanku na tem področju Google naredi korak naprej v generiranju slik. V torek, 26. avgusta 2025, je kalifornijsko podjetje uradno predstavilo Gemini 2.5 Flash Image, model, ki je bil prvotno razvit, da bi uporabnikom omogočil večji nadzor nad vizualno obdelavo, »s posebnim poudarkom na ohranjanju podobnosti lika iz ene slike v drugo«, kar je ponavljajoča se pomanjkljivost pri njenih konkurentih. Njena globalna uvedba se je začela z aplikacijo Gemini, API Gemini, Google AI Studio in Vertex AI, kot pojasnjuje podjetje v svojem sporočilu za javnost.

Model, ki je že pred svojim lansiranjem vodil v razvrstitvi LMArena

Ta model, ki ga je razvil Google DeepMind, je bil v zadnjih dneh predmet špekulacij, potem ko je bil neopazno objavljen pod imenom nano-banana – njegovim notranjim vzdevkom – na platformi LMArena, ki se uporablja za objektivno ocenjevanje zmogljivosti modelov na podlagi prispevkov uporabnikov. Zaradi svoje visoke učinkovitosti je hitro postala vodilna v kategorijah „Urejanje slik“ in „Besedilo v sliko“, pri čemer je prehitela zlasti 4o Image Generation, tehnologijo, ki je od marca letos integrirana v ChatGPT.

Da bi si lahko ogledali te vsebine iz družbenih omrežij, morate sprejeti piškotke in oglaševalske sledilce.

Ti piškotki in sledilci našim partnerjem omogočajo, da vam ponujajo oglase in vsebine, prilagojene vašemu brskanju, profilu in interesom. Dodatne informacije.

Gemini 2.5 Flash Image izvaja retuširanje brez poslabšanja kakovosti

Posebnost te tehnologije, ki ni namenjena nadomestitvi Imagen – druge serije modelov za generiranje slik od Googla – je v njeni sposobnosti ustvarjanja novih elementov ali spreminjanja obstoječih brez poslabšanja vizualne kakovosti in brez ustvarjanja vtisa, da je slika generirana z umetno inteligenco. „Resnično izboljšujemo vizualno kakovost in sposobnost modela, da sledi navodilom“, meni Nicole Brichtova, vodja produkta v Google DeepMind, v kolumni TechCrunch.Z Gemini 2.5 Flash Image je mogoče kombinirati več fotografij, da »ustvarite povsem novo sceno«, spremenite oblačila osebe ali jo

postavite v drug dekor, pri čemer ohranite njen videz, ali »spremenite določene dele slike, ostalo pa ohranite«, kot ponazarja Google v svojem blogu. In vse to s preprostim zahtevkom. Kot je prikazano v spodnjem primeru, ki ga je posredovalo podjetje, lahko model doda kavč, knjižno omaro, preprogo ali spremeni barvo prazne sobe, ne da bi spremenil izvorno fotografijo. In, moramo reči, z dokaj impresivnim rezultatom.

Gemini

Vemo, da ko gre za urejanje fotografij sebe ali znancev, so napake pomembne – »podobna, a ne povsem identična« slika ni primerna, trdi Google.

Google navaja, da za preprečevanje zlorab vsaka slika, ustvarjena ali spremenjena v aplikaciji Gemini, vključuje vidni vodni žig »AI« »in [nevidni] digitalni vodni žig SynthID, da se jasno navede, da so bile ustvarjene z umetno inteligenco«.

Kako preizkusiti Gemini 2.5 Flash Image?

V času pisanja tega članka ta »napredna model« še ni na voljo, vendar bo po navedbah Googla od tega torka postopoma uvajan v aplikacijo Gemini. Na voljo bo tako brezplačnim kot plačljivim uporabnikom, verjetno z nekaterimi omejitvami. Uporabnik bo lahko preprosto dodal eno ali več slik s predlogom, da začne generiranje ali urejanje.

Scroll to Top