A keresőóriás második generációs multimodális technológiája a szövegek mellett képes szóbeli és vizuális inputok alapján is dolgozni, képet és hanggenerálást is támogat.
Ismét egymásra licitálnak a generatív mesterséges intelligencia piacán versengő óriások: alig egy héttel azután, hogy az OpenAI nyilvánosan elérhetővé tette o1 modelljét és a Sora videógenerátort, a Google bejelentette az egyelőre előnézeti verzióban hozzáférhető újgenerációs Gemini 2.0 modellt. Sundar Pichai vezérigazgató bejegyzése szerint a 2.0 egyik fő előrelépése elődjéhez képest, hogy natív támogatást kínál kép- és audiókimenet létrehozásához.
A keresőóriás némileg stratégiát váltott, és először nem a Gemini 2.0 legfejlettebb Pro változatát vezeti be, hanem a hatékonyabb és olcsóbb 2.0 Flash modellt, ami minden felhasználó számára hozzáférhető mobilalkalmazáson és webes kliensen keresztül. A Gemini 2.0 Flash a versenyszintű matematikai feladatok megoldására való képességet mérő HiddenMath tesztjén 63 százalékos értékelést kapott, ami előrelépés a Gemini 1.5 Flash által teljesített 47,2 százalékhoz képest.
Az új modell több téren túlteljesíti a 10 hónapja bemutatott Gemini 1.5 Pro-t, mindössze egy területet lehet kiemelni, ahol gyengébb, ez pedig a hosszabb szövegek megértése és az automatikus beszédfordítás. A keresőóriás ezért sem fogja kivezetni a korábbi modellt a szolgáltatásai listájáról. A Gemini 2.0 emellett képes együttműködni harmadik féltől származó alkalmazásokkal, a cég által közzétett videón például látható, amint egy többlépcsős folyamaton keresztül a tervezéstől indulva segít egy webes vásárlás elvégzésében a felhasználónak.
A többi vállalathoz hasonlóan a Google is gyakorlatilag minden saját termékébe beépíti saját AI-technológiáját, és próbál olyan termékeket fejleszteni, amelyeket más fejlesztők is használni szeretnének. Mindeközben versenyeznek a rendkívül költséges üzemeltetést hatékonyabbá tevő infrastruktúra kiépítésén. Az Amazon, a Microsoft, az Anthropic és az OpenAI szintén milliárdokat öntenek bele nagyjából ugyanezekbe a kihívásokba.
A Google nem titkolt célja, hogy a 2.0 modell idővel a keresőben és az AI Overview funkció alatt dolgozzon és hatékonyabbá tehesse az internetes keresést, miután már összetettebb kérdések kezelését is hatékonyabban végzi el, beleértve a többlépcsős matematikai problémákat és kódolási feladatokat. A modell szolgáltathat alapot további olyan AI-projekteknek is, mint a Project Astra AI-ügynök, ami több nyelv támogatásával bővül a jövőben, írja a hwsw.hu.
Nincs hozzászólás. Legyen az első!