Како што објави Alphabet, матичната компанија на Google ги поминала изминатите месеци развивајќи го „својот најнапреден модел на вештачка интелигенција“ под името Gemini.
На презентацијата беше истакнато дека овој долгоочекуван модел на вештачка интелигенција е способен да обработува различни форми на информации како аудио, видео и текст, но е способен и за пософистицирани заклучоци и разбирање на информациите. Подобро од претходната технологија на Google.
Оваа нова ера на модели претставува еден од најголемите научни и инженерски напори што ги презедовме како компанија, напиша извршниот директор на Alphabet, Сундар Пичаи, во официјален блог пост.
Како што истакнаа од Alphabet, моделите Gemini ќе бидат додадени на претходно претставениот асистент за вештачка интелигенција Bard, а исто така беше најавено дека на почетокот на следната година преку Bard треба да излезе понапредна верзија на Gemini.
Имено, Alphabet разви три верзии на Gemini, од кои секоја има различни можности, но е наменета и за различни корисници. Најмоќната верзија, Gemini Ultra, е дизајнирана да работи во центри за податоци, а најмалата, Gemini Nano, е прилагодена да работи на мобилни уреди.
Gemini е најголемиот AI модел кој DeepMind AI на Google помогна да се изгради, но е „значително“ поевтино да им служи на корисниците од претходните, поголеми модели на компанијата, им рече на новинарите потпретседателот на DeepMind Ели Колинс. Значи, не само што е поспособен, туку и далеку поефикасен. Тој додаде дека овој најнов модел сè уште троши извонредна количина на компјутерска моќ за време на учењето, но исто така додаде дека Google работи на подобрување на својот процес.
Демис Хасабис, извршен директор и ко-основач на Google DeepMind, објасни какви способности има Gemini.
Од разбирање природна слика, аудио и видео до математичко расудување, перформансите на Gemini Ultra ги надминуваат тековните резултати на 30 од 32 широко користени академски репери што се користат во истражување и развој на големи јазични модели (LLM).
Со резултат од 90,0%, Gemini Ultra е првиот модел кој ги надминува човечките експерти на MMLU (масивно разбирање јазик со повеќе задачи), кој користи комбинација од 57 предмети како математика, физика, историја, право, медицина и етика за тестирање два света на знаење и способност за решавање проблеми.
Нашиот нов референтен пристап кон MMLU им овозможува на Gemini да ги користи своите способности за расудување за да размислуваат повнимателно пред да одговараат на тешки прашања, што доведува до значителни подобрувања во однос на самото користење на првите впечатоци, забележа Хасабис.
Тој додаде дека тие го дизајнирале Gemini да биде природно мултимодален, претходно обучен од самиот почеток за различни модалитети, а потоа фино подесени со дополнителни мултимодални податоци.
Од Alphabet истакнуваат дека Bard почнувајќи од денес ќе започне да ја користи верзијата Gemini Pro за „понапредно размислување, планирање, разбирање и многу повеќе“. Ќе биде достапен на англиски јазик во повеќе од 170 земји и територии, а во иднина планираат да го прошират и на други модалитети и да поддржуваат нови јазици и локации.
Сопствениците на паметните телефони Pixel 8 Pro ќе бидат првите кои ќе имаат можност да го испробаат Gemini Nano во пракса преку новите функции како што се Summarize во апликацијата Recorder и Smart Reply во Gboard. Тие најавија дека Gemini Nano ќе се користи и во апликациите за пораки – од WhatsApp и пошироко.
Другите ќе можат да го искусат Gemini преку производите на Alphabet и Google како што се Search, Ads, Chrome и Duet AI во наредните месеци.
Веќе почнуваме да експериментираме со Gemini во пребарувањето, каде што го прави нашето генеративно искуство за пребарување (SGE) побрзо за корисниците, со 40% намалување на латентноста на американскиот англиски јазик, покрај подобрувањата на квалитетот, забележа компанијата.
Што се однесува до најсилната верзија, Gemini Ultra, јавноста ќе мора да почека уште малку за да ја испроба.
За Gemini Ultra, моментално ги завршуваме опсежните проверки на довербата и безбедноста, вклучително и црвениот тим од доверливи трети страни, и дополнително го усовршуваме моделот користејќи човечко дотерување и учење за зајакнување (RLHF) пред да го направиме широко достапен, објаснува компанијата.
Затоа Gemini Ultra прво ќе биде достапен за одредени клиенти, програмери, партнери и професионалци за безбедност и одговорност за рано експериментирање и повратни информации пред да стане достапен за програмерите и деловните корисници на почетокот на следната година.
Alphabet, исто така, најави нова генерација на сопствени чипови со вештачка интелигенција или единици за обработка на тензори (TPU). Cloud TPU v5p е дизајниран за обука на големи модели со вештачка интелигенција и е склопен во пакети со чипови од 8960.