На почетокот на својата годишна конференција за програмери, Google I/O 2024, компанијата уште еднаш потврди дека ги фрла сите карти на генеративната вештачка интелигенција, воведувајќи го моделот Gemini во веб-прелистувачот, Gmail, Photos…
Само еден ден откако OpenAI претстави низа подобрувања во својот ChatGPT и поврзаните технологии, се одржа воведниот Keynote на отворањето на Google I/O конференцијата за програмери, каде што очекувано најголем акцент беше ставен на генеративните системи за вештачка интелигенција и нивна имплементација во производите и услугите на Google.
„Google целосно влезе во својата ера на Gemini“, велат од компанијата, нагласувајќи дека овој систем на генеративна вештачка интелигенција ќе има многу истакнато место во сите нивни услуги, почнувајќи од пребарувачот и Gmail, па сè до апликацијата Photos и бизнис апликациите. Некои од новите функции веќе беа претставени на почетокот на I/O конференцијата, иако сè уште нема да бидат достапни за пошироката јавност.
Јазичен модел Gemini
За напредните корисници и претплатници, најважната вест е надградбата на јазичниот модел на верзијата Gemini 1.5 Pro, која сега е уште подобра во преводот, програмирањето, рационалното „размислување“ и мултимодалната работа. За да може секој да го користи за напредни функции, Google му даде можност за најголемиот опсег на влезни податоци во светот – Gemini 1.5 во Flash и Pro верзиите може да прими до милион текстуални токени во својот „контекст прозорец“, а наскоро ова ќе да се прошири на дури два милиони. Покрај тоа, пристапот преку API стана поевтин, па програмерите чии апликации се поврзани со Gemini имаат за што да се радуваат.
GenAI во пребарувачот
Продолжува имплементацијата на AI моделот во најпознатиот производ на Google, интернет пребарувачот. Сè повеќе корисници наскоро ќе добијат пристап до функцијата AI Overviews. На прашањето поставено до пребарувачот ќе одговори со резултатите што ги подготвил вештачката интелигенција – па така, наместо вообичаените линкови до резултатите, ќе се добиваат одговори на прашања со слики, линкови и готови приспособени објаснувања. Сето ова прво ќе биде достапно за американските корисници и само на англиски јазик.
Новите можности на пребарувачот вклучуваат и помош при планирање патувања, попаметна организација на класичните резултати од пребарувањето и мултимодално пребарување. Последново значи дека корисникот ќе може да сними кратко видео или фотографија, а потоа да му поставува прашања на пребарувачот на Google поврзани со ваква мултимедијална содржина.
Оние, пак, на кои не им се допаѓа ваквата промена на пребарувачот што го користат секојдневно и на кој се навикнати, ќе можат да ги исклучат автоматски генерираните одговори. На врвот од резултатите од пребарувањето, покрај табовите за слики, мапи, вести и слично, ќе се најде уште еден – „веб“, кој пред корисникот ќе ги прикажува само вообичаените линкови, како и досега.
Ask Photos
Друга апликација, каде што GenAI ќе има големо влијание е Photos. Околу шест милијарди фотографии и видеа преку неа секој ден се прикачуваат на облакот на Google. Не е лесно да се справите со толку голема количина на материјал, така што новата функција „Ask Photos“ ќе им помогне на корисниците да ја пронајдат токму содржината што им е потребна во даден момент.
На пример, ќе можете да ја прашате апликацијата „Кога ќерка ми научи да плива?“, а таа ќе ја пребара базата на вашите фотографии, ќе го препознае контекстот и ќе одговори на тоа прашање, и со текст и фотографии како „доказ“. . Поддржани се и посложени прашања, како на пример „Каква е мојата регистрација на автомобилот?“, „Како ќерка ми напредува со пливањето?“, „Што правевме за нејзините родендени во изминатите години?“, „Покажи ми ги најдобрите фотографии од националните паркови во кои сум бил“ и слично – и апликацијата Photos ќе може да одговори на нив користејќи содржина на слики, податоци за локација и се разбира, јазичниот модел Gemini.
Како и поголем дел од претставеното, Ask Photos ќе пристигне до крајните корисници во експериментална форма во наредните месеци.
Projekt Astra
Дека Google оди отприлика во иста насока како OpenAI беше потврдено со демонстрацијата на новиот GenAI проект за личен асистент наречен Astra. Иако се уште е во рана фази на развој, видливи се контурите на она што сака да се постигне со него: да го претвори мобилниот телефон во интерактивен и „сезнаен“ личен асистент кој ја гледа, слуша и разбира околината. Врз основа на овие информации, тој може да дава одговори, препораки, совети, помош во секојдневниот живот, но и во програмирањето, навигацијата во вселената и слично, сето тоа користејќи природен јазик и разговор без забележливо задоцнување (lag).
Gemini во Workspace
Претплатниците на апликациите на Google од пакетот Workspace (Gmail, Docs, Drive, Slides, Sheets) веќе ќе добијат нов страничен панел, посветен на моделот Gemini и паметниот асистент. Таму ќе можат да ги користат функциите како што се генерирање и презентација на текст, скратување долги документи, паметно пребарување, превод на текст и слично, покренати од мултимодален модел на вештачка интелигенција.
На пример, во рамките на апликацијата Gmail (мобилна и десктоп), ќе може да се побара помош од Gemini при пронаоѓање на најважните информации во пораките, автоматско пишување на приспособени одговори или контекстуална навигација во „шумата“ на мејловите.