Apple сè уште не е еден од најголемите играчи во областа на вештачката интелигенција, но сега компанијата претстави нов Open source AI модел за уредување фотографии, со кој покажа дека може да даде придонес на ова поле.
Станува збор за модел наречен MLLM-Guided Image Editing (MGIE), кој користи мултимодални јазични модели од големи размери (MLLM) за интерпретација на наредби базирани на текст при манипулирање со фотографии. Со други зборови, алатката има можност да уредува фотографии врз основа на текстот што го пишува корисникот.
Компанијата го разви MGIE во соработка со истражувачи од Универзитетот во Калифорнија. MLLM имаат способност да трансформираат едноставни или двосмислени текстуални инструкции во подетални и јасни инструкции, кои самиот уредник може да ги следи. На пример, ако корисникот сака да уреди фотографија од пица за да ја „направи поздрава“, MLLM може да го протолкува тоа како барање за додавање зеленчук и уредување на фотографијата на тој начин.
Покрај големите промени на фотографиите, MGIE исто така може да сече, менува големина и ротира фотографии, како и да ја подобри осветленоста, контрастот и балансот на боите, сето тоа преку текстуални команди. Исто така, може да уредува одредени делови од фотографијата, но и да ја модифицира косата, очите и облеката на личноста и да отстранува елементи што се во позадина.
Apple го објави моделот преку GitHub, но заинтересираните можат да пробаат демо верзија достапна преку Higging Faces Spaces.
Apple сè уште не откри дали планира да го искористи наученото од овој проект за алатка или функција за интегрирање во некој од своите производи.