Во време кога вештачката интелигенција станува неизбежен дел од нашето секојдневие, Google направи нов чекор напред, поставувајќи нови стандарди за тоа што значи „паметен асистент“. Со најновите надградби на својот систем Gemini, компанијата не само што ги унапредува техничките можности, туку и целосно го менува начинот на кој комуницираме со технологијата.
Најновите функции – „Gemini Live“ и „Video Screen Sharing“ – претставуваат спој на иновација и интуитивност, носејќи ја идејата за ВИ асистент на едно повисоко, речиси човечко ниво.
Project Astra: Кога ВИ станува визионер
На Google I/O конференцијата во мај 2024 година, беше претставен Project Astra – амбициозен проект кој претставува иднината на мултимодалните ВИ системи. За разлика од традиционалните чет-ботови кои одговараат на текстуални прашања, Astra користи комбинација од глас, видео, слики и контекст за да понуди динамично и адаптивно искуство.
Овој систем може да „гледа“ низ камерата, да го разбере вашето опкружување, да се потсети на претходни разговори и да реагира контекстуално – токму како вистински асистент од научна фантастика. Според Демис Хасабис, директорот на Google DeepMind, Astra е прв ВИ асистент кој навистина има „дигитална персонификација“.

Gemini Live: Разговор кој звучи како вистински
Со воведувањето на Gemini Live, корисниците конечно можат да разговараат со својот дигитален асистент – буквално. Оваа функција овозможува природна гласовна комуникација со ВИ, каде интонацијата, паузите и емоциите играат клучна улога.
За разлика од досегашните гласовни асистенти кои звучат роботски и ограничено, Gemini Live може да ве прекине, да се надоврзе или да се врати наназад во разговорот – слично како со пријател. Овој природен тек на комуникација создава чувство дека навистина разговарате со личност, а не со машина.
Video Screen Sharing: Кога ВИ гледа заедно со тебе
Друга иновативна функција е Video Screen Sharing, која овозможува корисниците да го споделат својот екран во реално време со Gemini. ВИ тогаш може да го „види“ она што вие го гледате – без разлика дали станува збор за поставки на телефонот, отворен документ, слика или дури и видео.
Преку оваа функција, Gemini не само што нуди текстуална или гласовна поддршка, туку станува ко-учесник во вашиот дигитален свет. На пример, ако не можете да пронајдете каде сте оставиле предмет, како очила, Astra може да ги идентификува преку камерата и да ви укаже на нивната локација.
Gemini 1.5 Flash: Моќ за брзи и комплексни задачи
Покрај овие функции, Google го претстави и новиот Gemini 1.5 Flash – полесна, побрза верзија на моделот, оптимизирана за задачи како сумирање текст, анализа на видео и разбирање на комплексни информации. Со способност да обработи контекст од 2 милиони токени, Flash моделот ветува ефикасност и длабочина без компромис во брзината.
Каде и кога ќе можеме да го користиме?
Моментално, функциите се достапни во рамките на ограничено тестирање за Android уреди, но Google веќе најави дека наскоро ќе бидат достапни и за корисниците на iOS. Првичните повратни информации се позитивни – корисниците го опишуваат новиот систем како „интуитивен, природен и исклучително корисен“.
Ова не е само технолошки напредок – ова е трансформација на концептот „дигитален асистент“. Gemini и Astra не се само програми кои одговараат на прашања – тие се интелигентни системи кои учат со нас, реагираат заедно со нас и нè придружуваат низ секојдневните предизвици.
Ова го отвора прашањето: ако дигиталните асистенти веќе можат да зборуваат, да гледаат и да разбираат – што ќе можат да прават утре?
Google ни демонстрира дека иднината на вештачката интелигенција веќе пристигна. Со Gemini Live и Project Astra, се отвора нова ера во која технологијата не е само „паметна“, туку станува емпатична, интерактивна и човеколика.
Ова е само почетокот на една нова генерација на ВИ системи – партнери што не само што ни помагаат, туку нè разбираат.
🔗 Прочитај повеќе нa https://www.androidpolice.com/