Leonas Gauhmanas
2024 m. dar kartą patvirtino „Generative AI“ inovacijų trajektoriją, paskelbdami novatoriškus pranešimus, kurie ne tik peržengė ribas – jie jas iš naujo apibrėžė. Etalonų laužymas tapo kasdienybe, išryškindamas nenumaldomą aikštės tempą. Šios pažangos priešakyje yra multimodaliniai modeliai, kurios leidžia AI sistemoms ne tik apdoroti tekstą, bet ir interpretuoti vaizdus, garsą ir vaizdines išraiškas. Šis šuolis link multimodalumo suteikia modeliams gilesnį ir sudėtingesnį pasaulio supratimą, sudaro sąlygas intuityvesnei ir įvairiapusiškesnei žmogaus ir AI sąveikai bei atveria kelią robotams, galintiems sąveikauti ir suprasti savo aplinką.
Be antraštes prikaustančių OpenAI ir Google pranešimų, atsiranda tylesnė, daug pasakanti istorija: DI kraštovaizdis bręsta. Pagrindiniai žaidėjai dabar pristatė savo pavyzdinius modelius, o sritis pradeda artėti. Būsimas OpenAI modelis, OrionasPavyzdžiui, užsimenama apie lėtesnį plėtros tempą, o tai rodo, kad reikia pereiti nuo neapdorotų inovacijų prie tobulinimo ir pritaikymo.
Taigi, ką tai reiškia technologijų tendencijoms 2025 m.? Štai šešios mūsų atskleistos įžvalgos:
1. Tas pats, tas pats: GenAI tampa prekėmis
Praėjus dvejiems metams nuo „ChatGPT“ paleidimo, „GenAI“ sparčiai tampa prekėmis. Dėl greičio, kuriuo jie gali būti mokomi, atvirojo kodo GenAI modeliai, pvz „Mistral“, „Stable Diffusion“ ir „Meta Lama 3“. sparčiai mažina atsilikimą nuo OpenAI, Google, Microsoft, Anthropic – šiandienos rinkos lyderių. Atvirojo kodo modeliai ne tik greičiau mokomi, bet ir naudojant sintetinius duomenis, modelis gali būti mokomas efektyviau. Didesnė konkurencija tarp atvirojo kodo ir pagrindinių modelių yra gera žinia įmonėms, nes GenAI ir LLM taps pigesni ir prieinamesni.
2. Bye Bye SaaS – „pasidaryk pats“ DI taps nauja norma
Naujos kartos programinės įrangos sprendimai turės turėti reikšmingą GenAI elementą, kuris vis dažniau parduodamas. Tai reiškia, kad dirbtinio intelekto sprendimų kūrimas ant brangios SaaS platformos neturi prasmės, nes įmonės gali naudoti GenAI ir sukurti ją viduje. Tikimasi, kad išlaidos SaaS įrankiams pasieks 197 milijardai doleriųverslo lyderiai patirs vis didesnį spaudimą kirsti savo brangias SaaS platformas.
Be to, kai GenAI yra labiau pritaikyta prekėms, dirbtinio intelekto sprendimų kūrimas kartu su patentuotu pagrindiniu modeliu taip pat bus mažiau prasmingas verslui. Vietoj to, į priekį mąstantys verslo lyderiai išnaudos konkurenciją tarp atvirojo kodo ir patentuotų pagrindinių modelių, kurių galimybės ir toliau jungiasi, ieškodami sprendimų, kurie leistų jiems sukurti individualiai sukurtus AI sprendimus viduje nuo nulio. Kai kurie iš šių modelių bus tradiciniai LLM, o kiti bus mažų kalbų modeliai (SLM), kurie optimizuoti konkrečioms užduotims atlikti ir sunaudoja mažiau išteklių.
3. Generatyvi vartotojo sąsaja bus konkurencinis skirtumas
Dabartinės AI sąsajos skirtos bendrosios paskirties sąveikoms, o tai riboja jų efektyvumą specializuotose srityse arba sudėtingose darbo eigose. Vartotojai dažnai praleidžia daug laiko kurdami tikslius raginimus, kad gautų norimus rezultatus.
Kai pereiname už pokalbių sąsajos ribų Sudėtingesnėms „Generative AI“ (GenAI) sistemoms ateitį nulems „Generative UI“ („GenUI“): sąsajos, dinamiškai prisitaikančios prie vartotojų poreikių, slepiančios dirbtinio intelekto sudėtingumą už sklandžią patirtį. Matėme, kad tai atsitiko su kompiuteriais ir GUI, mobiliaisiais telefonais ir „iPhone“.
GenUI yra esminis vartotojo sąsajų kūrimo ir sąveikos su jomis pokytis. Iš esmės jis išnaudoja AI modelių gebėjimą generuoti kodą realiuoju laiku, todėl pagal poreikį galima sukurti naujus ir pritaikytus vartotojo sąsajos elementus bei sąveikas. Šis pokytis leis vartotojams sutelkti dėmesį į atliekamą užduotį, o ne į tai, kaip jie bendrauja su AI. Naudodamos „GenUI“, kad tinkamai išspręstų reikiamas problemas, įmonės gali sukurti puikių įrankių ir darbuotojų patirties, padedančių išsiskirti ir suteikti konkurencinį pranašumą.
4. 2025 m. padaugės autonominių AI agentų
2025 m. galime tikėtis, kad technologijos pereis prie autonominių agentų, tokių kaip Baby AGI ir Auto GPT kurios turi didesnę įgaliojimus atlikti paskirtas užduotis. Praktiškai jie gali atlikti skirtingus užduoties etapus ir veikti pagal rezultatus, nereikalaujant žmogaus indėlio.
Atsiradus kelių agentų sistemoms, pvz OpenAI spiečius, LangGraphir Reaguotiįmonės dabar gali sujungti atsijungusius agentus naudodamos išmaniąsias bendradarbiaujančias sistemas, sukurdamos vientisą tinklą, pakeičiantį sprendimų priėmimą ir veiklos efektyvumą.
Šios sistemos skatina kelių agentų sistemas tapti vis labiau agentiškomis, o tai reiškia, kad jas maitina savarankiški agentai, galintys samprotauti, planuoti, mokytis iš praeities sąveikos ir bendrauti tarpusavyje. Šis pokytis leidžia kelių agentų sistemoms peržengti paprastą užduočių koordinavimą ir iš esmės pakeisti programinės įrangos integravimą į įmonės aplinką, galinčią padidinti produktyvumą.
5. Didžiųjų įmonių pavadinimai paskelbs apie dideles AI transformacijas
Multimodalinių AI, galinčių suprasti vaizdinius ir žodinius kontekstus ir juos sujungti, kad sukurtų naują, sudėtingesnį pasaulio pojūtį, atsiradimas reiškia žingsnius produktyvumo pokyčiuose. Įmonės dabar gali naudoti įvairias įvestis, įskaitant balsą, vaizdo įrašą ir kodą, kad sukauptų daug platesnį informacijos ir konteksto spektrą, kad galėtų pagrįsti savo AI. Galiausiai multimodalumas reiškia žingsnį siekiant surinkti ir pateikti užklausas apie visą organizacijos kompetencijos ir praktinių žinių rinkinį. Visa tai veda į naują AI patobulintų darbuotojų erą, kuriuos palaiko ir įgalina dirbtinio intelekto įrankiai, specialiai pritaikyti jų poreikiams. Šios pagal užsakymą sukurtos priemonės padidins darbuotojų produktyvumą ir gerovę darbe, o tai leis pasiekti naujus augimo ir efektyvumo lygius.
Tikimasi, kad 2025 m. didelių įmonių pavadinimai paskelbs apie dirbtinį intelektą ir produktyvumą, o tai darys spaudimą kitoms įmonėms daryti tą patį rinką. JP Morgan Chase AI asistentas LLM Suite yra ankstyvas šios tendencijos pavyzdys. Turi būti įdiegta iki 140 000 darbuotojų„GenAI“ įrankis veikia kaip „tyrimų analitikas“, galintis kurti ir tobulinti rašytinius dokumentus, įskaitant ilgų temų apibendrinimą, ir siūlyti kūrybingus sprendimus, naudodamas papildytą kartojimą (RAG). RAG sujungia patentuotus duomenis su pagrindiniais kalbos modeliais, kad sumažintų haliucinacijas, padidintų tikslumą ir padidintų įžvalgų rinkimą. Bankas įvertina savo AI programas gali pristatyti iki 2 milijardų dolerių vertės.
6. Tikėtis didelio masto robotikos diegimo
2025 m. turėtų būti permainingi robotikos srityje, o gamyboje ir logistikoje numatomi didelio masto diegimai, kuriems vadovaus tokios įmonės kaip „Tesla“. Šį augimą skatins GenAI, multimodalumas ir kompiuterinė vizija, leidžianti bendradarbiauti robotams (kobotams), pvz. Agility skaitmuo — prisitaikyti prie sudėtingų užduočių, interpretuoti įvairias įvestis ir saugiai dirbti kartu su žmonėmis. Tikimasi, kad kobotai rems įvairias pramonės šakas, nuo automobilių surinkimo iki maisto ir gėrimų, kur jų tikslumas ir pritaikomumas gali valdyti didelio mišinio ir mažos apimties gamybą.
Kalbant apie vartotoją, tikėtina, kad sulauksime buitinių robotų, galinčių atlikti įvairias kasdienes užduotis – valyti, išpakuoti bakalėjos prekes ir išmesti atliekas – įnešdami į pagrindinius kažkada naujus patogumus.
