
Hröð aukning kynslóðar AI hefur heillað heiminn með fyrirmyndum eins og SpjallGPT, GPT-4og Claude sem sýnir fram á ótrúlega tungumálakunnáttu. Hins vegar, þar sem þessir AI kerfi verða algengari, grundvallartakmörkun er sífellt að verða ljósari: takmarkanirnar sem settar eru af tokenization ferli og táknamörk.
Í kjarna sínum, skapandi AI Líkön eins og GPT brjóta niður innsláttartexta í smærri einingar sem kallast tákn áður en unnið er úr honum. Tákn geta táknað orð, hluta orða, eða jafnvel einstakar persónur. Með því að vinna á táknum í stað hráefnis texta geta þessi líkön meðhöndlað og búa til tungumál.
Hins vegar kynnir þetta auðkennisferli áskoranir. Ósamræmi í því hvernig texti er sundurliðaður getur leitt til hlutdrægni og ruglings hjá þeim AI módel. Tvíræðni um hvað telst „orð“ og hvernig greinarmerki eru meðhöndluð við táknvæðingu og geta haft áhrif á líkan's skilningur og myndun tungumáls.
Mikilvægara er að skapandi AI Líkön hafa strangar takmarkanir á fjölda tákna sem þau geta unnið úr í einni inntaks-úttaks víxlverkun, þekkt sem samhengisgluggi. Til dæmis, GPT-3 hefur hámark 2049 tákn, en GPT-4 getur séð um 8192 táknÞegar leiðbeiningar og inntak fara yfir þessi mörk, þá mun gervigreindin's afköstin versna verulega.
Þessi táknamörk eru mikil hindrun þegar reynt er að sækja um kynslóðar gervigreind til flókinna, margþrepa verkefna sem krefjast vinnslu mikils magns upplýsinga. Fyrirtæki sem vilja nýta sér AI Fyrir flókin vinnuflæði eru þau oft takmörkuð af þessum stærðum samhengisglugga.
Unnið er að því að auka þessi mörk og draga úr „tákn flöskuháls„Google“'s Nýjasta Gemini módel hefur ýtt mörkunum í 1 milljón tákn. Hins vegar er það kostnaðarsamt að auka samhengisgluggann, þar sem kostnaður vex fjórðungslega með gluggastærðinni.
Til að vinna í kringum token limits, tækni eins og endurheimt aukin kynslóð (RAG) eru verið að skoða. RAG gerir kleift að AI líkan til að nálgast og fella inn þekkingu frá utanaðkomandi aðilum, umfram upphaflega þekkingu hennar þjálfunargögnHins vegar hefur RAG sínar eigin áskoranir varðandi skilvirka sókn á viðeigandi upplýsingum og óaðfinnanlega samþættingu þeirra við gervigreindina.'s framleiðsla.
Takmarkanir á auðkenningu og táknamörkum hafa víðtæk áhrif á milli atvinnugreina. Á sviði Leita Vél Optimization (SEO), skapandi AI hefur mikla möguleika fyrir verkefni eins og leitarorðarannsóknir, innihaldsgreiningu og ráðleggingar um hagræðingu. Hins vegar gæti vanhæfni til að vinna úr og búa til langtímaefni takmarkað skilvirkni þess við að búa til alhliða, ítarlegar auðlindir.
Sem skapandi AI landslagið þróast og tekur á takmörkunum tokenization og táknamörk munu skipta sköpum. Nýjungar í módelarkitektúr, svo sem líkön á bætistigi sem fara framhjá hefðbundinni auðkenningu, sýna loforð en eru enn á fyrstu rannsóknarstigi.
Á næstunni mun breyting í átt að ráð sérhæfðra AI módel, hvert einbeitt að tilteknu sviði og styrkt með RAG, gæti boðið upp á leið fram á við. Með því að dreifa vinnuálagi yfir margar sérhæfðar gerðir, er hægt að minnka traustið á einni kynslóðarlíkönum. AI með miklum táknmörkum gæti verið minnkað.
Á endanum, árangur af kynslóðar gervigreind í raunverulegum forritum mun lúta að því að finna rétta jafnvægið á milli líkansérhæfing, táknamörk og reikniskilvirkni.

