I grandi mudelli linguistici ponu risolve sfide cumplesse è disordinate?

by Ali

1 anno fa 0 936

Grandi Modelli di Lingua è Sfide di Ragionamentu Disordinate

Ehi, AI Appassionati! Sò Ali, u tippu daretu à AIMOJO, è sò statu ossessionatu da l'intelligenza artificiale dapoi i tempi quandu i chatbot ùn pudianu guasi mette inseme duie frasi.

In seguitu, AI Si sentia cum'è un schizzu di qualcosa di enormu, è avà ? Hè una maraviglia quotidiana - pensate à ChatGPT, Grok, è l'ultime scoperte in i grandi mudelli di lingua (LLM).

Esecutà AIMOJO mi permette di perseguità a mo passione: capisce ciò chì sta tecnulugia pò veramente fà, soprattuttu quandu si tratta di prublemi intricati di u mondu reale chì ùn venenu micca cun un fogliu di trucchi.

Dunque, scavemu in una grande quistione: quantu bè ponu i LLM risolve sfide cumplicate è disordinate?

Chì definisce un prublema "disordinatu"?

I prublemi insulsi ùn sò micca i vostri simplici rompicapi "Quantu hè 5 per 7?". Sò quelli chì vi danu l'impressione di assemblà un puzzle cù l'ochji bendati - pezzi dappertuttu, senza un puntu di partenza chjaru. Queste dumande piglianu infurmazioni da parechji lochi è esigenu salti logichi per ligà tuttu inseme.

Un veru esempiu:

Pigliate questu: "In quale annu hè natu u capu di a banda chì hà interpretatu a canzone campionata in "Power" di Kanye West?" Eccu cumu si pò risolve:

Cumu i Grandi Modelli di Lingue Gestiscenu Sfide Disordinate

Step 1Ricunnosce chì "Power" campiona "21st Century Schizoid Man" di King Crimson.
Step 2: Identificate u capu di a banda di King Crimson cum'è Robert Fripp.
Step 3Determinate l'annu di nascita di Fripp - 1946.

Hè una quistione multi-hop. Ùn vi ricordate micca solu un fattu; state cucendu inseme una catena di elli. Hè ragiunamentu, micca memoria meccanica, è hè un test perfettu per i LLM.

Perchè hè difficiule

I prublemi insulsi facenu inciampà i mudelli perchè si basanu nantu à i punti di cunnessione trà i duminii - musica, storia, cultura pop. Se si manca un ligame, tutta a risposta si sdrughje.

U Dataset FRAMES: Una prova di stress per i LLM

I circadori anu custruitu u Inseme di dati FRAMES per vede cumu l'LLM resistenu sottu pressione. Publicatu in un articulu di u 2024 hè una cullezzione di 824 dumande à più tappe. Quessi abbraccianu l'inferenza, a matematica, a logica è u ragiunamentu basatu annantu à u tempu, cum'è u calculu di l'età di qualchissia da indizii storichi.

U Dataset FRAMES - Una prova di stress per i LLM — Source: Documentu di ricerca

I Numeri

Quandu i migliori LLM anu affrontatu FRAMES senza aiutu, anu puntuatu circa Accuratatu 40%Decente, ma micca abbagliante.

Dopu, i circadori li anu datu una ancora di salvezza: accessu à l'infurmazioni esterne via Retrieval-Augmented Generation (RAG). Cù questu, a precisione hè salita à 66-73%, secondu a cunfigurazione. Hè un grande saltu, chì mostra chì i LLM brillanu di più cù u sustegnu ghjustu.

Digging Deeper

U documentu FRAMES nota chì alcune dumande necessitanu finu à sei passi di ragiunamentu. Per esempiu: "Sè una figura storica avia 35 anni durante un avvenimentu di u 1945, è u so fratellu hè natu 3 anni dopu, quanti anni avia u fratellu in u 1980?" Què hè matematica, tracciamentu di a cronologia è inferenza riunite in una - roba difficiule!

Generazione aumentata di recuperu (RAG): A tecnulugia daretu à u Boost

Cumu funziona a tecnulugia RAG cù i LLM

RAG hè cum'è dà un LLM un assistente di ricerca rapidaEccu u prucessu:

Fase di ricercaU sistema scansiona una basa di dati - pensate à Wikipedia, documenti di l'impresa o u web - per truvà infurmazioni pertinenti.

Fase di RagionamentuU LLM combina a quistione cù i dati recuperati è custruisce una risposta.

Perchè Aiuta

I LLM ùn conservanu micca ogni fattu in i so dati di furmazione. RAG riempie queste lacune. In FRAMES, quella linea di basa di u 40% chì cresce à u 66-73% prova chì hè un cambiamentu di ghjocu per u ragiunamentu multi-hop.

Esempiu di u mondu reale:

Un chatbot di supportu à i clienti alimentatu da RAG pò recuperà documenti pertinenti da a basa di cunniscenza di una cumpagnia è generà dati precisi, risposte sensibili à u cuntestu à e dumande di l'utilizatori. Questu garantisce una assistenza precisa è persunalizata in tempu reale, aumentendu a satisfaczione di i clienti.

A Catch
Ùn hè micca infallibile. Sè a ricerca tira dati irrilevanti o rumorosi, l'LLM pò sempre sbaglialli. Un video di YouTube hà mostratu un mudellu chì malinterpretava un documentu vagu, riducendu a precisione di u 15% in certi casi.

Induve i LLM luttano

I LLM anu difficultà in AI U ragiunamentu

Currispundenza di mudelli vs. Vera logica - Evidenza

A Studiu MIT CSAIL 2024 hà rivelatu chì i grandi mudelli di lingua (LLM) eccellenu in i compiti familiari, ma luttano significativamente cù scenarii novi, basendu si più nantu à a memorizazione chè nantu à u ragiunamentu genuinu. U mudelli testati da a ricerca nantu à compiti contrafattuali, cum'è pusizioni di scacchi alterate è aritmetica in sistemi non-base-10, induve a precisione hè diminuita dramaticamente.

L'innuvazione cumunitaria chì guida u futuru di AI U ragiunamentu

A spinta per fà chì i LLM risolvenu prublemi di u mondu reale è cumplicati ùn hè micca solu per e grande cumpagnie, hè un sforzu glubale è di basa. Pensate à e prime vibrazioni di l'internet: caotiche, sconvolgenti è piene d'idee audaci. I prughjetti open source è u travagliu decentralizatu stanu guidendu... AI raghjunamentu in questu spaziu eccitante.

AI U ragiunamentu

Centrali di putenza open-source

E cumunità stanu pruducendu strumenti chì rivalizanu cù i grandi cani. Pigliate Face Abbracciata: a so piattaforma ospita più di mudelli 100,000, tunnellate di e quali sò affilate per compiti di ragiunamentu—cum'è mette inseme indizii in parechji passi. A so biblioteca di Transformers? Hè praticamente u cultellu svizzeru di AI ricerca avà.

Allora ci hè EleutherAI, una squadra di ribelli chì anu custruitu GPT-J, una bestia open-source chì si trova à l'altezza di GPT-3 in benchmark cum'è FRAMES. Questu ùn hè micca solu bellu, hè a prova chì qualchissia cù un rig decente pò aiutà i LLM à diventà più intelligenti in i puzzle cumplicati.

Vittorie Decentralizate

A diversità alimenta e scoperte. U Allen Institute for AI hà lasciatu cascà u ARC (Sfida di ragiunamentu AI2), un inseme di dati di dumande scientifiche difficili chì forza i LLM à ragiunà passu à passu. Intantu, Cuncorsi di Kaggle attirà talenti mundiali per risolve compiti cumplessi, sputendu idee chì ancu i laboratorii puderanu mancà.

I ghjucatori in solitaria brillanu ancu. Un articulu arXiv di u 2024 hà svelatu una nova mudificazione di l'attenzione chì hà aumentatu u ragiunamentu à longu cuntestu di u 15%. Hè u tipu di vantaghju chì i LLM anu bisognu per i prublemi intricati di u mondu reale.

Ligà lu à prublemi disordinati

E cose disordinate - cum'è scavà un fattu da un mucchiu mischiatu d'indizii - anu bisognu di LLM chì ponu pensà in modu flessibile è cunnette i punti. I sforzi di a cumunità stanu riescendu à fà questu:

Creazione di insemi di dati (pensate à ARC) per furmà mudelli nantu à sfide di ragiunamentu salvaticu.

Sharing mudelli aperti (cum'è GPT-J) per chì qualchissia u possi mudificà.

Lascià cascà trucchi chì cambianu u ghjocu (novi trucchi d'attenzione) chì aumentanu e prestazioni.

Questu ùn hè micca solu hype - hè u mutore chì spinge i LLM versu a maestria di u mondu reale.

Letture consigliate:

I migliori fornitori di API DeepSeek

Cumu unisce si à Manus

I migliori LLM Open-Source

I migliori LLM multimodali

Pensieri Final

I LLM sò stupenti, ma i prublemi cumplicati palesanu i so limiti. RAG li dà una spinta seria, è facce fresche cum'è Sentient Chat accennanu à ciò chì hè daretu à l'angulu. Cum'è un AI Geek, ùn possu aspittà di vede cumu si svolge tuttu.

Avete una quistione cumplicata chì avete lanciatu à un LLM ? Lasciate un cummentariu - mi piacerebbe sente a vostra opinione.

Bastone cù AIMOJO Per più AI avventure - simu appena cuminciati

AI U ragiunamentu, LLM AI U ragiunamentu

Read More

AI per a produttività persunale: e migliori configurazioni di automatizazione chì vi risparmianu ore

AI per a produttività persunale: e migliori configurazioni di automatizazione chì vi risparmianu ore

7 minuti fa

0 10

L'ingegneria rapida hè una bona carriera in u 2026? (A risposta onesta è senza entusiasmu)

L'ingegneria rapida hè una bona carriera in u 2026? (A risposta onesta è senza entusiasmu)

1 settimana fa

0 41

Cumu scrive AI Suggerimenti per ogni casu d'usu (50 esempi veri)

Cumu scrive AI Suggerimenti per ogni casu d'usu (50 esempi veri)

simani 2 fa

0 67

Lascia un Audiolibro Annulla madricale

Stu situ utilizeghja Akismet per reducisce u puzzicheghju. Amparate cumu si tratta i vostri dati di cumenti.

Trending AI Tools