Daboost / Shutterstock

Cu concediere recentă și reangajare rapidă de Sam Altman de OpenAI, dezbaterile despre dezvoltarea și utilizarea inteligenței artificiale (AI) sunt din nou în centrul atenției. Ceea ce este mai neobișnuit este că o temă proeminentă în reportajele mass-media a fost capacitatea de Sisteme AI pentru a face matematică.

Aparent, o parte din drama de la OpenAI a fost legată de dezvoltarea de către companie a unui nou algoritm AI numit Q*. S-a vorbit despre sistem ca fiind un progres semnificativ și una dintre caracteristicile sale importante a fost capacitatea de a raționa matematic.

Dar nu este matematica, fundamentul AI? Cum ar putea un sistem AI să aibă probleme cu raționamentul matematic, având în vedere că computerele și calculatoarele pot îndeplini sarcini matematice?

AI nu este o singură entitate. Este un mozaic de strategii pentru efectuarea calculelor fără instrucțiuni directe de la oameni. După cum vom vedea, unele sisteme AI sunt competente la matematică.

Cu toate acestea, una dintre cele mai importante tehnologii actuale, modelele mari de limbaj (LLM) din spatele chatbot-urilor AI, cum ar fi ChatGPT, s-a luptat până acum să emuleze raționamentul matematic. Acest lucru se datorează faptului că au fost concepute pentru a se concentra asupra limbii.


innerself abonare grafică


Dacă noul algoritm Q* al companiei poate rezolva probleme matematice nevăzute, atunci asta ar putea bine fi o descoperire semnificativă. Matematica este o formă străveche de raționament uman care modele de limbaj mari (LLM) până acum s-au chinuit să le imite. LLM-urile sunt tehnologia care stau la baza sistemelor precum ChatGPT de la OpenAI.

La momentul scrierii, detaliile algoritmului Q* și capacitățile acestuia sunt limitate, dar extrem de interesante. Deci, există diverse subtilități de luat în considerare înainte de a considera Q* un succes.

De exemplu, matematica este o materie cu care toată lumea se implică în diferite măsuri, iar nivelul de matematică la care este competent Q* rămâne neclar. Cu toate acestea, au fost publicate lucrări academice care utilizează forme alternative de IA pentru a avansa matematica la nivel de cercetare (inclusiv unele scrise de mineși unul scris de o echipă de matematicieni în colaborare cu cercetătorii de la Google DeepMind).

Aceste sisteme AI ar putea fi descrise ca fiind competente la matematică. Cu toate acestea, este probabil ca Q* să nu fie folosit pentru a ajuta cadrele universitare în munca lor, ci mai degrabă este destinat unui alt scop.

Cu toate acestea, chiar dacă Q* este incapabil să depășească limitele cercetării de ultimă oră, este foarte probabil să se găsească o anumită semnificație în modul în care a fost construit, care ar putea crea oportunități tentante pentru dezvoltarea viitoare.

Din ce în ce mai confortabil

Ca societate, ne simțim din ce în ce mai confortabil cu ajutorul IA specializat pentru a rezolva tipuri predeterminate de probleme. De exemplu, asistenți digitali, recunoastere faciala, și sisteme de recomandare online va fi familiar pentru majoritatea oamenilor. Ceea ce rămâne evaziv este un așa-zis „Inteligenta generala artificiala” (AGI) care are capacități de raționament largi comparabile cu cele ale unui om.

Matematica este o abilitate de bază pe care aspirăm să o predăm fiecărui copil de școală și, cu siguranță, se califică drept o piatră de hotar fundamentală în căutarea AGI. Deci, cum altfel ar fi de ajutor societății sistemele AI competente din punct de vedere matematic?

Mentalitatea matematică este relevantă pentru o multitudine de aplicații, de exemplu codificare și inginerie, așa că raționamentul matematic este o abilitate transferabilă vitală atât pentru inteligența umană, cât și pentru inteligența artificială. O ironie este că AI se bazează, la un nivel fundamental, pe matematică.

De exemplu, multe dintre tehnicile implementate de algoritmii AI se reduc în cele din urmă la o zonă matematică cunoscută sub numele de algebră matriceală. O matrice este pur și simplu o grilă de numere, din care o imagine digitală este un exemplu familiar. Fiecare pixel este nimic mai mult decât date numerice.

Modelele mari de limbaj sunt, de asemenea, inerent matematice. Pe baza unui eșantion uriaș de text, o mașină poate învăța probabilitățile pentru cuvintele care sunt cel mai probabil să urmeze o solicitare (sau întrebare) de la utilizator la chatbot. Dacă doriți ca un LLM pregătit în prealabil să se specializeze într-un anumit subiect, atunci acesta poate fi reglat fin pe literatura matematică sau orice alt domeniu de învățare. Un LLM poate genera text care se citește ca și cum ar înțelege matematica.

Din păcate, acest lucru produce un LLM care este bun la cacealma, dar prost la detalii. Problema este că unei declarații matematice este, prin definiție, una căreia i se poate atribui un valoare booleană neechivocă (adică adevărat sau fals). Raționamentul matematic echivalează cu deducerea logică a noilor enunțuri matematice din cele stabilite anterior.

avocatul diavolului

Desigur, orice abordare a raționamentului matematic care se bazează pe probabilitățile lingvistice va fi condus în afara benzii sale. O modalitate de a evita acest lucru ar putea fi încorporarea unui sistem de verificare formală în arhitectură (exact modul în care este construit LLM), care verifică continuu logica din spatele salturilor făcute de modelul de limbaj mare.

Un indiciu că acest lucru a fost făcut ar putea fi în numele Q*, la care s-ar putea referi în mod plauzibil un algoritm dezvoltat până în anii 1970 pentru a ajuta la raționamentul deductiv. Alternativ, Q* s-ar putea referi la Q-learning, în care un model se poate îmbunătăți în timp testând și recompensând concluziile care sunt corecte.

Dar există mai multe provocări pentru a construi IA capabile din punct de vedere matematic. De exemplu, unele dintre cele mai interesante matematică constau în evenimente foarte puțin probabile. Există multe situații în care cineva poate crede că există un model bazat pe numere mici, dar se defectează în mod neașteptat atunci când verificăm suficiente cazuri. Această capacitate este dificil de încorporat într-o mașină.

O altă provocare poate fi o surpriză: cercetarea matematică poate fi foarte creativă. Trebuie să fie, pentru că practicanții trebuie să inventeze noi concepte și totuși să rămână în interiorul regulile formale ale unui subiect antic.

Orice metodologie AI antrenată doar pentru a găsi modele în matematica preexistentă ar putea, probabil, să nu creeze matematică cu adevărat nouă. Având în vedere conducta dintre matematică și tehnologie, acest lucru pare să excludă concepția de noi revoluții tehnologice.

Dar haideți să ne jucăm avocatul diavolului pentru un moment și să ne imaginăm dacă AI ar putea într-adevăr să creeze noi matematici. Argumentul anterior împotriva acestui lucru are un defect, prin aceea că s-ar putea spune, de asemenea, că cei mai buni matematicieni umani au fost, de asemenea, instruiți exclusiv pe matematică preexistentă. Modelele lingvistice mari ne-au surprins înainte și o vor face din nou.Conversaţie

Tom Oliver, Lector, Informatică și Inginerie, Universitatea din Westminster

Acest articol este republicat de la Conversaţie sub licență Creative Commons. Citeste Articol original.