Prezentându-l pe Fabrice AI

Fabrice AI este o reprezentare digitală a gândurilor mele bazată pe întregul conținut al blogului meu. Se dorește a fi un asistent interactiv, inteligent, capabil să înțeleagă și să răspundă la întrebări complexe cu nuanță și precizie.

Fabrice AI a început ca un experiment, o căutare personală de a explora potențialul inteligenței artificiale prin crearea unei versiuni digitale a cunoștințelor vaste pe care le-am împărtășit de-a lungul anilor. Inițial, mi-am imaginat că acesta va fi un proiect simplu, care ar putea fi finalizat în câteva ore. Planul era simplu: să încarc conținutul meu în API-ul OpenAI și să permit inteligenței artificiale să interacționeze cu acesta, creând astfel un asistent accesibil și inteligent care să poată oferi răspunsuri nuanțate pe baza bogăției de informații pe care le-am împărtășit.

Cu toate acestea, pe măsură ce am pornit în această călătorie, a devenit rapid evident că sarcina era mult mai complexă decât am anticipat. Proiectul, despre care credeam că va fi o scurtă incursiune în inteligența artificială, s-a transformat rapid într-un demers cuprinzător și complicat, care necesită mult mai mult decât o simplă încărcare superficială de date. Acesta s-a transformat într-o scufundare adâncă în complexitatea inteligenței artificiale, a procesării limbajului natural și a gestionării cunoștințelor.

Provocarea principală cu care m-am confruntat nu a constat doar în stocarea informațiilor, ci și în a învăța inteligența artificială să înțeleagă, să contextualizeze și să recupereze cu acuratețe acele informații într-un mod care să reflecte profunzimea și nuanța conținutului meu original. Acest lucru a necesitat o abordare multifațetată, deoarece am descoperit că metodele simple de stocare și recuperare a datelor erau insuficiente pentru complexitatea întrebărilor pe care doream ca Fabrice AI să le gestioneze.

Călătoria m-a purtat printr-o gamă largă de abordări, de la încercările inițiale de a utiliza indici de căutare vectorială la metode mai avansate care implică grafice de cunoștințe, recuperarea metadatelor și modele AI personalizate. Fiecare abordare a avut propriul set de puncte forte și puncte slabe și fiecare m-a învățat ceva nou despre complexitatea IA și nuanțele gestionării digitale a cunoștințelor. Voi descrie în detaliu calea tehnică urmată în următoarea postare pe blog.

Dincolo de problemele tehnice întâmpinate, și generarea unei baze de cunoștințe exhaustive s-a dovedit a fi o provocare. În fazele inițiale de testare a preciziei inteligenței artificiale, mi-am dat seama că cele mai detaliate și exacte răspunsuri la unele întrebări erau cele pe care le dădeam în interviuri video sau podcasturi. Pentru a fi exactă, aveam nevoie ca baza de cunoștințe să includă toate postările mele, interviurile video, podcasturile, prezentările PowerPoint, imaginile și documentele PDF.

Am început prin transcrierea întregului conținut. Având în vedere că transcrierile automate sunt aproximative la început, a trebuit să mă asigur că inteligența artificială a înțeles conținutul. Acest lucru a durat mult timp, deoarece a trebuit să testez răspunsurile pentru fiecare fragment de conținut transcris.

Chiar dacă transcrierile mă separau de celălalt vorbitor, inteligența artificială a crezut inițial că 100% din conținutul vorbit era al meu, ceea ce a necesitat mult antrenament suplimentar pentru a se asigura că poate diferenția corect ambii vorbitori pe tot conținutul. De asemenea, am dorit ca AI-ul Fabrice să acorde mai multă importanță conținutului recent. Desigur, prima dată când am încercat acest lucru, a folosit data la care am încărcat conținutul în LLM, mai degrabă decât data la care am postat inițial articolul, ceea ce a necesitat ajustări suplimentare.

Din motive de exhaustivitate, am transcris, de asemenea, cunoștințele din diapozitivele pe care le-am partajat pe blog utilizând modelul OCR din Azure pentru conversia de la imagine la text, apoi am încărcat fișierele în baza de cunoștințe a asistentului GPT. De asemenea, am descărcat PDF-uri din biblioteca media a WordPress și le-am încărcat în baza de cunoștințe.

În timpul testării beta, am observat că mulți dintre prietenii mei au pus întrebări personale care nu au fost abordate pe blog. Aștept să văd ce tipuri de întrebări pun oamenii în următoarele câteva săptămâni. Voi completa răspunsurile în cazul în care acestea nu pot fi găsite cu conținutul existent pe blogul meu. Rețineți că limitez intenționat răspunsurile lui Fabrice AI la conținutul de pe blog, astfel încât să obțineți cu adevărat Fabrice AI și nu un amestec de Fabrice AI și Chat GPT.

Merită menționat faptul că am luat-o pe o cale lungă pentru a ajunge aici. Am început prin a utiliza GPT3, dar am fost dezamăgit de rezultate. Acesta continua să folosească surse greșite pentru a răspunde la întrebări, chiar dacă unele articole de blog aveau exact răspunsul la întrebarea pusă. În ciuda zecilor de ore în care am lucrat la această problemă încercând să o fac să utilizeze conținutul corect (despre care voi vorbi în următoarea postare pe blog), nu am obținut niciodată rezultate de care să fiu mulțumit.

Lucrurile s-au îmbunătățit cu GPT3.5, dar erau încă dezamăgitoare. Am construit apoi o aplicație GPT în GPT Store folosind GPT Builder. Funcționa un pic mai bine și era mai ieftin de utilizat. Cu toate acestea, nu am putut să o fac să ruleze pe site-ul meu web și a fost disponibilă numai pentru abonații plătiți ai Chat GPT, ceea ce am simțit că era prea limitativ. În orice caz, nu mi-a plăcut calitatea răspunsurilor și nu m-am simțit confortabil să o eliberez publicului.

Descoperirea a venit odată cu lansarea GPT Assistants folosind modelul 4o. Fără ca eu să fiu nevoit să îi spun ce conținut să folosească, a început să se descurce singur și totul a funcționat mai bine. Am renunțat la abordarea aplicației GPT și m-am întors la utilizarea API, astfel încât să o pot încorpora pe blog. Din motive de exhaustivitate, am testat și Gemini, dar am preferat răspunsurile oferite de GPT4o.

Deocamdată lansez o versiune numai text. Aceasta include o funcție de conversie a vocii în text, astfel încât să vă puteți adresa întrebările prin voce. Mă gândesc la câteva modalități de a codifica o versiune interactivă care arată și sună ca mine și cu care puteți purta o conversație. Am un prototip funcțional, dar sunt departe de a fi mulțumit de rezultate și de costul potențial. Vreau să mă asigur că vorbește la persoana întâi, că arată și sună ca mine și că nu mă costă o groază de bani să o folosesc.

Vom vedea cât de multe progrese voi face în următoarele luni, dar s-ar putea să aibă sens să aștept GPT5. În retrospectivă, aș fi economisit sute de ore de muncă dacă aș fi așteptat doar GPT4o pentru a dezvolta Fabrice AI. Apoi, din nou, investigația a făcut parte din punct, și a fost super interesantă.

Între timp, te rog să te joci cu Fabrice AI și să-mi spui ce crezi!

>