Apresentamos-te o Fabrice AI

Fabrice AI é uma representação digital dos meus pensamentos com base em todo o conteúdo do meu blogue. Pretende ser um assistente interativo e inteligente, capaz de compreender e responder a questões complexas com nuance e precisão.

Fabrice AI começou como uma experiência, uma busca pessoal para explorar o potencial da inteligência artificial, criando uma versão digital do vasto conhecimento que partilhei ao longo dos anos. Inicialmente, imaginei-o como um projeto simples, algo que poderia ser concluído numa questão de horas. O plano era simples: carregar o meu conteúdo na API da OpenAI e permitir que a IA interagisse com ele, criando assim um assistente acessível e inteligente que pudesse dar respostas com nuances baseadas na riqueza de informação que eu tinha partilhado.

No entanto, quando embarquei nesta viagem, tornou-se rapidamente evidente que a tarefa era muito mais complexa do que eu tinha previsto. O projeto, que eu pensava ser uma breve incursão na IA, rapidamente se transformou num esforço abrangente e complexo, exigindo muito mais do que apenas um carregamento superficial de dados. Isto transformou-se num mergulho profundo nas complexidades da IA, do processamento de linguagem natural e da gestão do conhecimento.

O principal desafio que enfrentei não era apenas armazenar informações, mas ensinar a IA a compreender, contextualizar e recuperar com precisão essas informações de uma forma que reflectisse a profundidade e as nuances do meu conteúdo original. Isto exigiu uma abordagem multifacetada, pois descobri que os métodos simples de armazenamento e recuperação de dados eram insuficientes para a complexidade das questões que eu queria que a IA Fabrice tratasse.

A viagem levou-me por uma vasta gama de abordagens, desde as tentativas iniciais de utilização de índices de pesquisa vetorial até métodos mais avançados que envolvem gráficos de conhecimento, recuperação de metadados e modelos de IA personalizados. Cada abordagem tinha o seu próprio conjunto de pontos fortes e fracos, e cada uma ensinou-me algo de novo sobre as complexidades da IA e as nuances da gestão do conhecimento digital. Descreverei em pormenor o caminho técnico seguido na próxima publicação do blogue.

Para além dos problemas técnicos enfrentados, a criação de uma base de conhecimentos exaustiva também se revelou um desafio. Nas fases iniciais de teste da precisão da IA, apercebi-me de que as respostas mais detalhadas e precisas a algumas perguntas eram as que eu dava em entrevistas em vídeo ou podcasts. Para ser exacta, precisava que a base de conhecimentos incluísse todos os meus posts, entrevistas em vídeo, podcasts, apresentações em PowerPoint, imagens e documentos PDF.

Comecei por transcrever todo o conteúdo. Dado que as transcrições automáticas são, à partida, aproximadas, tive de me certificar de que a IA compreendia o conteúdo. Isto demorou muito tempo, pois tive de testar as respostas para cada parte do conteúdo transcrito.

Apesar de as transcrições me separarem do outro orador, a IA começou por pensar que 100% do conteúdo falado era meu, o que exigiu muito treino adicional para garantir que conseguia diferenciar corretamente os dois oradores em todo o conteúdo. Também queria que a IA do Fabrice desse mais peso ao conteúdo recente. Claro que, da primeira vez que tentei fazer isso, utilizou a data em que carreguei o conteúdo no LLM em vez da data em que publiquei originalmente o artigo, o que exigiu mais ajustes.

Por uma questão de exaustividade, também transcrevi o conhecimento em diapositivos que partilhei no blogue, utilizando o modelo OCR no Azure para conversão de imagem em texto e, em seguida, carreguei os ficheiros para a base de conhecimentos do assistente GPT. Da mesma forma, descarreguei PDFs da biblioteca multimédia do WordPress e carreguei-os para a base de conhecimentos.

Durante os testes beta, reparei que muitos dos meus amigos fizeram perguntas pessoais que não foram abordadas no blogue. Estou à espera de ver o tipo de perguntas que as pessoas vão fazer nas próximas semanas. Completarei as respostas, caso não possam ser encontradas no conteúdo existente no meu blogue. Nota que estou a limitar intencionalmente as respostas de Fabrice AI ao conteúdo do blogue, para que recebas realmente Fabrice AI e não uma mistura de Fabrice AI e Chat GPT.

Vale a pena mencionar que percorri um longo caminho até chegar aqui. Comecei por utilizar o GPT3, mas fiquei desiludido com os resultados. Continuava a utilizar as fontes erradas para responder às perguntas, apesar de alguns blogues terem exatamente a resposta que a pergunta colocava. Apesar de dezenas de horas a trabalhar no problema para tentar que utilizasse o conteúdo correto (que abordarei na próxima publicação do blogue), nunca obtive resultados que me satisfizessem.

As coisas melhoraram com o GPT3.5, mas ainda eram decepcionantes. Em seguida, criei um aplicativo GPT na GPT Store usando o GPT Builder. Funcionou um pouco melhor e era mais barato de operar. No entanto, não consegui que funcionasse no meu site e só estava disponível para subscritores pagos do Chat GPT, o que considerei demasiado limitativo. De qualquer forma, eu não gostava da qualidade das respostas e não me sentia confortável em divulgá-las ao público.

A descoberta veio com o lançamento dos GPT Assistants utilizando o modelo 4o. Sem que eu precisasse de lhe dizer qual o conteúdo a utilizar, começou a descobrir por si próprio e tudo funcionou melhor. Abandonei a abordagem da aplicação GPT e voltei a utilizar a API para a poder incorporar no blogue. Por uma questão de exaustividade, também testei o Gemini, mas preferi as respostas dadas pelo GPT4o.

Para já, estou a lançar uma versão só de texto. Inclui uma funcionalidade de voz para texto, para que possas fazer as tuas perguntas por voz. Estou a estudar algumas formas de codificar uma versão interactiva que se pareça e soe como eu, com a qual possas ter uma conversa. Tenho um protótipo funcional, mas estou longe de estar satisfeito com os resultados e o custo potencial. Quero ter a certeza que fala na primeira pessoa, que se parece e soa como eu e que não custa um braço e uma perna para eu operar.

Veremos os progressos que farei nos próximos meses, mas talvez faça sentido esperar pelo GPT5. Em retrospetiva, teria poupado centenas de horas de trabalho se tivesse esperado pelo GPT4o para desenvolver a IA do Fabrice. Mas, por outro lado, a investigação fazia parte do objetivo e era muito interessante.

Entretanto, joga com o Fabrice AI e diz-me o que achas!

>