Presentación de Fabrice AI

Fabrice AI es una representación digital de mis pensamientos basada en todo el contenido de mi blog. Pretende ser un asistente interactivo e inteligente capaz de comprender y responder a consultas complejas con matices y precisión.

Fabrice AI comenzó como un experimento, una búsqueda personal para explorar el potencial de la inteligencia artificial creando una versión digital de los amplios conocimientos que había compartido a lo largo de los años. Al principio, me lo imaginaba como un proyecto sencillo, algo que podría completarse en cuestión de horas. El plan era sencillo: cargar mi contenido en la API de OpenAI y permitir que la IA interactuara con él, creando así un asistente accesible e inteligente que pudiera proporcionar respuestas matizadas basadas en la gran cantidad de información que yo había compartido.

Sin embargo, al embarcarme en este viaje, pronto me di cuenta de que la tarea era mucho más compleja de lo que había previsto. El proyecto, que pensé que sería una breve incursión en la IA, se amplió rápidamente hasta convertirse en una empresa exhaustiva e intrincada, que requería mucho más que una simple carga superficial de datos. Se convirtió en una inmersión profunda en las complejidades de la IA, el procesamiento del lenguaje natural y la gestión del conocimiento.

El principal reto al que me enfrenté no consistía sólo en almacenar información, sino en enseñar a la IA a comprender, contextualizar y recuperar con precisión esa información de forma que reflejara la profundidad y los matices de mi contenido original. Esto requería un enfoque polifacético, ya que descubrí que los métodos sencillos de almacenamiento y recuperación de datos eran insuficientes para la complejidad de las cuestiones que quería que manejara la IA Fabrice.

El viaje me llevó a través de una amplia gama de enfoques, desde los intentos iniciales de utilizar índices de búsqueda vectoriales hasta métodos más avanzados que implicaban grafos de conocimiento, recuperación de metadatos y modelos de IA construidos a medida. Cada enfoque tenía su propio conjunto de puntos fuertes y débiles, y cada uno me enseñó algo nuevo sobre las complejidades de la IA y los matices de la gestión del conocimiento digital. En la próxima entrada del blog describiré en detalle el camino técnico recorrido.

Más allá de los problemas técnicos a los que me enfrenté, generar una base de conocimientos exhaustiva también resultó un reto. En las primeras fases de prueba de la precisión de la IA, me di cuenta de que las respuestas más detalladas y precisas a algunas preguntas eran las que yo daba en entrevistas en vídeo o podcasts. Para ser precisa, necesitaba que la base de conocimientos incluyera todos mis posts, entrevistas en vídeo, podcasts, presentaciones de PowerPoint, imágenes y documentos PDF.

Empecé transcribiendo todo el contenido. Dado que las transcripciones automáticas son aproximadas para empezar, tuve que asegurarme de que la IA entendía el contenido. Esto me llevó mucho tiempo, ya que tuve que probar las respuestas de cada contenido transcrito.

Aunque las transcripciones me separaban del otro hablante, la IA pensó primero que el 100% del contenido hablado era mío, lo que requirió mucho entrenamiento adicional para asegurarse de que podía diferenciar correctamente a ambos hablantes en todo el contenido. También quería que la IA de Fabrice diera más peso al contenido reciente. Por supuesto, la primera vez que lo intenté utilizó la fecha en la que subí el contenido al LLM en lugar de la fecha en la que publiqué originalmente el artículo, lo que requirió más ajustes.

En aras de la exhaustividad, también transcribí los conocimientos de las diapositivas que compartía en el blog utilizando el modelo OCR de Azure para la conversión de imagen a texto y, a continuación, subí los archivos a la base de conocimientos del asistente GPT. Del mismo modo, descargué archivos PDF de la biblioteca multimedia de WordPress y los subí a la base de conocimientos.

Durante la prueba beta, me di cuenta de que muchos de mis amigos hacían preguntas personales que no se trataban en el blog. Estoy esperando a ver los tipos de preguntas que hace la gente en las próximas semanas. Completaré las respuestas en caso de que no se puedan encontrar con el contenido existente en mi blog. Ten en cuenta que estoy limitando intencionadamente las respuestas de Fabrice AI al contenido del blog, para que realmente obtengas Fabrice AI y no una mezcla de Fabrice AI y Chat GPT.

Vale la pena mencionar que tomé un largo camino para llegar hasta aquí. Empecé utilizando GPT3, pero me decepcionaron los resultados. Seguía utilizando fuentes erróneas para responder a las preguntas, a pesar de que algunas entradas de blog tenían exactamente la respuesta que planteaba la pregunta. A pesar de las decenas de horas que pasé trabajando en el tema intentando que utilizara el contenido correcto (de lo que hablaré en la próxima entrada del blog), nunca obtuve resultados que me satisficieran.

Las cosas mejoraron con GPT3.5, pero seguían siendo decepcionantes. Entonces construí una aplicación GPT en el GPT Store utilizando GPT Builder. Funcionaba un poco mejor y era más barata de manejar. Sin embargo, no conseguí que funcionara en mi sitio web, y sólo estaba disponible para los suscriptores de pago de Chat GPT, lo que me pareció demasiado limitante. En cualquier caso, no me gustaba la calidad de las respuestas y no me sentía cómodo haciéndolo público.

El gran avance llegó con el lanzamiento de los Asistentes GPT que utilizan el modelo 4o. Sin necesidad de que yo le dijera qué contenido debía utilizar, empezó a resolverlo por sí solo y todo funcionó mejor. Abandoné el enfoque de la aplicación GPT y volví a utilizar la API para poder incrustarla en el blog. En aras de la exhaustividad, también probé Gemini, pero preferí las respuestas de GPT4o.

De momento, voy a lanzar una versión sólo de texto. Incluye una función de voz a texto para que puedas hacer tus preguntas por voz. Estoy jugando con algunas formas de codificar una versión interactiva que se parezca y suene como yo y con la que puedas mantener una conversación. Tengo un prototipo funcional, pero no estoy nada contento con los resultados ni con el coste potencial. Quiero asegurarme de que habla en primera persona, de que realmente se parece y suena como yo, y de que no me cuesta un ojo de la cara manejarlo.

Veremos cuánto avanzo en los próximos meses, pero quizá tenga sentido esperar a la GPT5. En retrospectiva, me habría ahorrado cientos de horas de trabajo si hubiera esperado a la GPT4o para desarrollar la IA de Fabrice. Por otra parte, la investigación era parte del objetivo, y era superinteresante.

Mientras tanto, ¡juega con la IA de Fabrice y dime qué te parece!

>