Giới thiệu Fabrice AI

Fabrice AI là một đại diện kỹ thuật số cho suy nghĩ của tôi dựa trên tất cả nội dung blog của tôi. Nó được cho là một trợ lý tương tác, thông minh có khả năng hiểu và trả lời các truy vấn phức tạp với sắc thái và độ chính xác.

Fabrice AI bắt đầu như một thử nghiệm, một hành trình cá nhân để khám phá tiềm năng của trí tuệ nhân tạo bằng cách tạo ra phiên bản kỹ thuật số của kiến thức sâu rộng mà tôi đã chia sẻ trong nhiều năm. Ban đầu, tôi hình dung đây là một dự án đơn giản, có thể hoàn thành trong vài giờ. Kế hoạch rất đơn giản: tải nội dung của tôi lên API của OpenAI và cho phép AI tương tác với nội dung đó, qua đó tạo ra một trợ lý thông minh, dễ tiếp cận có thể cung cấp các câu trả lời sắc thái dựa trên khối lượng thông tin mà tôi đã chia sẻ.

Tuy nhiên, khi tôi bắt đầu hành trình này, tôi nhanh chóng nhận ra rằng nhiệm vụ này phức tạp hơn nhiều so với những gì tôi dự đoán. Dự án mà tôi nghĩ sẽ là một cuộc đột phá ngắn ngủi vào AI, đã nhanh chóng mở rộng thành một nỗ lực toàn diện và phức tạp, đòi hỏi nhiều hơn là chỉ tải dữ liệu hời hợt. Điều này đã biến thành một cuộc lặn sâu vào sự phức tạp của AI, xử lý ngôn ngữ tự nhiên và quản lý kiến thức.

Thách thức cốt lõi mà tôi phải đối mặt không chỉ là lưu trữ thông tin, mà còn là dạy AI hiểu, ngữ cảnh hóa và truy xuất chính xác thông tin đó theo cách phản ánh chiều sâu và sắc thái của nội dung gốc của tôi. Điều này đòi hỏi một cách tiếp cận đa diện, vì tôi phát hiện ra rằng các phương pháp lưu trữ và truy xuất dữ liệu đơn giản là không đủ cho sự phức tạp của các câu hỏi mà tôi muốn Fabrice AI xử lý.

Hành trình đưa tôi qua nhiều cách tiếp cận khác nhau, từ những nỗ lực ban đầu trong việc sử dụng chỉ số tìm kiếm vectơ đến các phương pháp tiên tiến hơn liên quan đến đồ thị kiến thức, truy xuất siêu dữ liệu và các mô hình AI tùy chỉnh. Mỗi cách tiếp cận đều có những điểm mạnh và điểm yếu riêng, và mỗi cách đều dạy cho tôi một điều mới về sự phức tạp của AI và các sắc thái của quản lý kiến thức kỹ thuật số. Tôi sẽ mô tả chi tiết về con đường kỹ thuật đã thực hiện trong bài đăng trên blog tiếp theo.

Ngoài các vấn đề kỹ thuật gặp phải, việc tạo ra một cơ sở kiến thức toàn diện cũng tỏ ra đầy thách thức. Trong giai đoạn đầu thử nghiệm độ chính xác của AI, tôi nhận ra rằng những câu trả lời chi tiết và chính xác nhất cho một số câu hỏi là những câu trả lời tôi đưa ra trong các cuộc phỏng vấn video hoặc podcast. Để chính xác, tôi cần cơ sở kiến thức bao gồm tất cả các bài đăng, cuộc phỏng vấn video, podcast, bài thuyết trình PowerPoint, hình ảnh và tài liệu PDF của mình.

Tôi bắt đầu bằng cách phiên âm tất cả nội dung. Vì phiên âm tự động ban đầu chỉ mang tính gần đúng, tôi phải đảm bảo AI hiểu được nội dung. Việc này mất nhiều thời gian vì tôi phải kiểm tra câu trả lời cho từng phần nội dung đã phiên âm.

Mặc dù bản ghi âm đã tách tôi khỏi người nói khác, nhưng AI ban đầu nghĩ rằng 100% nội dung được nói là của tôi, điều này đòi hỏi phải đào tạo thêm rất nhiều để đảm bảo AI có thể phân biệt chính xác cả hai người nói trên tất cả nội dung. Tôi cũng muốn Fabrice AI chú trọng hơn vào nội dung gần đây. Tất nhiên, lần đầu tiên tôi thử, nó sử dụng ngày tôi tải nội dung lên LLM thay vì ngày tôi đăng bài viết ban đầu, điều này đòi hỏi phải điều chỉnh thêm.

Để đảm bảo tính toàn diện, tôi cũng đã chép lại kiến thức trong các slide mà tôi chia sẻ trên blog bằng cách sử dụng mô hình OCR trong Azure để chuyển đổi hình ảnh thành văn bản, sau đó tải các tệp lên cơ sở kiến thức của trợ lý GPT. Tương tự như vậy, tôi đã tải xuống các tệp PDF từ thư viện phương tiện của WordPress và tải chúng lên cơ sở kiến thức.

Trong quá trình thử nghiệm beta, tôi nhận thấy rằng nhiều bạn bè của tôi đã hỏi những câu hỏi cá nhân không được đề cập trên blog. Tôi đang chờ xem những loại câu hỏi mà mọi người hỏi trong vài tuần tới. Tôi sẽ hoàn thiện các câu trả lời trong trường hợp không thể tìm thấy chúng trong nội dung hiện có trên blog của tôi. Lưu ý rằng tôi cố tình giới hạn các câu trả lời của Fabrice AI trong nội dung trên blog, vì vậy bạn thực sự nhận được Fabrice AI chứ không phải sự kết hợp giữa Fabrice AI và Chat GPT.

Cần phải nói rằng tôi đã đi một chặng đường dài để đến được đây. Tôi bắt đầu bằng cách sử dụng GPT3 nhưng đã thất vọng về kết quả. Nó liên tục sử dụng các nguồn sai để trả lời các câu hỏi mặc dù một số bài đăng trên blog có câu trả lời chính xác cho câu hỏi được đặt ra. Mặc dù đã dành hàng chục giờ để giải quyết vấn đề này, cố gắng sử dụng đúng nội dung (tôi sẽ đề cập đến vấn đề này trong bài đăng trên blog tiếp theo), tôi chưa bao giờ có được kết quả như mong muốn.

Mọi thứ đã được cải thiện với GPT3.5 nhưng vẫn còn gây thất vọng. Sau đó, tôi đã xây dựng một ứng dụng GPT trong GPT Store bằng GPT Builder . Nó hoạt động tốt hơn một chút và rẻ hơn để vận hành. Tuy nhiên, tôi không thể chạy nó trên trang web của mình và nó chỉ khả dụng cho những người đăng ký trả phí của Chat GPT mà tôi cảm thấy quá hạn chế. Bất kể thế nào, tôi không thích chất lượng của các câu trả lời và không thoải mái khi phát hành nó cho công chúng.

Bước đột phá đến với việc phát hành GPT Assistants sử dụng mô hình 4o. Không cần tôi phải chỉ cho nó nội dung nào để sử dụng, nó chỉ bắt đầu tự tìm ra và mọi thứ hoạt động tốt hơn. Tôi đã bỏ cách tiếp cận ứng dụng GPT và quay lại sử dụng API để tôi có thể nhúng nó vào blog. Để có tính toàn diện, tôi cũng đã thử nghiệm Gemini , nhưng thích các câu trả lời do GPT4o đưa ra hơn.

Hiện tại, tôi đang phát hành phiên bản chỉ có văn bản. Phiên bản này bao gồm tính năng chuyển giọng nói thành văn bản để bạn có thể đặt câu hỏi bằng giọng nói. Tôi đang thử nghiệm một số cách để mã hóa phiên bản tương tác trông và nghe giống tôi để bạn có thể trò chuyện. Tôi có một nguyên mẫu đang hoạt động nhưng không hài lòng với kết quả và chi phí tiềm năng. Tôi muốn đảm bảo rằng nó nói ở ngôi thứ nhất, thực sự trông và nghe giống tôi, và không tốn quá nhiều tiền để tôi vận hành.

Chúng ta sẽ xem tôi tiến triển được bao nhiêu trong những tháng tới, nhưng có lẽ đợi GPT5 là hợp lý. Nhìn lại, tôi đã có thể tiết kiệm được hàng trăm giờ làm việc nếu tôi chỉ đợi GPT4o phát triển Fabrice AI. Nhưng một lần nữa, cuộc điều tra là một phần của vấn đề, và nó thực sự rất thú vị.

Trong lúc chờ đợi, hãy chơi với Fabrice AI và cho tôi biết bạn nghĩ gì nhé!

>