Fabrice AI 是基於我博客的所有內容對我的想法的數位表示。 它旨在成為一個互動式的智慧助手,能夠以細微差別和準確的方式理解和回應複雜的查詢。
Fabrice AI 最初是一項實驗,是一項個人探索,旨在通過創建我多年來分享的廣泛知識的數位版本來探索人工智慧的潛力。 最初,我把這個項目設想為一個簡單的專案,可以在幾個小時內完成。 計劃很簡單:將我的內容上傳到 OpenAI 的 API 中,並允許 AI 與其交互,從而創建一個可訪問的智慧助手,可以根據我分享的大量資訊提供細緻入微的答案。
然而,當我踏上這段旅程時,我很快就發現這項任務比我預期的要複雜得多。 這個專案本來以為會是對人工智慧的一次短暫嘗試,但很快就擴展為一項全面而複雜的工作,需要的不僅僅是膚淺的數據上傳。 這變成了對人工智慧、自然語言處理和知識管理複雜性的深入研究。
我面臨的核心挑戰不僅僅是存儲資訊,而是教人工智慧以一種反映我原始內容的深度和細微差別的方式理解、情境化和準確檢索這些資訊。 這需要一種多方面的方法,因為我發現簡單的數據存儲和檢索方法不足以解決我希望 Fabrice AI 處理的問題的複雜性。
在這段旅程中,我嘗試了各種方法,從最初嘗試使用向量搜索索引到涉及知識圖譜、元數據檢索和定製 AI 模型的更高級方法。 每種方法都有自己的優點和缺點,每種方法都教會了我一些關於人工智慧的複雜性和數位知識管理的細微差別的新知識。 我將在下一篇文章中詳細描述所採取的技術路徑。
除了面臨的技術問題外,建立詳盡的知識庫也被證明是具有挑戰性的。 在測試人工智慧準確性的早期階段,我突然意識到,對一些問題最詳細、最準確的答案是我在視頻採訪或播客中給出的答案。 準確地說,我需要知識庫包括我的所有帖子、視頻採訪、播客、PowerPoint 演示文稿、圖像和 PDF 文檔。
我首先轉錄了所有內容。 鑒於自動轉錄一開始是近似的,我必須確保 AI 理解內容。 這花了很長時間,因為我必須測試每條轉錄內容的答案。
儘管轉錄將我與其他演講者分開,但 AI 首先認為 100% 的口語內容是我的,這需要大量進一步的培訓,以確保它能夠在所有內容上正確區分兩個說話者。 我還希望 Fabrice AI 對最近的內容給予更多的重視。 當然,我第一次嘗試它使用了我將內容上傳到 LLM 的日期,而不是我最初發佈文章的日期,這需要進一步調整。
為了詳盡無遺,我還使用 Azure 中的 OCR 模型將我在博客上分享的幻燈片中的知識轉錄為圖像到文本,然後將檔上傳到 GPT 助手知識庫。 同樣,我從 WordPress 的媒體庫下載了 PDF 並將它們上傳到知識庫。
在Beta測試期間,我注意到我的許多朋友提出了博客上沒有涉及的個人問題。 我正在等著看人們在接下來的幾周里會問什麼樣的問題。 如果在我的博客上的現有內容中找不到答案,我將完成答案。 請注意,我故意將 Fabrice AI 的答案限制在博客上的內容中,這樣您就可以真正獲得 Fabrice AI,而不是 Fabrice AI 和 Chat GPT 的混合體。
值得一提的是,我走了一條漫長的路才來到這裡。 我開始使用 GPT3,但對結果感到失望。 它一直使用錯誤的來源來回答問題,儘管一些博客文章完全符合問題提出的答案。 儘管在這個問題上花了數十個小時試圖讓它使用正確的內容(我將在下一篇文章中介紹),但我從未得到我滿意的結果。
GPT3.5 的情況有所改善,但仍然令人失望。 然後,我使用 GPT Builder 在 GPT Store 中構建了一個 GPT 應用程式。 它的效果更好一些,操作起來更便宜。 但是,我無法讓它在我的網站上運行,而且它只對Chat GPT的付費訂閱者可用,我覺得這太限制了。 無論如何,我不喜歡答案的品質,也不願意向公眾發佈。
突破性進展是隨著使用模型 4o 的 GPT 助手 的發佈而來的。 不需要我告訴它使用哪個內容,它就開始自己弄清楚,一切都變得更好了。 我放棄了 GPT 應用程式方法,轉而使用 API,這樣我就可以將其嵌入到博客中。 為了詳盡無遺,我還測試了 Gemini,但更喜歡 GPT4o 給出的答案。
我現在正在發佈一個純文本版本。 它包括語音轉文本功能,因此您可以通過語音提問。 我正在嘗試幾種方法來編寫一個看起來和聽起來都像我的互動式版本,您可以與之進行對話。 我有一個工作原型,但對結果和潛在成本非常不滿意。 我想確保它以第一人稱說話,看起來和聽起來真的像我,並且不需要花費我的胳膊和腿來操作。
我們將看到我在接下來的幾個月里取得了多大的進展,但等待 GPT5 可能只是有意義的。 事後看來,如果我只是等待 GPT4o 開發 Fabrice AI,我本可以節省數百小時的工作。 話又說回來,調查是重點的一部分,而且非常有趣。
同時,請使用 Fabrice AI 玩一玩,讓我知道您的想法!