Fabrice AI یک نمایش دیجیتالی از افکار من بر اساس تمام محتوای وبلاگ من است. این یک دستیار تعاملی و هوشمند است که قادر به درک و پاسخگویی به سؤالات پیچیده با جزئیات و دقت است.
Fabrice AI به عنوان یک آزمایش آغاز شد، یک تلاش شخصی برای کشف پتانسیل هوش مصنوعی با ایجاد نسخه دیجیتالی از دانش گسترده ای که طی سال ها به اشتراک گذاشته بودم. در ابتدا، من این را به عنوان یک پروژه ساده تصور می کردم، چیزی که می تواند در عرض چند ساعت تکمیل شود. این طرح ساده بود: محتوای من را در API OpenAI آپلود کنید و به هوش مصنوعی اجازه دهید با آن تعامل داشته باشد، در نتیجه یک دستیار هوشمند و در دسترس ایجاد کنید که می تواند بر اساس اطلاعات فراوانی که من به اشتراک گذاشته بودم، پاسخ های ظریفی را ارائه دهد.
با این حال، با شروع این سفر، به سرعت مشخص شد که این کار بسیار پیچیدهتر از آن چیزی است که پیشبینی میکردم. این پروژه، که فکر میکردم یک حمله کوتاه به هوش مصنوعی باشد، به سرعت به یک تلاش جامع و پیچیده تبدیل شد که به چیزی بیش از یک بارگذاری سطحی دادهها نیاز داشت. این به یک فرو رفتن عمیق در پیچیدگی های هوش مصنوعی، پردازش زبان طبیعی و مدیریت دانش تبدیل شد.
چالش اصلی من فقط در مورد ذخیره اطلاعات نبود، بلکه آموزش هوش مصنوعی برای درک، زمینه سازی و بازیابی دقیق آن اطلاعات به گونه ای بود که عمق و جزئیات محتوای اصلی من را منعکس کند. این نیاز به یک رویکرد چند وجهی داشت، زیرا متوجه شدم که روشهای ساده ذخیرهسازی و بازیابی دادهها برای پیچیدگی سؤالاتی که میخواستم Fabrice AI به آنها رسیدگی کند، کافی نیست.
این سفر من را از طیف وسیعی از رویکردها برد، از تلاشهای اولیه برای استفاده از شاخصهای جستجوی برداری تا روشهای پیشرفتهتر شامل نمودارهای دانش، بازیابی ابرداده و مدلهای AI سفارشی ساخته شده. هر رویکرد مجموعه ای از نقاط قوت و ضعف خود را داشت و هر کدام چیز جدیدی در مورد پیچیدگی های هوش مصنوعی و تفاوت های ظریف مدیریت دانش دیجیتال به من آموخت. در پست بعدی وبلاگ مسیر فنی طی شده را به تفصیل شرح خواهم داد.
فراتر از مسائل فنی پیش رو، ایجاد یک پایگاه دانش جامع نیز چالش برانگیز بود. در مراحل اولیه آزمایش دقت هوش مصنوعی، متوجه شدم که دقیقترین و دقیقترین پاسخها به برخی سؤالات، پاسخهایی است که در مصاحبههای ویدیویی یا پادکستها دادهام. برای دقیق بودن، به پایگاه دانشی نیاز داشتم که شامل همه پستها، مصاحبههای ویدیویی، پادکستها، ارائههای پاورپوینت، تصاویر و اسناد PDF باشد.
من با رونویسی تمام مطالب شروع کردم. با توجه به اینکه رونویسی های خودکار برای شروع تقریبی هستند، باید مطمئن می شدم که هوش مصنوعی محتوا را درک کرده است. این مدت زمان زیادی طول کشید زیرا مجبور شدم پاسخ های هر قسمت از محتوای رونویسی شده را آزمایش کنم.
حتی با وجود اینکه رونویسیها من را از سخنران دیگر جدا میکردند، هوش مصنوعی ابتدا فکر میکرد که 100% محتوای گفتاری متعلق به من است که نیاز به آموزش بیشتر داشت تا مطمئن شویم که میتواند هر دو گوینده را به درستی در همه محتوا متمایز کند. همچنین میخواستم هوش مصنوعی Fabrice به محتوای اخیر اهمیت بیشتری بدهد. البته، اولین باری که سعی کردم از تاریخی که در آن محتوا را در LLM آپلود کردم به جای تاریخی که مقاله را در ابتدا پست کردم، استفاده کردم که نیاز به تنظیمات بیشتری داشت.
برای جامعتر بودن، من همچنین دانش را در اسلایدهایی که در وبلاگ به اشتراک گذاشته بودم با استفاده از مدل OCR در Azure برای تبدیل تصویر به متن رونویسی کردم و سپس فایلها را در پایگاه دانش دستیار GPT آپلود کردم. به همین ترتیب، فایلهای PDF را از کتابخانه رسانه وردپرس دانلود و در پایگاه دانش آپلود کردم.
در طول آزمایش بتا، متوجه شدم که بسیاری از دوستانم سوالات شخصی پرسیده اند که در وبلاگ پوشش داده نشده است. من منتظرم تا انواع سوالاتی را که مردم در چند هفته آینده می پرسند ببینم. پاسخ ها را در صورتی که با مطالب موجود در وبلاگم یافت نشد تکمیل می کنم. توجه داشته باشید که من عمداً پاسخهای Fabrice AI را به محتوای وبلاگ محدود میکنم، بنابراین شما واقعاً Fabrice AI را دریافت میکنید و نه مخلوطی از Fabrice AI و Chat GPT.
گفتنی است برای رسیدن به اینجا مسیری طولانی را طی کردم. من با استفاده از GPT3 شروع کردم اما از نتایج ناامید شدم. از منابع اشتباه برای پاسخ دادن به سؤالات استفاده می کرد، حتی اگر برخی از پست های وبلاگ دقیقاً پاسخ سؤال مطرح شده را داشتند. علیرغم اینکه ده ها ساعت روی این موضوع تلاش کردم تا از محتوای مناسب استفاده کند (که در پست بعدی وبلاگ به آن خواهم پرداخت)، هرگز به نتایجی که از آن راضی بودم نرسیدم.
همه چیز با GPT3.5 بهبود یافت اما همچنان ناامید کننده بود. سپس با استفاده از GPT Builder یک برنامه GPT در فروشگاه GPT ایجاد کردم. کمی بهتر کار می کرد و کارکرد آن ارزان تر بود. با این حال، من نتوانستم آن را در وب سایت خود اجرا کنم، و فقط برای مشترکین پولی Chat GPT در دسترس بود که به نظرم خیلی محدود بود. صرف نظر از این، کیفیت پاسخها را دوست نداشتم و از انتشار آن برای عموم راحت نبودم.
این پیشرفت با انتشار دستیاران GPT با استفاده از مدل 4o به دست آمد. بدون اینکه لازم باشد به او بگویم از کدام محتوا استفاده کند، به تنهایی شروع به کشف آن کرد و همه چیز بهتر کار کرد. من رویکرد برنامه GPT را کنار گذاشتم و به استفاده از API بازگشتم تا بتوانم آن را در وبلاگ جاسازی کنم. به خاطر جامعیت، جمینی را نیز آزمایش کردم، اما پاسخ های داده شده توسط GPT4o را ترجیح دادم.
من فعلا یک نسخه فقط متنی را منتشر می کنم. این شامل یک ویژگی صدا به متن است تا بتوانید سوالات خود را به صورت صوتی بپرسید. من در حال بازی با چند روش برای کدنویسی یک نسخه تعاملی هستم که شبیه من است و می توانید با آن مکالمه داشته باشید. من یک نمونه اولیه کار دارم اما از نتایج و هزینه بالقوه راضی نیستم. میخواهم مطمئن شوم که اول شخص صحبت میکند، واقعاً شبیه من است و به نظر میرسد، و هزینهای برای عمل کردن یک دست و پا برای من ندارد.
ما خواهیم دید که در ماه های آینده چقدر پیشرفت خواهم کرد، اما ممکن است منطقی باشد که منتظر GPT5 باشیم. در گذشته، اگر فقط منتظر GPT4o بودم تا Fabrice AI را توسعه دهد، صدها ساعت کار را پس انداز می کردم. سپس دوباره، بررسی بخشی از موضوع بود، و فوق العاده جالب بود.
در ضمن، لطفا با Fabrice AI بازی کنید و نظر خود را به من بگویید!