آگوست 2024 - Fabrice Grinda

Fabrice AI یک نمایش دیجیتالی از افکار من بر اساس تمام محتوای وبلاگ من است. این یک دستیار تعاملی و هوشمند است که قادر به درک و پاسخگویی به سؤالات پیچیده با جزئیات و دقت است.

Fabrice AI به عنوان یک آزمایش آغاز شد، یک تلاش شخصی برای کشف پتانسیل هوش مصنوعی با ایجاد نسخه دیجیتالی از دانش گسترده ای که طی سال ها به اشتراک گذاشته بودم. در ابتدا، من این را به عنوان یک پروژه ساده تصور می کردم، چیزی که می تواند در عرض چند ساعت تکمیل شود. این طرح ساده بود: محتوای من را در API OpenAI آپلود کنید و به هوش مصنوعی اجازه دهید با آن تعامل داشته باشد، در نتیجه یک دستیار هوشمند و در دسترس ایجاد کنید که می تواند بر اساس اطلاعات فراوانی که من به اشتراک گذاشته بودم، پاسخ های ظریفی را ارائه دهد.

با این حال، با شروع این سفر، به سرعت مشخص شد که این کار بسیار پیچیده‌تر از آن چیزی است که پیش‌بینی می‌کردم. این پروژه، که فکر می‌کردم یک حمله کوتاه به هوش مصنوعی باشد، به سرعت به یک تلاش جامع و پیچیده تبدیل شد که به چیزی بیش از یک بارگذاری سطحی داده‌ها نیاز داشت. این به یک فرو رفتن عمیق در پیچیدگی های هوش مصنوعی، پردازش زبان طبیعی و مدیریت دانش تبدیل شد.

چالش اصلی من فقط در مورد ذخیره اطلاعات نبود، بلکه آموزش هوش مصنوعی برای درک، زمینه سازی و بازیابی دقیق آن اطلاعات به گونه ای بود که عمق و جزئیات محتوای اصلی من را منعکس کند. این نیاز به یک رویکرد چند وجهی داشت، زیرا متوجه شدم که روش‌های ساده ذخیره‌سازی و بازیابی داده‌ها برای پیچیدگی سؤالاتی که می‌خواستم Fabrice AI به آنها رسیدگی کند، کافی نیست.

این سفر من را از طیف وسیعی از رویکردها برد، از تلاش‌های اولیه برای استفاده از شاخص‌های جستجوی برداری تا روش‌های پیشرفته‌تر شامل نمودارهای دانش، بازیابی ابرداده و مدل‌های AI سفارشی ساخته شده. هر رویکرد مجموعه ای از نقاط قوت و ضعف خود را داشت و هر کدام چیز جدیدی در مورد پیچیدگی های هوش مصنوعی و تفاوت های ظریف مدیریت دانش دیجیتال به من آموخت. در پست بعدی وبلاگ مسیر فنی طی شده را به تفصیل شرح خواهم داد.

فراتر از مسائل فنی پیش رو، ایجاد یک پایگاه دانش جامع نیز چالش برانگیز بود. در مراحل اولیه آزمایش دقت هوش مصنوعی، متوجه شدم که دقیق‌ترین و دقیق‌ترین پاسخ‌ها به برخی سؤالات، پاسخ‌هایی است که در مصاحبه‌های ویدیویی یا پادکست‌ها داده‌ام. برای دقیق بودن، به پایگاه دانشی نیاز داشتم که شامل همه پست‌ها، مصاحبه‌های ویدیویی، پادکست‌ها، ارائه‌های پاورپوینت، تصاویر و اسناد PDF باشد.

من با رونویسی تمام مطالب شروع کردم. با توجه به اینکه رونویسی های خودکار برای شروع تقریبی هستند، باید مطمئن می شدم که هوش مصنوعی محتوا را درک کرده است. این مدت زمان زیادی طول کشید زیرا مجبور شدم پاسخ های هر قسمت از محتوای رونویسی شده را آزمایش کنم.

حتی با وجود اینکه رونویسی‌ها من را از سخنران دیگر جدا می‌کردند، هوش مصنوعی ابتدا فکر می‌کرد که 100% محتوای گفتاری متعلق به من است که نیاز به آموزش بیشتر داشت تا مطمئن شویم که می‌تواند هر دو گوینده را به درستی در همه محتوا متمایز کند. همچنین می‌خواستم هوش مصنوعی Fabrice به محتوای اخیر اهمیت بیشتری بدهد. البته، اولین باری که سعی کردم از تاریخی که در آن محتوا را در LLM آپلود کردم به جای تاریخی که مقاله را در ابتدا پست کردم، استفاده کردم که نیاز به تنظیمات بیشتری داشت.

برای جامع‌تر بودن، من همچنین دانش را در اسلایدهایی که در وبلاگ به اشتراک گذاشته بودم با استفاده از مدل OCR در Azure برای تبدیل تصویر به متن رونویسی کردم و سپس فایل‌ها را در پایگاه دانش دستیار GPT آپلود کردم. به همین ترتیب، فایل‌های PDF را از کتابخانه رسانه وردپرس دانلود و در پایگاه دانش آپلود کردم.

در طول آزمایش بتا، متوجه شدم که بسیاری از دوستانم سوالات شخصی پرسیده اند که در وبلاگ پوشش داده نشده است. من منتظرم تا انواع سوالاتی را که مردم در چند هفته آینده می پرسند ببینم. پاسخ ها را در صورتی که با مطالب موجود در وبلاگم یافت نشد تکمیل می کنم. توجه داشته باشید که من عمداً پاسخ‌های Fabrice AI را به محتوای وبلاگ محدود می‌کنم، بنابراین شما واقعاً Fabrice AI را دریافت می‌کنید و نه مخلوطی از Fabrice AI و Chat GPT.

گفتنی است برای رسیدن به اینجا مسیری طولانی را طی کردم. من با استفاده از GPT3 شروع کردم اما از نتایج ناامید شدم. از منابع اشتباه برای پاسخ دادن به سؤالات استفاده می کرد، حتی اگر برخی از پست های وبلاگ دقیقاً پاسخ سؤال مطرح شده را داشتند. علیرغم اینکه ده ها ساعت روی این موضوع تلاش کردم تا از محتوای مناسب استفاده کند (که در پست بعدی وبلاگ به آن خواهم پرداخت)، هرگز به نتایجی که از آن راضی بودم نرسیدم.

همه چیز با GPT3.5 بهبود یافت اما همچنان ناامید کننده بود. سپس با استفاده از GPT Builder یک برنامه GPT در فروشگاه GPT ایجاد کردم. کمی بهتر کار می کرد و کارکرد آن ارزان تر بود. با این حال، من نتوانستم آن را در وب سایت خود اجرا کنم، و فقط برای مشترکین پولی Chat GPT در دسترس بود که به نظرم خیلی محدود بود. صرف نظر از این، کیفیت پاسخ‌ها را دوست نداشتم و از انتشار آن برای عموم راحت نبودم.

این پیشرفت با انتشار دستیاران GPT با استفاده از مدل 4o به دست آمد. بدون اینکه لازم باشد به او بگویم از کدام محتوا استفاده کند، به تنهایی شروع به کشف آن کرد و همه چیز بهتر کار کرد. من رویکرد برنامه GPT را کنار گذاشتم و به استفاده از API بازگشتم تا بتوانم آن را در وبلاگ جاسازی کنم. به خاطر جامعیت، جمینی را نیز آزمایش کردم، اما پاسخ های داده شده توسط GPT4o را ترجیح دادم.

من فعلا یک نسخه فقط متنی را منتشر می کنم. این شامل یک ویژگی صدا به متن است تا بتوانید سوالات خود را به صورت صوتی بپرسید. من در حال بازی با چند روش برای کدنویسی یک نسخه تعاملی هستم که شبیه من است و می توانید با آن مکالمه داشته باشید. من یک نمونه اولیه کار دارم اما از نتایج و هزینه بالقوه راضی نیستم. می‌خواهم مطمئن شوم که اول شخص صحبت می‌کند، واقعاً شبیه من است و به نظر می‌رسد، و هزینه‌ای برای عمل کردن یک دست و پا برای من ندارد.

ما خواهیم دید که در ماه های آینده چقدر پیشرفت خواهم کرد، اما ممکن است منطقی باشد که منتظر GPT5 باشیم. در گذشته، اگر فقط منتظر GPT4o بودم تا Fabrice AI را توسعه دهد، صدها ساعت کار را پس انداز می کردم. سپس دوباره، بررسی بخشی از موضوع بود، و فوق العاده جالب بود.

در ضمن، لطفا با Fabrice AI بازی کنید و نظر خود را به من بگویید!

Fabrice Grinda

ماه: آگوست 2024

معرفی Fabrice AI

Fabrice Grinda

Subscribe to Fabrice's Newsletter

Subscribe to Fabrice's Newsletter