أغسطس 2024 - Fabrice Grinda

فابريس للذكاء الاصطناعي هو تمثيل رقمي لأفكاري بناءً على كل محتوى مدونتي. من المفترض أن يكون مساعدًا تفاعليًا وذكيًا قادرًا على فهم الاستفسارات المعقدة والرد عليها بدقة ودقة.

بدأ مشروع فابريس للذكاء الاصطناعي كتجربة، وسعي شخصي لاستكشاف إمكانات الذكاء الاصطناعي من خلال إنشاء نسخة رقمية من المعرفة الواسعة التي شاركتها على مر السنين. في البداية، تصوّرتُ هذا في البداية كمشروع مباشر، شيء يمكن إنجازه في غضون ساعات. كانت الخطة بسيطة: تحميل المحتوى الخاص بي إلى واجهة برمجة تطبيقات OpenAI والسماح للذكاء الاصطناعي بالتفاعل معه، وبالتالي إنشاء مساعد ذكي يسهل الوصول إليه ويمكنه تقديم إجابات دقيقة بناءً على ثروة المعلومات التي شاركتها.

ومع ذلك، عندما شرعتُ في هذه الرحلة، سرعان ما اتضح لي أن المهمة كانت أكثر تعقيدًا بكثير مما كنت أتوقع. فالمشروع، الذي اعتقدت أنه سيكون عبارة عن غزوة قصيرة في مجال الذكاء الاصطناعي، سرعان ما توسّع ليصبح مسعىً شاملاً ومعقداً، يتطلب أكثر بكثير من مجرد تحميل سطحي للبيانات. تحوّل ذلك إلى غوص عميق في تعقيدات الذكاء الاصطناعي ومعالجة اللغة الطبيعية وإدارة المعرفة.

لم يكن التحدي الأساسي الذي واجهته يتعلق بتخزين المعلومات فحسب، بل كان يتعلق بتعليم الذكاء الاصطناعي فهم تلك المعلومات ووضعها في سياقها واسترجاعها بدقة بطريقة تعكس عمق المحتوى الأصلي الذي قمتُ بتطويره ودقته. وقد تطلب ذلك نهجًا متعدد الأوجه، حيث اكتشفت أن الطرق البسيطة لتخزين البيانات واسترجاعها لم تكن كافية لتعقيد الأسئلة التي أردت أن يتعامل معها الذكاء الاصطناعي فابريس.

أخذتني هذه الرحلة عبر مجموعة واسعة من الأساليب، بدءًا من المحاولات الأولية لاستخدام مؤشرات البحث المتجه إلى الأساليب الأكثر تقدمًا التي تتضمن الرسوم البيانية المعرفية واسترجاع البيانات الوصفية ونماذج الذكاء الاصطناعي المصممة خصيصًا. كل نهج كان له مجموعة من نقاط القوة والضعف الخاصة به، وقد علمني كل نهج شيئًا جديدًا عن تعقيدات الذكاء الاصطناعي والفروق الدقيقة في إدارة المعرفة الرقمية. سأصف بالتفصيل المسار التقني المتبع في التدوينة التالية.

بالإضافة إلى المشكلات التقنية التي واجهتنا، فقد ثبت أن إنشاء قاعدة معرفية شاملة كان تحديًا أيضًا. في المراحل الأولى من اختبار دقة الذكاء الاصطناعي، اتضح لي أن الإجابات الأكثر تفصيلاً ودقة على بعض الأسئلة كانت تلك التي قدمتها في مقابلات الفيديو أو البودكاست. ولكي أكون دقيقًا، كنت بحاجة إلى أن تتضمن قاعدة المعرفة جميع منشوراتي ومقابلات الفيديو والبودكاست وعروض PowerPoint التقديمية والصور ومستندات PDF.

بدأت بتدوين كل المحتوى. نظرًا لأن النسخ التلقائي تقريبي في البداية، كان عليّ التأكد من فهم الذكاء الاصطناعي للمحتوى. استغرق ذلك وقتاً طويلاً حيث كان عليَّ اختبار الإجابات لكل جزء من المحتوى المكتوب.

على الرغم من أن التدوينات فصلت بيني وبين المتحدث الآخر، إلا أن الذكاء الاصطناعي اعتقد في البداية أن 100% من المحتوى المنطوق هو محتواي أنا، الأمر الذي تطلب الكثير من التدريب الإضافي للتأكد من قدرته على التمييز بين المتحدثين بشكل صحيح في كل المحتوى. أردت أيضًا أن يعطي الذكاء الاصطناعي لفابريس وزنًا أكبر للمحتوى الحديث. وبالطبع، في المرة الأولى التي جربتُ فيها ذلك استخدم التاريخ الذي قمتُ فيه بتحميل المحتوى على LLM بدلاً من تاريخ نشري للمقال في الأصل، مما تطلب إجراء المزيد من التعديلات.

من أجل الشمولية، قمت أيضًا بنسخ المعرفة في الشرائح التي شاركتها على المدونة باستخدام نموذج التعرف الضوئي على الحروف في Azure لتحويل الصور إلى نصوص، ثم قمت بتحميل الملفات إلى قاعدة معارف مساعد GPT. وبالمثل، قمت بتنزيل ملفات PDF من مكتبة وسائط WordPress وتحميلها إلى قاعدة المعرفة.

خلال الاختبار التجريبي، لاحظت أن العديد من أصدقائي طرحوا أسئلة شخصية لم تتم تغطيتها في المدونة. أنتظر أن أرى أنواع الأسئلة التي يطرحها الناس خلال الأسابيع القليلة القادمة. سأكمل الإجابات في حال تعذّر العثور عليها من خلال المحتوى الموجود على مدونتي. لاحظ أنني أتعمد أن أقصر إجابات فابريس للذكاء الاصطناعي على المحتوى الموجود على المدونة، حتى تحصل على فابريس للذكاء الاصطناعي حقًا وليس مزيجًا من فابريس للذكاء الاصطناعي ودردشة GPT.

تجدر الإشارة إلى أنني سلكت طريقاً طويلاً للوصول إلى هنا. بدأت باستخدام GPT3 لكنني أصبت بخيبة أمل من النتائج. فقد استمر في استخدام المصادر الخاطئة للإجابة عن الأسئلة على الرغم من أن بعض التدوينات كانت تحتوي على الإجابة الصحيحة للسؤال المطروح. على الرغم من عشرات الساعات من العمل على المشكلة في محاولة لجعلها تستخدم المحتوى الصحيح (وهو ما سأتناوله في منشور المدونة التالي)، لم أحصل على نتائج كنت راضيًا عنها.

تحسّنت الأمور مع GPT3.5 لكنها كانت لا تزال مخيبة للآمال. ثم أنشأت تطبيق GPT في متجر GPT باستخدام GPT Builder. كان يعمل بشكل أفضل قليلاً وكان أرخص في التشغيل. ومع ذلك، لم أتمكن من تشغيله على موقعي الإلكتروني، وكان متاحًا فقط للمشتركين المدفوعين في Chat GPT الذي شعرت أنه كان مقيدًا للغاية. وبغض النظر عن ذلك، لم تعجبني جودة الإجابات ولم أكن مرتاحاً لإتاحتها للعامة.

جاء الإنجاز مع إصدار مساعدي GPT باستخدام الطراز 4o. فبدون أن أحتاج إلى إخباره بالمحتوى الذي يجب استخدامه، بدأ يكتشف ذلك من تلقاء نفسه وعمل كل شيء بشكل أفضل. تخلّيتُ عن نهج تطبيق GPT وعدتُ إلى استخدام واجهة برمجة التطبيقات حتى أتمكن من تضمينها في المدونة. من أجل الشمولية، اختبرت أيضًا Gemini، لكنني فضلت الإجابات التي قدمها GPT4o.

سأقوم بإصدار نسخة نصية فقط في الوقت الحالي. وهو يتضمن خاصية تحويل الصوت إلى نص حتى تتمكن من طرح أسئلتك صوتياً. أنا أجرب بعض الطرق لترميز نسخة تفاعلية تشبهني في الشكل والصوت بحيث يمكنك إجراء محادثة معها. لديّ نموذج أولي يعمل ولكنني غير راضٍ عن النتائج والتكلفة المحتملة. أريد أن أتأكد من أنها تتحدث بضمير المتكلم، وتبدو وتبدو مثلي حقًا، ولا تكلفني الكثير من المال لتشغيلها.

سنرى مدى التقدم الذي سأحرزه في الأشهر القادمة، ولكن قد يكون من المنطقي انتظار GPT5. بعد فوات الأوان، كنت سأوفر مئات الساعات من العمل لو انتظرت GPT4o لتطوير الذكاء الاصطناعي لفابريس. ثم مرة أخرى، كان التحقيق جزءًا من الهدف، وكان مثيرًا للاهتمام للغاية.

في هذه الأثناء، يرجى اللعب مع فابريس للذكاء الاصطناعي وإخباري برأيك!

Fabrice Grinda

الشهر: أغسطس 2024

تقديم فابريس للذكاء الاصطناعي

Fabrice Grinda

Subscribe to Fabrice's Newsletter

Subscribe to Fabrice's Newsletter