هندسة السياق
RAG، التضمينات، استدعاءات الوظائف و MCP
فهم السياق أمر ضروري لبناء تطبيقات الذكاء الاصطناعي التي تعمل فعلياً. يغطي هذا الفصل كل ما تحتاج معرفته حول إعطاء الذكاء الاصطناعي المعلومات الصحيحة في الوقت المناسب.
نماذج الذكاء الاصطناعي عديمة الحالة. فهي لا تتذكر المحادثات السابقة. في كل مرة ترسل فيها رسالة، تحتاج إلى تضمين كل ما يحتاج الذكاء الاصطناعي لمعرفته. هذا ما يُسمى "هندسة السياق".
ما هو السياق؟
السياق هو كل المعلومات التي تقدمها للذكاء الاصطناعي إلى جانب سؤالك. فكر فيه بهذه الطريقة:
بدون سياق
ما هي الحالة؟
مع سياق
أنت مساعد مدير مشروع. المستخدم يعمل على مشروع ألفا المستحق يوم الجمعة. آخر تحديث كان: 'الواجهة الخلفية مكتملة، الواجهة الأمامية 80% جاهزة.' المستخدم: ما هي الحالة؟
بدون سياق، لا يعرف الذكاء الاصطناعي عن أي "حالة" تسأل. مع السياق، يمكنه إعطاء إجابة مفيدة.
نافذة السياق
تذكر من الفصول السابقة: الذكاء الاصطناعي لديه "نافذة سياق" محدودة - الحد الأقصى من النص الذي يمكنه رؤيته في وقت واحد. هذا يشمل:
التعليمات التي تحدد سلوك الذكاء الاصطناعي
الرسائل السابقة في هذه المحادثة
المستندات أو البيانات أو المعرفة المُجلبة لهذا الاستعلام
سؤال المستخدم الفعلي
الإجابة (تُحسب أيضاً ضمن الحد!)
الذكاء الاصطناعي عديم الحالة
الذكاء الاصطناعي لا يتذكر أي شيء بين المحادثات. كل استدعاء API يبدأ من الصفر. إذا أردت أن "يتذكر" الذكاء الاصطناعي شيئاً، عليك أنت تضمينه في السياق في كل مرة.
لهذا السبب ترسل روبوتات المحادثة سجل محادثتك بالكامل مع كل رسالة. ليس أن الذكاء الاصطناعي يتذكر - بل أن التطبيق يُعيد إرسال كل شيء.
تظاهر أن هذه محادثة جديدة بدون سجل. عن ماذا سألتك للتو؟
سيقول الذكاء الاصطناعي أنه لا يعرف لأنه حقاً لا يملك وصولاً لأي سياق سابق.
RAG: التوليد المعزز بالاسترجاع
RAG هي تقنية لمنح الذكاء الاصطناعي وصولاً للمعرفة التي لم يُدرَّب عليها. بدلاً من محاولة وضع كل شيء في تدريب الذكاء الاصطناعي، أنت:
- تخزّن مستنداتك في قاعدة بيانات قابلة للبحث
- تبحث عن المستندات ذات الصلة عندما يسأل المستخدم سؤالاً
- تسترجع القطع الأكثر صلة
- تُعزز موجهك بتلك القطع
- تُولّد إجابة باستخدام ذلك السياق
كيف يعمل RAG:
لماذا RAG؟
مزايا RAG
- يستخدم بياناتك الفعلية والحالية
- يقلل الهلوسات
- يمكنه الاستشهاد بالمصادر
- سهل التحديث (فقط حدّث المستندات)
- لا حاجة للضبط الدقيق المكلف
متى تستخدم RAG
- روبوتات دعم العملاء
- البحث في التوثيق
- قواعد المعرفة الداخلية
- أي أسئلة وأجوبة متخصصة في مجال معين
- عندما تهم الدقة
التضمينات: كيف يعمل البحث
كيف يعرف RAG أي المستندات "ذات صلة"؟ يستخدم التضمينات - طريقة لتحويل النص إلى أرقام تلتقط المعنى.
ما هي التضمينات؟
التضمين هو قائمة من الأرقام ("متجه") تمثل معنى النص. المعاني المتشابهة = أرقام متشابهة.
عرض التضمينات
انقر على كلمة لرؤية متجهها والتشابه مع الكلمات الأخرى:
"سعيد" متجه
التشابه مع: "سعيد"
الكلمات ذات المعاني المتشابهة (مثل «سعيد» و«فرحان») لها متجهات متشابهة وتحصل على درجات تشابه عالية.
البحث الدلالي
مع التضمينات، يمكنك البحث بالمعنى، وليس فقط بالكلمات المفتاحية:
البحث بالكلمات المفتاحية
الاستعلام: 'سياسة الإرجاع' يجد: المستندات التي تحتوي على 'إرجاع' و'سياسة' يفقد: 'كيفية الحصول على استرداد'
البحث الدلالي
الاستعلام: 'سياسة الإرجاع' يجد: جميع المستندات ذات الصلة بما في ذلك: - 'إرشادات الاسترداد' - 'كيفية إرجاع العناصر' - 'ضمان استرداد الأموال'
هذا هو سبب قوة RAG - فهو يجد المعلومات ذات الصلة حتى عندما لا تتطابق الكلمات بالضبط.
استدعاء الدوال / استخدام الأدوات
استدعاء الدوال يتيح للذكاء الاصطناعي استخدام أدوات خارجية - مثل البحث في الويب، أو التحقق من قاعدة بيانات، أو استدعاء API.
مزودو الذكاء الاصطناعي المختلفون يسمون هذا بأسماء مختلفة: "استدعاء الدوال" (OpenAI)، "استخدام الأدوات" (Anthropic/Claude)، أو "الأدوات" (مصطلح عام). جميعها تعني نفس الشيء.
كيف يعمل
- تخبر الذكاء الاصطناعي بالأدوات المتاحة
- الذكاء الاصطناعي يقرر إذا كان يحتاج أداة للإجابة
- الذكاء الاصطناعي يُخرج طلباً منظماً للأداة
- الكود الخاص بك يُشغّل الأداة ويُرجع النتائج
- الذكاء الاصطناعي يستخدم النتائج لتشكيل إجابته
هذا الموجه يوضح كيف يقرر الذكاء الاصطناعي استخدام أداة:
لديك وصول لهذه الأدوات: 1. get_weather(city: string) - الحصول على الطقس الحالي لمدينة 2. search_web(query: string) - البحث في الإنترنت 3. calculate(expression: string) - إجراء العمليات الحسابية المستخدم: كيف الطقس في طوكيو الآن؟ فكر خطوة بخطوة: هل تحتاج أداة؟ أي واحدة؟ ما المعلمات؟
التلخيص: إدارة المحادثات الطويلة
مع طول المحادثات، ستصل إلى حد نافذة السياق. بما أن الذكاء الاصطناعي عديم الحالة (لا يتذكر أي شيء)، يمكن للمحادثات الطويلة أن تفيض. الحل؟ التلخيص.
المشكلة
بدون تلخيص
الرسالة 1 (500 رمز) الرسالة 2 (800 رمز) الرسالة 3 (600 رمز) ... 50 رسالة أخرى ... ──────────────────── = 40,000+ رمز = تجاوز الحد!
مع تلخيص
[ملخص]: 200 رمز الرسائل الأخيرة: 2,000 رمز الاستعلام الحالي: 100 رمز ──────────────────── = 2,300 رمز = يناسب تماماً!
استراتيجيات التلخيص
الأساليب المختلفة تناسب حالات الاستخدام المختلفة. انقر على كل استراتيجية لترى كيف تعالج نفس المحادثة:
استراتيجيات التلخيص
تلخيص الرسائل القديمة، الاحتفاظ بالحديثة
المحادثة الأصلية
بعد: الملخص المتدحرج
ملخص (20t)
المستخدم يتعلم بايثون لتحليل البيانات. تم تغطية: المتغيرات، الأرقام، أساسيات القوائم.
الرسائل المحتفظ بها (42t)
توفير: 47%(116t → 62t)
ما يجب التقاطه في الملخصات
الملخص الجيد للمحادثة يحافظ على ما يهم:
جرّبها: أنشئ ملخصاً
تدرب على إنشاء ملخص يحافظ على السياق من هذه المحادثة:
لخص هذه المحادثة لإدارة السياق. الملخص سيحل محل المحادثة الكاملة في ذاكرة الذكاء الاصطناعي. المحادثة: المستخدم: مرحباً، أنا أتعلم Python لتحليل البيانات المساعد: مرحباً! Python رائع لتحليل البيانات. ما مستوى خبرتك الحالي؟ المستخدم: أعرف Excel الأساسي. مبتدئ تماماً في البرمجة. المساعد: نقطة انطلاق مثالية! لنبدأ بالمتغيرات - إنها مثل خلايا Excel التي تخزن البيانات. المستخدم: هل يمكنك شرح المتغيرات؟ المساعد: المتغيرات هي حاويات لتخزين البيانات. في Python: name = "Alice" أو age = 25 المستخدم: ماذا عن القوائم؟ أحتاج للتعامل مع قيم متعددة. المساعد: القوائم مثل أعمدة Excel! أنشئ واحدة هكذا: prices = [10, 20, 30]. الوصول للعناصر بـ prices[0]. المستخدم: هل يمكنني إجراء حسابات على القوائم؟ المساعد: نعم! استخدم sum(prices) أو len(prices) أو max(prices). للتحليل المعقد، سنستخدم pandas لاحقاً. المستخدم: ما هو pandas؟ المساعد: Pandas هي مكتبة لتحليل البيانات - فكر فيها كـ "Excel المعزز". لديها DataFrames (مثل جداول البيانات). أنشئ ملخصاً يلتقط: 1. هدف المستخدم وخلفيته (جملة واحدة) 2. الموضوعات التي تم تغطيتها حتى الآن (جملة واحدة) 3. أسلوب/تفضيلات تعلم المستخدم (جملة واحدة) 4. ما يجب تغطيته بعد ذلك (جملة واحدة)
متى تُلخص
أنت تدير نافذة سياق محادثة. بالنظر لهذه الشروط، قرر متى تُفعّل التلخيص: نافذة السياق: 8,000 رمز كحد أقصى الاستخدام الحالي: - موجه النظام: 500 رمز - سجل المحادثة: 6,200 رمز - مساحة للاستجابة: 1,500 رمز القواعد: - لخص عندما يتجاوز السجل 70% من المساحة المتاحة - احتفظ بآخر 5 رسائل سليمة - احفظ جميع تفضيلات وقرارات المستخدم هل يجب أن تُلخص الآن؟ إذا نعم، أي الرسائل يجب تلخيصها مقابل الاحتفاظ بها سليمة؟
MCP: بروتوكول سياق النموذج
MCP (بروتوكول سياق النموذج) هو طريقة قياسية لربط الذكاء الاصطناعي بالبيانات والأدوات الخارجية. بدلاً من بناء تكاملات مخصصة لكل مزود ذكاء اصطناعي، يوفر MCP واجهة عالمية.
لماذا MCP؟
ابنِ تكاملات منفصلة لـ ChatGPT، Claude، Gemini... حافظ على قواعد كود متعددة. ينكسر عندما تتغير الـ APIs.
ابنِ مرة واحدة، يعمل في كل مكان. بروتوكول قياسي. الذكاء الاصطناعي يمكنه اكتشاف واستخدام أدواتك تلقائياً.
ما يوفره MCP
- الموارد: البيانات التي يمكن للذكاء الاصطناعي قراءتها (الملفات، سجلات قاعدة البيانات، استجابات API)
- الأدوات: الإجراءات التي يمكن للذكاء الاصطناعي اتخاذها (بحث، إنشاء، تحديث، حذف)
- الموجهات: قوالب موجهات مُعدة مسبقاً
هذه المنصة لديها خادم MCP! يمكنك توصيله بـ Claude Desktop أو عملاء آخرين متوافقين مع MCP للبحث واستخدام الموجهات مباشرة من مساعد الذكاء الاصطناعي الخاص بك.
بناء السياق: الصورة الكاملة
ملعب السياق
بدّل كتل السياق لترى كيف تتجمع. لاحظ عدد الرموز!
--- موجه النظام --- أنت وكيل دعم عملاء لـ TechStore. كن ودودًا وموجزًا. --- المستندات المسترجعة (RAG) --- من قاعدة المعرفة: - سياسة الإرجاع: 30 يومًا، التغليف الأصلي مطلوب - الشحن: مجاني فوق 200 جنيه - الضمان: سنة واحدة على الإلكترونيات --- سجل المحادثة --- [ملخص] سأل المستخدم عن الطلب #12345. المنتج: فأرة لاسلكية. الحالة: تم الشحن أمس. المستخدم: متى سيصل؟ المساعد: بناءً على الشحن القياسي، يجب أن يصل خلال 3-5 أيام عمل. --- استفسار المستخدم --- هل يمكنني إرجاعه إذا لم يعجبني؟
أفضل الممارسات
الملخص
هندسة السياق هي إعطاء الذكاء الاصطناعي المعلومات الصحيحة:
- الذكاء الاصطناعي عديم الحالة - ضمّن كل ما يحتاجه في كل مرة
- RAG يسترجع المستندات ذات الصلة لتعزيز الموجهات
- التضمينات تُمكّن البحث الدلالي (المعنى، وليس فقط الكلمات المفتاحية)
- استدعاء الدوال يتيح للذكاء الاصطناعي استخدام الأدوات الخارجية
- التلخيص يدير المحادثات الطويلة
- MCP يُوحد كيفية اتصال الذكاء الاصطناعي بالبيانات والأدوات
جودة مخرجات الذكاء الاصطناعي تعتمد على جودة السياق الذي تقدمه. سياق أفضل = إجابات أفضل.