تخطى إلى المحتوى الرئيسي
أحدث الأبحاث:← عندما تذوب الدائرة12 vIndexes on Hugging Face
طلب عرض تجريبي

مستقبل أنظمة RAG: ما وراء استرجاع المستندات البسيط

استكشف الجيل القادم من أنظمة التوليد المعزز بالاسترجاع (RAG) وكيف تمكّن تطبيقات ذكاء اصطناعي أكثر تطورًا تتجاوز استرجاع المستندات البسيط.

مستقبل أنظمة RAG: ما وراء استرجاع المستندات البسيط

ظهر التوليد المعزز بالاسترجاع (RAG) كأحد أكثر التطبيقات تحويلية لنماذج اللغة الكبيرة (LLMs)، مما يمكّن أنظمة الذكاء الاصطناعي من الوصول إلى قواعد المعرفة الشاسعة والاستدلال عليها والتي تمتد بعيدًا عن بيانات التدريب الخاصة بها1. ومع ذلك، مع نشر المؤسسات لأنظمة RAG على نطاق واسع، أصبحت قيود أساليب الجيل الأول واضحة بشكل متزايد. ومع دخولنا عام 2025، يتموضع RAG بقوة ليس فقط كمعزّز للدقة بل كإطار جوهري للوكلاء اللغويين الموثوقين والقابلين للتحديث والقابلين للتدقيق2.

📰 تحديث مايو 2026 — أصبح RAG مشكلة توجيه وتنسيق، لا مشكلة هندسة خط أنابيب

نُشر هذا المقال لأول مرة في مايو 2025. وفي العام الذي تلاه، تحوّل مركز الثقل في RAG من ما يوجد داخل خط الأنابيب إلى ما يوجد داخل المُوجِّه الذي يختار خط الأنابيب. لا تزال المكوّنات التي وصفناها — الاسترجاع متعدد المراحل، الهياكل الهرمية بأسلوب RAPTOR، تفكيك الاستعلام، الاسترجاع التكراري — بدائيات صحيحة. لكنها صارت اليوم روتينات فرعية داخل أنظمة أكبر تُغلّفها بوكلاء، وتُسجّل أداءها بواسطة نقّاد تأمل في زمن التشغيل، وتوزّعها على محفظة من المسترجعين (متّجه مسطّح، رسم بياني معرفي، مستند بصري، وسياق طويل بطول مليونَي رمز) لكل استعلام على حدة لا لكل نظام3. فيما يلي ما استجدّ منذ النشر وما يجب التخلّي عنه من الإطار الأصلي.

بدائية RAG (إطار مايو 2025)الوضع في منتصف 2026
خطوط أنابيب الاسترجاع متعددة المراحللا تزال هي الأداة الأساسية. أصبح الاسترجاع السياقي (Contextual Retrieval) من Anthropic مع المزج بين BM25 / المتّجه / المُعيد الترتيب هو خط الأساس المفترض الجديد[^contextual-retrieval-2024].
الاسترجاع التكراري / RAPTORانصهر داخل Agentic RAG — صار التكرار مدفوعًا بوكيل تخطيط، لا بخط أنابيب ثابت[^rag-survey-2026][^sok-agentic-2026].
تفكيك الاستعلامتعمّم إلى RAG بالاستدلال نظام-1/نظام-2 — يقرّر الوكيل متى وماذا وكيف يسترجع[^reasoning-rag-2025].
RAG متعدد الوسائطاسترجاع المستندات البصرية عبر ColPali / ColQwen[^colpali-2024][^vidore-v2-2025] وتضمينات موحّدة للنص + الصورة + الفيديو + الصوت + PDF عبر gemini-embedding-2 (مارس 2026)[^gemini-embedding-2] — تستهلك فهارس Divinci المتجهية كليهما.
(لم يكن في المنشور الأصلي — ظهر لاحقًا.)Graph RAG: قلّص LazyGraphRAG من Microsoft إلى جانب GraphRAG 1.0 كلفة الفهرسة إلى نحو 0.1٪ من كلفة الرسم الكامل[^lazy-graphrag-2024][^graphrag-1-2025]. ويُعدّ LightRAG (HKU) وHippoRAG البديلين الأرخص والأسرع.
(لم يكن في المنشور الأصلي — حُسم هذا العام.)جدل السياق الطويل مقابل RAG: حُسم لصالح التوجيه. RAG للاستعلامات البسيطة؛ السياق الطويل (Gemini 3 Pro Deep Think، 2M رمز) للاستعلامات متعدّدة القفزات المعقّدة. ولا تزال مقاييس الإبر المتعدّدة متأخّرة عن الإبرة الواحدة بفارق 15–40 نقطة[^u-niah-2025].
عام من التحوّل المعماري، مُلخّصًا. تشير الاستشهادات إلى المصادر الأوّلية في أسفل المقال.

ما تغيّر أكثر من غيره: Agentic RAG كمعمارية مُسمّاة

أهمّ تطوّر منذ مايو 2025 هو تكامل Agentic RAG من نمط فضفاض إلى معمارية مُسمّاة لها تصنيفها وأدبيات مسحها الخاصة. يضع بحث Singh وآخرون “Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG”3 هذا المجال في تصنيف يقوم على عدد الوكلاء، وبنية التحكم، والاستقلالية، وتمثيل المعرفة، طاويًا داخل إطار تحليلي واحد التأمّل والتخطيط واستخدام الأدوات والتعاون متعدّد الوكلاء. ويُضيف بحث المتابعة “SoK: Agentic Retrieval-Augmented Generation”4 منهجة حول آليات التخطيط، وتنسيق الاسترجاع، ونماذج الذاكرة، وسلوكيات استدعاء الأدوات.

ما يعنيه ذلك عمليًا: بدلًا من كتابة خطّ أنابيب RAG واحد وضبطه، تكتب أنظمة الإنتاج في منتصف 2026 مُخطِّطًا يختار بين عدّة مسترجعين، ويقرّر هل يسترجع أصلًا (أحيانًا يعرف النموذج ما يكفي)، ويُعيد الاستعلام عندما يأتي الاسترجاع الأول ضعيفًا. وقد برز LangGraph كبيئة التشغيل الفعلية لهذا النمط.

تصحيح RAG الذاتي صار إنتاجيًا

تعمّم نقاش المنشور حول “إعادة الترتيب السياقية” ليصبح تصحيحًا ذاتيًا في زمن التشغيل. قدّم Self-RAG (Asai وآخرون، 20235) رموز تأمّل تتيح للنموذج نقد عمليات استرجاعه؛ وأضاف CRAG (Corrective RAG، Yan وآخرون6) مُقيّمًا خفيفًا خارجيًا للاسترجاع مع ثلاثة مسارات تصحيحية (صحيح / غير صحيح / مبهم). في 2025–2026 انتقل النمط من البحث إلى الإنتاج: مرّر كلّ عملية استرجاع عبر عقدة ناقد، وأعِد الاستعلام عند الأجزاء منخفضة الثقة، وأَعِد إدخال درجات على غرار RAGAS إلى البوّابة في زمن التشغيل لا في الوضع غير المتّصل فحسب.

هذا هو نفس المنطق الذي يصفه منشورنا حول اختبار الانحدار الآلي من أجل تقييم أنظمة RAG — لكنّه هنا يعمل داخل حلقة الاسترجاع، لا في التكامل المستمر فقط.

Graph RAG نضج بأسرع وتيرة

من بين أيّ من المجالات الفرعية، تحرّك استرجاع الرسم المعرفي بأسرع وتيرة خلال الاثني عشر شهرًا الماضية. Microsoft LazyGraphRAG7 (متوفّر الآن في Azure / Microsoft Discovery) يؤجّل تلخيص المجتمعات حتى زمن الاستعلام، فيُقلّل كلفة الفهرسة إلى نحو 0.1٪ من GraphRAG الكامل مع الحفاظ على الجودة. GraphRAG 1.08 هو إصدار الإرغونوميا بمستوى إنتاجي. ويوفّر LightRAG (HKU) استرجاعًا ثنائي الوضع برسم مسطّح بنحو 1٪ من كلفة GraphRAG؛ وذاكرة HippoRAG المستوحاة عصبيًا تقلّص كلفة الاستدلال متعدّد القفزات بمعامل 10–30×. ويُقدّم GraphRAG-Bench (ICLR 2026، arXiv:2506.05690) قاعدة القرار التجريبية: قيمة الرسم تتدرّج مع تعقيد الاستعلام9.

في معظم نشريات RAG الإنتاجية على النطاق الذي نراه، الإجابة الصحيحة في 2026 هي مزيج: متّجه مسطّح للذيل الطويل من عمليات البحث البسيطة، واسترجاع رسم لحصّة صغيرة من الاستعلامات متعدّدة القفزات المعقّدة التي تستحقّ تكلفة الفهرسة الإضافية.

السياق الطويل مقابل RAG: حُسم كتوجيه، لا كاستبدال

عند نشر منشور مايو 2025، كان السؤال المفتوح هو ما إذا كانت نوافذ السياق بطول 2M رمز ستُلغي RAG. حُسم الجدل — لصالح التوجيه. يصل Gemini 3 Pro Deep Think إلى 2M رمز وإلى درجات تنافسية على الإبرة الواحدة، لكن درجات الإبر المتعدّدة لا تزال متأخّرة بفارق 15–40 نقطة على مقاييس U-NIAH10، والاقتصاديات حاسمة: نحو 1.25 دولار لكل استعلام بطول 500K رمز على Gemini مقابل سنتات لـ RAG. يُقلّص التخزين السياقي المؤقّت الفجوة بنحو 90٪ لكنّه لا يُغلقها. وما يُعرف بنمط الفشل “ضائع في المنتصف” يتكرّر عبر جميع عائلات النماذج الكبرى حتى نهاية 2025.

ومن ثَمّ، فمعمارية منتصف 2026 هي: وجّه الاستعلامات البسيطة إلى RAG؛ ووجّه الاستعلامات المعقّدة متعدّدة القفزات أو غير المُهيكلة إلى السياق الطويل؛ ووجّه استعلامات المستندات البصرية إلى ColPali11؛ ووجّه استعلامات الرسم المعرفي إلى GraphRAG. إطار المنشور الأصلي حول “مسألة التحسين التي تحلّ محلّ ‘اختر معمارية RAG’” صحيح تمامًا — التحسين الآن يمتدّ على مسترجعين أكثر ممّا كان آنذاك.

استرجاع المستندات البصرية صار جاهزًا للإنتاج — وهبطت تضمينات الوسائط الموحّدة

قدّم ColPali11 (Faysse وآخرون، 2024) تضمينات VLM بالتفاعل المتأخّر مباشرة فوق صفحات المستندات المُصيَّرة، فألغى خطوة الابتلاع / OCR تمامًا. ورفع ViDoRe Benchmark V2 (مايو 202512) سقف استرجاع البصري. ويُحقّق ColQwen2 متوسّط نحو 90٪ على ViDoRe، وأضاف REAL-MM-RAG (فبراير 2025) مقياسًا متعدّد الوسائط من العالم الحقيقي. للمتون الغنيّة بـ PDF أو الجداول، صار استرجاع المستندات البصرية هو الافتراضي الإنتاجي اليوم؛ ولم يعد خطّ “OCR ثم تقسيم” الذي يفترضه المنشور الأصلي يمثّل أحدث ما توصّل إليه المجال.

في مارس 2026، طوى gemini-embedding-213 من Google الانقسام بين البصري / الفيديو / الصوت / النص داخل فضاء تضمين واحد — يقبل النموذج نصًّا حتى 8,192 رمزًا، وحتى ست صور لكل طلب، وفيديو حتى 120 ثانية، وصوتًا أصليًا، وملفّات PDF حتى ست صفحات، ويُنتج تضمينًا بأبعاد 3,072 (قابل للتقليص إلى 1,536 أو 768 عبر Matryoshka Representation Learning). يُتاح عبر كلٍّ من Gemini API وVertex AI، مع تكاملات أصيلة مع LangChain وLlamaIndex وHaystack وWeaviate وQdrant وChromaDB وVertex Vector Search. ويُموضع إعلان Google النموذج على أنّه يتفوّق على النماذج الرائدة في مهام النص والصورة والفيديو، إذ تُفيد Paramount Skydance بأنّ Text-to-Video Recall@1 بلغ 85.3٪ على مقياسها الداخلي.

بالنسبة إلى Divinci تحديدًا، النتيجة العملية هي أنّ فهارسنا المتجهية يمكنها ابتلاع النص والصورة والفيديو والصوت داخل فضاء استرجاع واحد — نشحن gemini-embedding-2 كخيار تضمين عبر نفس الخلفيات العشر التي تُسرد في صفحة توجيه RAG لدينا، ما يعني أنّ متن عميل بوسائط مختلطة (مثلًا فريق قانوني لديه عقود PDF، ومسوحات لعقود مُوقّعة، ومكالمات تفاوض مُسجّلة في مساحة العمل ذاتها) يمكن الاستعلام عنه عبر مكالمة استرجاع واحدة بدلًا من ثلاث.

استرجاع الفيديو والصوت لم يعد في طور البحث — صار يتشارك فضاء تضمين مع النصّ الآن.

أنماط RAG الإنتاجية — الخدمات المُدارة والاسترجاع السياقي

التحوّل الكبير الآخر في 2025–2026 هو أنّ فرق الإنتاج تستهلك RAG بشكل متزايد كخدمة مُدارة بدلًا من بناء نُسخها الخاصّة.

  • دخل Cloudflare AutoRAG المرحلة التجريبية المفتوحة في أبريل 2025 وأُعيدت تسميته إلى Cloudflare AI Search لاحقًا في العام نفسه1415، إذ يقدّم خطّ أنابيب مُدارًا للابتلاع → التقسيم → التضمين → Vectorize → التوليد عبر Workers AI. نحن نستخدم في Divinci مزيجًا مختلفًا — D1 مع FTS5 إلى جانب واجهات تضمين خارجية — لكن السوق الأوسع يتجمّع حول العروض المُدارة (كذلك AWS Bedrock Knowledge Bases وVertex AI Search).
  • جعل Anthropic Contextual Retrieval (الذي أُعلن عنه في سبتمبر 2024 وانتشر نشره خلال 202516) إضافة سياق توضيحي لكل جزء قبل التضمين خطَّ الأساس المفترض. ولم يعد المزج بين BM25 الكثيف + المتّجه + المُعيد الترتيب “متقدّمًا”؛ بل هو ما يشحنه فريق RAG كفؤ في يومه الأول.

انتقل التقييم من RAGAS غير المتّصل إلى بوّابات تقييم آلية متّصلة

دعا المنشور إلى تقييم RAG أفضل. وفي 2025–2026 سلّم الميدان الوعد. قدّم MIRAGE (Findings of NAACL 202517) 7,560 حالة تقييم استرجاع عبر مجموعة من 37,800 مدخل، مع مقاييس لهشاشة الضوضاء وقبول السياق وعدم حساسيّة السياق وسوء تفسير السياق. وأضاف MIRAGE-Bench (NAACL 202518) تغطية متعدّدة اللغات عبر 18 لغة. لا يزال RAGAS الافتراضي الإنتاجي للوفاء والملاءمة ودقّة السياق — لكنّ نمط 2026 هو تشغيل RAGAS كبوّابة استرجاع متّصلة، لا تقييمًا غير متّصل فقط. هذا هو النمط نفسه الذي نصفه في منشور اختبار الانحدار ونُشغّله في منشور اختبار CI.

ما يجب التخلّي عنه من المنشور الأصلي

صمد إطار مايو 2025 أفضل ممّا توقّعنا، لكنّ نقطتين محدّدتين تحتاجان تحديثًا:

  1. “استراتيجيات الاسترجاع الثابتة هي معظم تطبيقات RAG” — كان ذلك صحيحًا قبل عام، وأقلّ صحّة بكثير الآن. التوزيع الوكيلي هو الافتراضي الجديد لأيّ فريق يبني فوق مرحلة إثبات المفهوم.
  2. الافتراض الضمني بأنّ “OCR ثم تقسيم” هو كيف تعمل المتون الغنيّة بـ PDF — تجاوزه استرجاع ColPali / ColQwen البصري في النشريات الرائدة.

تظلّ الأقسام الأصلية حول خطوط الأنابيب متعدّدة المراحل، وتفكيك الاستعلام، والاسترجاع التكراري صحيحة. لكنّها الآن مُغلَّفة بوكلاء، ومُقيَّمة في الوضع المتّصل، ومُختارة لكل استعلام من محفظة بدلًا من ضبطها مرّة واحدة لكل نظام.

معمارية RAG في منتصف 2026، مُلخّصة

يبدو نظام RAG الإنتاجي في منتصف 2026 على النحو الآتي:

  1. مُخطِّط / موجِّه (يُنسَّق عبر LangGraph) يصنّف الاستعلام الوارد.
  2. محفظة من المسترجعين — متّجه مسطّح (مع خطّ أساس هجين BM25 + كثيف + مُعيد ترتيب)، استرجاع رسم (LazyGraphRAG / LightRAG / HippoRAG للذيل المعقّد)، مستندات بصرية (ColPali / ColQwen)، وسياق طويل (Gemini / Claude للاستعلامات غير المُهيكلة التي لا ينطبق عليها الاسترجاع).
  3. ناقد في زمن التشغيل (بأسلوب Self-RAG / CRAG) يُقيّم كلّ استرجاع ويُطلق إعادة الاستعلام عند الثقة المنخفضة.
  4. بوّابة تقييم متّصلة (RAGAS / MIRAGE) تُظهر مقاييس الوفاء / الهلوسة في الإنتاج، لا في CI فقط.
  5. حَكَم مُعايَر لأيّ تسجيل بأسلوب LLM-as-judge يُغذّي البوّابة، يُحدَّث أسبوعيًا مقابل تسميات بشرية.

وصف منشور مايو 2025 قطعة واحدة من ذلك (خط الأنابيب). أمّا واقع منتصف 2026 فهو التنسيق المُحيط بها.

🧭 توجيه RAG في Divinci — واجهة برمجة واحدة، ثلاث منصّات متمايزة معماريًا

إذا كانت معمارية RAG في منتصف 2026 توجيهًا-وتنسيقًا، فالسؤال الحامل يصبح: بين ماذا يختار المُوجِّه فعليًا؟ هنا تتباين مقاربتنا عن الأدبيات المنشورة.

كلّ موجِّه RAG مُسمّى استعرضناه يُوجّه على محور العمق: هل أسترجع مرّة، أم عدّة مرّات، أم لا أسترجع أصلًا؟ كلّ من Adaptive-RAG19 وProbing-RAG20 وR2RAG21 وLTRR (Learning to Rank Retrievers)22 وRAGRouter-Bench23 يصنّف الاستعلامات بحسب تعقيد الاستدلال ويُوزّعها على متغيّرات أعمق-أو-أقلّ عمقًا من المعمارية الاسترجاعية نفسها. وقالب “Adaptive RAG” في LangGraph يُوجّه بين لا-استرجاع / متّجه / بحث ويب — مرّة أخرى، حسب المصدر والعمق.

محور التوجيه في Divinci متعامد على ذلك: نحن نُوجّه بين ثلاث منصّات استرجاع متمايزة معماريًا، نختار بينها بحسب شكل الاستعلام، خلف نقطة نهاية واحدة لواجهة برمجة التطبيقات.

توجيه RAG في Divinci — ثلاث معماريات، نقطة نهاية واحدةيُصنّف المُوجِّه الاستعلام ويُوزّعه إلى أرخص طبقة قادرة على الإجابة عنه بصواباستعلام وارد ← المُوجِّه (مُصنّف شكل الاستعلام)واقعي؟ إشارة هجينة؟ متعدّد القفزات / مستند طويل؟ ← اختر أرخص طبقة تتعامل معهالطبقة 1 · RAG بمتّجه مسطّحسريع ورخيصضمّن الاستعلام ← تشابه جيب التماماسترجاع أعلى-k ← حشو السياق← توليدالأنسب لـ:عمليات بحث عن حقيقة واحدة،"ما هو X؟"، استعلامات بشكلFAQ على متون مسطّحةزمن الاستجابة:< 300 مللي ثانيةالكلفة:سنتات لكل استعلامالطبقة 2 · هجين + إعادة ترتيبمتوازنBM25 معجمي  + متّجه كثيف← دمج بالرتبة المتبادلة← مُعيد ترتيب بالمشفّر المتقاطع← توليدالأنسب لـ:استعلامات تتعارض فيها الإشاراتالمعجمية والدلالية —رموز، أسماء، اختصارات،مصطلحات تقنيةزمن الاستجابة:~ 800 مللي ثانيةالكلفة:لا تزال منخفضةالطبقة 3 · فهرس صفحات + وكيلعميق ومتأنّشجرة فهرس محتويات هرميةتُبنى عند الابتلاع← يتجوّل وكيل في الشجرة← يفتح / يقرأ الأقسام← توليدالأنسب لـ:قراءة متعدّدة القفزات لمستنداتمُهيكلة طويلة —قانونية، مالية، تقنيةملفّات PDF يمتدّ سياقها عبر صفحاتالكلفة:الأعلى — لكن تُدفعفقط عند الحاجة
الطبقات الثلاث منصّات متباينة معماريًا، لا متغيّرات عمق لمنصّة واحدة. يختار المُوجِّه واحدة لكل استعلام.

الطبقة 1 — RAG بمتّجه مسطّح (المسار السريع/الرخيص)

للاستعلامات الواقعية الواضحة ذات الإجابة الواحدة الكامنة في جزء واحد: ضمّن الاستعلام، استرجع أعلى-k بتشابه جيب التمام، احشُ السياق، ولّد. هي المعمارية الكلاسيكية لـ RAG التي وصفها المنشور الأصلي لعام 2025 بـ“الجيل الأول“ — مُستخدَمة هنا كمسار أوّل-ملاذ للاستعلامات التي لا تحتاج فعلًا إلى أيّ شيء أكثر. زمن استجابة أقل من 300 مللي ثانية عند p95، سنتات لكل استعلام، دون عبء مُعيد ترتيب.

الطبقة 2 — هجين BM25 + دمج كثيف + إعادة ترتيب

للاستعلامات التي تتعارض فيها الإشارات المعجمية والدلالية. يلتقط BM25 احتياجات المطابقة التامّة (رموز المنتجات، أسماء الأشخاص، الاختصارات التقنية، سلاسل الأخطاء)؛ وتلتقط المتّجهات الكثيفة إعادة الصياغة والترادف. يدمج Reciprocal Rank Fusion قائمتَي النتائج؛ ويُسجّل مُعيد ترتيب بمشفّر متقاطع أعلى-N المُدمج ويُعيد ترتيبه بحسب الملاءمة المشتركة بين الاستعلام والمستند. هذه هي المعمارية التي نشرتها Anthropic باسم Contextual Retrieval16 وما تشحنه معظم فرق RAG الكفؤة في 2026 كافتراضها. تتعامل Divinci معها بوصفها الطبقة الوسطى — الإجابة الصحيحة لمعظم الاستعلامات، لكنّها ليست المسار الأرخص ولا الأعمق.

الطبقة 3 — فهرس صفحات + تجوّل وكيلي للمستند

للاستعلامات التي تتطلّب قراءة متعدّدة القفزات لمستندات مُهيكلة طويلة — العقود القانونية، وتقارير 10-K المالية، والمواصفات التقنية، حيث تتطلّب الإجابة تجميع سياق يمتدّ عبر أقسام غير متجاورة.

عند الابتلاع، نبني شجرة فهرس محتويات هرمية فوق المستند: العناوين، والعناوين الفرعية، والتعليقات، والحواشي — فهرس بنيوي بلا متّجه يُرفق بكل عقدة ملخّص قصير يُولّده LLM. عند الاستعلام، يتجوّل وكيل في الشجرة، ويُقرّر أيّ شجرة فرعية ذات صلة، ويفتح تلك الأقسام، ويقرأ، ويُقرّر ما يستشيره تاليًا. PageIndex من VectifyAI24 هو التحقّق المفتوح المصدر القائم بذاته من هذه الفكرة وتأكيد قوي لأنّ الطبقة الثالثة حقيقية — يشحنونه وحده، كمنتج قائم بذاته. تتعامل Divinci معه كـالطبقة الثالثة داخل موجِّه لا كالخيار الوحيد، لأنّ معظم الاستعلامات لا تحتاج إليه ودفع كلفته على كلّ استعلام إهدار.

لماذا يختلف محور التوجيه هذا عن البقيّة

يوجّه Adaptive-RAG19 (Jeong وآخرون، NAACL 2024) بين لا-استرجاع / خطوة واحدة / استرجاع تكراري — محور العمق. وامتدادات 2025 — Probing-RAG20، R2RAG21، LTRR22، RAGRouter-Bench23، “Query Routing for Retrieval-Augmented Language Models”25 — كلّها تُوسّع المحور نفسه: ما مقدار الاسترجاع الذي يحتاجه هذا الاستعلام؟ وكلّها تُوجّه بين متغيّرات أعمق أو أقلّ عمقًا لمعمارية استرجاع واحدة.

Divinci تُوجّه على محور المعمارية. الاستعلام نفسه الذي يصنّفه تطبيق Adaptive-RAG بأنّه “تكراري” قد يكون إمّا الطبقة 2 الهجينة (إذا كان الاستعلام يستفيد من دمج المعجمي والدلالي) أو الطبقة 3 فهرس الصفحات (إذا احتاج إلى قراءة متعدّدة القفزات لمستند طويل) — تلك إجابات متمايزة معماريًا، لا متغيّرات عمق. المحوران متعامدان: العمق يخبرك بعدد التمريرات، والمعمارية تخبرك بنوع الاسترجاع الذي تكون عليه كلّ تمريرة.

أين يكون الطرح الأضعف، بإنصاف

مفهوم توجيه RAG لكل استعلام مُستقرّ. لم نخترع التوجيه. التميّز الحقيقي هو: التوجيه عبر منصّات متمايزة معماريًا، في نقطة نهاية مُدارة، مع إدراج تجوّل الطبقة الثالثة بأسلوب PageIndex. لا يشحن أيّ مُزوّد سحابة عملاق هذا التركيب اليوم. كلّ من Cloudflare AI Search15 وAWS Bedrock Knowledge Bases26 وAzure AI Search27 وOpenAI Assistants File Search28 يشحن خطّ أنابيب هجينًا واحدًا (مع وضع وكيلي منفصل أحيانًا تختاره يدويًا). LlamaIndex RouterRetriever / RouterQueryEngine29 هو الأقرب مفاهيميًا لكنّه مكتبة يتعيّن على العملاء تجميعها ومعايرتها وتشغيلها بأنفسهم.

كيف يبدو ذلك على سطح واجهة برمجة التطبيقات

المُوجِّه غير مرئي للمُستدعي. نقطة نهاية واحدة، شكل طلب واحد، والاستجابة تُخبرك أيّ طبقة أجابت ليُمكنك التدقيق:

curl -X POST https://api.divinci.app/v1/query \
  -H "Authorization: Bearer $DIVINCI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "query":  "What clauses in the 2024 amendment override section 7.3?",
    "corpus": "legal-contracts-q4"
  }'

# Response (annotated)
{
  "answer": "...",
  "routing": {
    "tier_used":    "page-index-agentic",       # tier 3
    "tier_reason":  "multi-hop legal corpus, ≥3 hops detected",
    "alt_considered": ["hybrid"],
    "tier_costs": { "tier1": 0.003, "tier2": 0.018, "tier3": 0.124 }
  },
  "citations": [ /* */ ]
}

العميل لا يختار منصّة؛ ولا يُشغّل ثلاثًا. المُوجِّه يفعل ذلك. شفافية بمستوى التدقيق حول الطبقة التي أجابت جزء من الاستجابة، لا مدفونة في المقاييس — وهي روح القابلية للتدقيق ذاتها التي بنيناها داخل إيصال vIndex وبيان الإصدار لمنظومة CI/CD لدينا.

كيف يُقرّر المُوجِّه فعلًا — توجيه مُتعلَّم، لا مُصنِّف مُرمَّز يدويًا

النسخة من هذا المُوجِّه التي تُشحَن اليوم لا تستخدم سمات شكل-استعلام مُرمَّزة يدويًا. الآلية هي توجيه مُتعلَّم عبر تشابه التضمين مقابل أزواج سؤال→خلفية تاريخية، وتعمل كما يلي:

  1. تجزئة السؤال الوارد (SHA-256، مُقتطعة إلى مفتاح بطول 16 محرفًا).
  2. بحث KV بمطابقة تامّة مقابل مخزن التوجيه لكل عميل — إن كان هذا السؤال بالضبط قد أُجيب من قبل، وزّعه فورًا إلى الخلفية التي أبلت أفضل آخر مرّة.
  3. عند الإخفاق، ضمّن السؤال وابحث بتشابه جيب التمام مقابل فهرس مُخزّن لتضمينات الأسئلة التاريخية. إن تجاوز أقرب جار حدّ 0.88 من تشابه جيب التمام، وزّعه إلى خلفيّته.
  4. إن لم تكن هناك مطابقة فوق العتبة، تراجع إلى الخلفية الافتراضية المُكوَّنة للمتن.

تحمل مدخلات التوجيه عمر صلاحية 30 يومًا؛ تُطلق المدخلات المنتهية إعادة قياس عند البحث التالي، وهكذا يبقى نموذج التوجيه طازجًا مع تطوّر المتن ومزيج حركة المرور. تُغذّى إشارة “ما الأداء الأفضل آخر مرّة” من مصدرين عليّين: تحديدات صريحة بأسلوب الحلبة A/B من العميل، وناتج تصحيحنا الذاتي الداخلي الذي يُقارن عمليات الاسترجاع عبر الخلفيات على استعلامات تمثيلية. كلاهما يكتب إلى مخزن تاريخ التوجيه لكل عميل؛ ويستهلك المُوجِّه أيًّا منهما.

يختلف هذا اختلافًا جوهريًا عن الموجِّهات الأكاديمية المنشورة (Adaptive-RAG وامتداداته)، التي تُصنّف الاستعلام مُسبقًا بحسب التعقيد. نهجنا المُتعلَّم يثق بالأدلّة التاريخية أكثر من ارشاديات شكل الاستعلام، لأنّ الشكل نفسه يتصرّف تجريبيًا بصورة مختلفة على متون مختلفة — استعلام “قارن X عبر Y” على عقود قانونية يطلب تجوّل فهرس صفحات بالطبقة 3؛ والشكل ذاته على متن FAQ مسطّح يكتفي بالطبقة 1. ترك نموذج التوجيه يتعلّم هذا التمييز لكل متن، بدلًا من تخمينه من بنية الاستعلام، هو خيار التصميم الذي شُحن فعلًا.

ملاحظة حول الطبقات الثلاث المفاهيمية مقابل قائمة الخلفيات الفعلية. الطبقات الثلاث أعلاه طيف مفاهيمي مفيد (سريع-رخيص / متوازن / عميق-متأنٍّ). أمّا المُوجِّه نفسه فيُوزّع إلى واحدة من مجموعة أوسع من الخلفيات المُسمّاةpageindex (بشكل الطبقة 3)، neo4j-hybrid (استرجاع مُعزَّز بالرسم)، raptor (تجوّل شجرة)، lightrag (بحث كيانات + مجتمعات)، ومحركات متّجه خالصة على qdrant / cloudflare-v2 / couchbase-byok / vertex-ai-vector-search-v2 / mongodb-atlas / redis-vector-search. أمّا هجين الطبقة 2 (BM25 + دمج كثيف + مُعيد ترتيب بمشفّر متقاطع) فيُشحَن في لوحة سير العمل لدينا كعقدة قابلة للتركيب اليوم، وهو في خارطة الطريق كخلفية قابلة للتوجيه الآلي؛ إن كانت الطبقة 2 هي الإجابة الصحيحة لمتنك الآن، فأنت تُركّبها كسير عمل، لا كهدف توجيه. سندمج ذلك في المُوجِّه الآلي عندما تُبرّر بيانات التوجيه لكل متن ذلك.

قرار المُوجِّه مُسجَّل اليوم ويُعرَض عبر مسار التدقيق؛ أمّا بيانات التوجيه الكاملة في حمولة الاستجابة (حقول routing.tier_used / tier_reason / tier_costs المعروضة أعلاه) فهي بند في خارطة الطريق — ونمط shadow CI من منشور اختبار CI هو كيف سنتحقّق من التغيير قبل تفعيله.

متى يهمّ هذا أكثر

العميل الذي لديه متن متجانس وشكل استعلام موحّد يحصل على طبقة مُثلى واحدة ويستفيد قليلًا من التوجيه — يمكنه اختيار الطبقة 2 يدويًا وينتهي الأمر. الشريحة الذهبية هي مؤسسات بـمتون مختلطة وأشكال استعلامات مختلطة: فريق قانوني يسأل في آن واحد “ما تعريف القوّة القاهرة في عقدنا المعياري؟” (الطبقة 1) و“عبر 47 من عقود مورّدينا، أيّها يتضمّن بنود إنهاء غير معيارية وما الأنماط؟“ (الطبقة 3). التوجيه عبر المعماريات هو ما يتيح لنقطة نهاية واحدة خدمتهما معًا بصواب دون دفع كلفة الطبقة 3 على استعلام الطبقة 1.

تلك هي الحالة التي تكسب فيها نقطة نهاية مُدارة واحدة، خلفها ثلاث منصّات متمايزة معماريًا، رزقها.

الوعد والقيود لـ RAG من الجيل الأول

تتبع أنظمة RAG التقليدية نمطًا مباشرًا: تضمين المستندات في فضاء المتجهات، واسترجاع الأجزاء ذات الصلة بناءً على التشابه الدلالي، وحقن هذا السياق في موجه LLM. بينما أثبت هذا النهج فعاليته لسيناريوهات الأسئلة والأجوبة الأساسية، فإنه يواجه عدة تحديات أساسية:

قيود نافذة السياق

حتى مع دعم LLMs الحديثة لنوافذ سياق 100K+ رمز، التحدي ليس فقط حول احتواء المزيد من المحتوى - بل يتعلق بالحفاظ على التماسك والملاءمة عبر مصادر معلومات متنوعة. عند التعامل مع استعلامات معقدة تتطلب تجميع المعلومات من مستندات متعددة، غالبًا ما يؤدي التسلسل البسيط إلى زيادة المعلومات بدلاً من الرؤية.

قيود البحث الدلالي

البحث عن تشابه المتجهات، على الرغم من قوته، يمكن أن يفوت العلاقات الدقيقة بين المفاهيم. قد لا يسترجع استعلام حول “تقييم المخاطر المالية” المستندات التي تناقش “مبادلات التخلف عن سداد الائتمان” إذا لم يلتقط فضاء التضمين هذه الروابط الدلالية بفعالية.

استراتيجيات الاسترجاع الثابتة

تستخدم معظم تطبيقات RAG أنماط استرجاع ثابتة لا تتكيف مع تعقيد الاستعلام أو السياق. يتطلب سؤال واقعي بسيط منطق استرجاع مختلف عن طلب تحليلي معقد، ومع ذلك تعاملهم معظم الأنظمة بشكل متطابق.

[هندسة RAG المتقدمة] تستخدم أنظمة RAG الحديثة خطوط أنابيب استرجاع واستدلال متطورة متعددة المراحل

تطور هندسة RAG

يعالج الجيل القادم من أنظمة RAG هذه القيود من خلال عدة ابتكارات رئيسية:

خطوط أنابيب الاسترجاع متعددة المراحل

بدلاً من خطوة استرجاع واحدة، تستخدم أنظمة RAG المتقدمة خطوط أنابيب متعددة المراحل تصقل وتوسع فضاء البحث تدريجيًا:

  1. تحليل الاستعلام: فهم نية الاستعلام والتعقيد وأنواع المعلومات المطلوبة
  2. الاسترجاع الأولي: بحث دلالي واسع لتحديد المستندات المرشحة
  3. توسيع السياق: متابعة الاستشهادات والمستندات ذات الصلة والإحالات المرجعية
  4. تصفية الملاءمة: تطبيق تصفية خاصة بالاستعلام لإزالة الضوضاء
  5. تجميع السياق: تنظيم المعلومات المستردة إلى سياق متماسك ومنظم

تحويل الاستعلام وتحليله

غالبًا ما تتطلب الاستعلامات المعقدة تحليلاً إلى أسئلة فرعية يمكن معالجتها بشكل مستقل قبل التجميع. على سبيل المثال:

# مثال تحويل الاستعلام
original_query = "كيف تؤثر التقدمات في الحوسبة الكمومية على أمن العملات الرقمية؟"

decomposed_queries = [
    "ما هي أحدث التقدمات في الحوسبة الكمومية؟",
    "كيف تهدد الحوسبة الكمومية الطرق التشفيرية الحالية؟",
    "ما هي تدابير أمن العملات الرقمية المقاومة للكم؟",
    "الجدول الزمني لأجهزة الكمبيوتر الكمومية لكسر التشفير الحالي"
]

الاسترجاع والاستدلال التكراري

[عملية الاسترجاع التكراري] يمكّن الاسترجاع التكراري من استكشاف أعمق لشبكات المعلومات

يمكن لأنظمة RAG المتقدمة استكشاف شبكات المعلومات بشكل تكراري، متابعة الأدلة والروابط لبناء فهم شامل. يحاكي هذا النهج كيفية عمل الباحثين البشريين بشكل طبيعي - البدء بمصادر أولية ومتابعة الروابط ذات الصلة.

ما وراء استرجاع المستندات: التطبيقات الناشئة

مع نضوج أنظمة RAG، فإنها تمكّن فئات جديدة تمامًا من تطبيقات الذكاء الاصطناعي:

أنظمة المعرفة المعززة بالاستدلال

بدلاً من مجرد استرجاع وعرض المعلومات، يمكن لأنظمة RAG من الجيل القادم:

  • تحديد فجوات المعرفة: التعرف على متى تكون المعلومات المتاحة غير كافية للإجابات الواثقة
  • التحقق من الإحالة المرجعية: فحص الاتساق عبر مصادر متعددة
  • الاستدلال الزمني: فهم كيف تتغير صحة المعلومات بمرور الوقت
  • التحليل السببي: تتبع علاقات السبب والنتيجة عبر مجموعات المستندات

التنقل الديناميكي في الرسم البياني للمعرفة

تتكامل أنظمة RAG بشكل متزايد مع الرسوم البيانية للمعرفة، مما يمكّن من الاستكشاف الديناميكي لعلاقات الكيانات والروابط الدلالية التي قد يفوتها البحث المتجه الخالص.

RAG متعدد الوسائط

التوسع ما وراء النص لدمج الصور والرسوم البيانية والجداول وأنواع الوسائط الأخرى في عملية الاسترجاع والاستدلال. هذا مفيد بشكل خاص للتوثيق التقني والتقارير المالية والأدبيات العلمية.

التحديات والاتجاهات المستقبلية

على الرغم من هذه التقدمات، تبقى عدة تحديات:

التعقيد الحسابي

يزيد الاسترجاع متعدد المراحل والاستدلال التكراري بشكل كبير من المتطلبات الحسابية. يتطلب تحسين هذه الأنظمة للنشر الإنتاجي اهتمامًا دقيقًا باستراتيجيات التخزين المؤقت والمعالجة التدريجية والتفعيل الانتقائي للميزات المتقدمة.

ضمان الجودة

مع زيادة تعقيد النظام يأتي تحدي ضمان جودة وموثوقية المخرجات. مقاييس التقييم التقليدية لأنظمة RAG لا تلتقط بشكل كافٍ خصائص الأداء الدقيقة لخطوط أنابيب الاستدلال متعددة المراحل.

تعقيد التكامل

تحتاج المؤسسات إلى أدوات يمكنها دمج قدرات RAG المتقدمة بسلاسة في سير العمل الحالية دون الحاجة إلى خبرة واسعة في الذكاء الاصطناعي.

[عملية تحسين AutoRAG] يقلل تحسين RAG الآلي من تعقيد النشر مع تحسين الأداء

حل AutoRAG من Divinci AI

في Divinci AI، طورنا AutoRAG - نظام آلي يحسن خطوط أنابيب RAG لحالات الاستخدام ومجموعات البيانات المحددة. يعالج AutoRAG التحديات الرئيسية لنشر RAG من الجيل القادم:

  • اختيار الهندسة الآلي: اختيار استراتيجيات الاسترجاع المثلى بناءً على خصائص المستند وأنماط الاستعلام
  • تحسين المعلمات الديناميكي: ضبط معلمات النظام بشكل مستمر بناءً على ملاحظات المستخدمين ومقاييس الأداء
  • تكامل ضمان الجودة: تقييم ومراقبة مدمجة لضمان جودة مخرجات متسقة
  • التكامل السلس: واجهات برمجة تطبيقات بسيطة تجرد التعقيد مع توفير الوصول إلى القدرات المتقدمة

الخلاصة

لا يكمن مستقبل أنظمة RAG في استرجاع المستندات البسيط، بل في أنظمة الاستدلال المتطورة التي يمكنها التنقل في مناظر المعلومات المعقدة وتجميع مصادر متنوعة وتقديم رؤى دقيقة. مع نضوج هذه الأنظمة، ستنتقل من كونها محركات بحث مطورة إلى أن تصبح شركاء معرفة حقيقيين يعززون قدرات الاستدلال البشري.

ستكون المؤسسات التي تنجح في هذا المشهد الجديد هي تلك التي يمكنها نشر وتحسين أنظمة RAG المتقدمة هذه بفعالية - تحويل أصول معلوماتها إلى مزايا تنافسية من خلال تطبيقات ذكاء اصطناعي ذكية وواعية بالسياق.

للمؤسسات التي تتطلع إلى تجاوز تطبيقات RAG من الجيل الأول، المفتاح هو البدء بأساس قوي يمكن أن يتطور. ركز على جودة البيانات، وأنشئ معايير تقييم واضحة، واختر منصات يمكن أن تنمو مع احتياجاتك.

هل أنت مستعد لاستكشاف RAG من الجيل القادم لمؤسستك؟ اتصل بفريقنا لمعرفة كيف يمكن لـ AutoRAG تحويل إدارة المعرفة وعمليات صنع القرار لديك.

المراجع

1

arXiv. “A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions.” أكتوبر 2024. مسح أكاديمي شامل يوثّق تطوّر RAG ووضعه الراهن.

2

Medium (Maheshus). “Retrieval-Augmented Generation (RAG): Real Advances in 2025.” أغسطس 2025. تحليل يضع RAG كإطار جوهري لوكلاء لغة موثوقين وقابلين للتحديث والتدقيق في 2025.

3

Singh وآخرون. “Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG.” arXiv:2501.09136 (يناير 2025، محدّث حتى 2026). تصنيف Agentic RAG بحسب عدد الوكلاء وبنية التحكم والاستقلالية وتمثيل المعرفة. https://arxiv.org/abs/2501.09136

4

“SoK: Agentic Retrieval-Augmented Generation.” arXiv:2603.07379 (2026). منهجة-المعرفة حول التخطيط وتنسيق الاسترجاع والذاكرة واستدعاء الأدوات في Agentic RAG. https://arxiv.org/abs/2603.07379

30

“Reasoning RAG via System 1 or System 2.” arXiv:2506.10408 (يونيو 2025). يُصوغ التحوّل من خطوط الأنابيب الثابتة إلى الاسترجاع الديناميكي المدفوع بالاستدلال الذي يُقرّر متى وماذا وكيف يسترجع. https://arxiv.org/html/2506.10408v1

5

Asai وآخرون. “Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection.” arXiv:2310.11511. إطار رموز التأمّل الذي ثبّت خطّ العمل في تصحيح RAG ذاتيًا. https://arxiv.org/pdf/2310.11511

6

Yan وآخرون. “Corrective Retrieval Augmented Generation.” arXiv:2401.15884 (الإصدار 3، 2024). مُقيّم استرجاع خفيف خارجي بثلاثة مسارات تصحيحية (صحيح / غير صحيح / مبهم). https://arxiv.org/html/2401.15884v3

7

Microsoft Research. “LazyGraphRAG: Setting a New Standard for Quality and Cost.” نوفمبر 2024؛ مُدمج في Azure / Microsoft Discovery في 6 يونيو 2025. خُفّضت كلفة الفهرسة إلى ~0.1٪ من GraphRAG الكامل. https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/

8

Microsoft Research. “Moving to GraphRAG 1.0: Streamlining Ergonomics for Developers and Users.” 2025. إصدار الإرغونوميا بمستوى إنتاجي. https://www.microsoft.com/en-us/research/blog/moving-to-graphrag-1-0-streamlining-ergonomics-for-developers-and-users/

9

“When to Use Graphs in RAG (GraphRAG-Bench).” arXiv:2506.05690 (ICLR 2026). قاعدة قرار تجريبية: قيمة الرسم تتدرّج مع تعقيد الاستعلام. https://arxiv.org/html/2506.05690v3

10

“U-NIAH: A Unified Framework for Long-Context Needle-in-a-Haystack Evaluation.” arXiv:2503.00353 (مارس 2025). لا تزال درجات الإبر المتعدّدة متأخّرة عن الإبرة الواحدة بفارق 15–40 نقطة؛ ويتأخّر RULER عن NIAH-2 بفارق 10–25 نقطة. https://arxiv.org/html/2503.00353v1

17

“MIRAGE: A Multi-Instance Retrieval-Augmented Generation Evaluation Framework.” Findings of NAACL 2025، arXiv:2504.17137. 7,560 حالة عبر مجموعة استرجاع من 37,800 مدخل. https://aclanthology.org/2025.findings-naacl.157/

18

“MIRAGE-Bench: Automatic Multilingual RAG Arena Benchmark.” NAACL 2025. تقييم RAG متعدّد اللغات عبر 18 لغة. https://aclanthology.org/2025.naacl-long.14/

11

Faysse وآخرون. “ColPali: Efficient Document Retrieval with Vision Language Models.” arXiv:2407.01449 (2024). تضمينات VLM بالتفاعل المتأخّر مباشرة فوق صفحات المستندات المُصيَّرة؛ تُلغي خطوة OCR. https://arxiv.org/abs/2407.01449

12

“ViDoRe Benchmark V2.” arXiv:2505.17166 (مايو 2025). الإصدار الثاني من مقياس استرجاع المستندات البصرية. https://arxiv.org/pdf/2505.17166

13

Google. “Introducing gemini-embedding-2.” مدوّنة Google، 10 مارس 2026. نموذج تضمين موحّد للنص + الصورة + الفيديو + الصوت + PDF. الأبعاد الافتراضية 3,072 (1,536 / 768 عبر Matryoshka). الحدود: 8,192 رمزًا نصيًّا · 6 صور / طلب · 120 ثانية فيديو · صوت أصلي · ملفّات PDF بستّ صفحات. متاح عبر Gemini API وVertex AI، مع تكاملات أصيلة مع LangChain وLlamaIndex وHaystack وWeaviate وQdrant وChromaDB وVertex Vector Search. https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/

16

Anthropic. “Introducing Contextual Retrieval.” مدوّنة Anthropic، سبتمبر 2024. سياق توضيحي لكل جزء يُضاف قبل التضمين؛ صار مزيج التضمين + BM25 + إعادة الترتيب خطّ الأساس الإنتاجي الافتراضي. أنماط النشر الإنتاجي موثّقة في دراسات حالة AWS Bedrock (يونيو 2025). https://aws.amazon.com/blogs/machine-learning/contextual-retrieval-in-anthropic-using-amazon-bedrock-knowledge-bases/

14

Cloudflare. “Introducing AutoRAG on Cloudflare.” مدوّنة Cloudflare، أبريل 2025. خطّ أنابيب RAG مُدار: ابتلاع → تقسيم → تضمين → Vectorize → توليد عبر Workers AI. https://blog.cloudflare.com/introducing-autorag-on-cloudflare/

15

Cloudflare Developers. “AI Search release notes.” 2026. أُعيدت تسمية AutoRAG إلى AI Search. https://developers.cloudflare.com/ai-search/platform/release-note/

24

VectifyAI. “PageIndex — hierarchical table-of-contents index with LLM tree-search retrieval.” مستودع GitHub، 2025. تطبيق مستقلّ لمعمارية الطبقة الثالثة (تجوّل وكيلي هرمي بلا متّجه). https://github.com/VectifyAI/PageIndex

29

LlamaIndex. “Router Retriever / RouterQueryEngine.” مُختار LLM/Pydantic يختار مسترجعًا واحدًا أو أكثر من المُسجَّلين لكل استعلام. الأقرب مفاهيميًا كلبنة بناء لمُوجِّه معماري، لكنّه مكتبة (تأتي معك بمنصّاتك). https://docs.llamaindex.ai/en/stable/examples/retrievers/router_retriever/

19

Jeong وآخرون. “Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity.” NAACL 2024. يُوجّه بحسب تعقيد الاستعلام بين لا-استرجاع / خطوة واحدة / استرجاع تكراري — مُوجّه محور-العمق القانوني. https://aclanthology.org/2024.naacl-long.389/

20

“Probing-RAG: Self-Probing to Guide Language Models in Selective Document Retrieval.” NAACL 2025. متابعة لـ 2025 تُوسّع توجيه Adaptive-RAG على محور العمق.

21

“R2RAG: Reasoning-Aware Routing for Retrieval-Augmented Generation.” NeurIPS 2025 (ورقة فائزة). توجيه محور-العمق بتصنيف واعٍ بالاستدلال.

22

“LTRR: Learning To Rank Retrievers.” arXiv:2506.13743 (2025). يتعلّم ترتيب المسترجعين لكل استعلام — على محور العمق، لا على محور المعمارية. https://arxiv.org/pdf/2506.13743

23

“Lightweight Query Routing for RAG / RAGRouter-Bench.” arXiv:2604.03455 (2026). مقياس للتوجيه — مرّة أخرى، متغيّرات محور-العمق لمعمارية واحدة. https://arxiv.org/html/2604.03455v1

25

“Query Routing for Retrieval-Augmented Language Models.” arXiv:2505.23052 (2025). https://arxiv.org/abs/2505.23052

26

AWS. “Bedrock Knowledge Bases — hybrid search with Aurora PostgreSQL and MongoDB Atlas.” إطلاق أبريل 2025. خطّ أنابيب هجين واحد؛ لا مُوجِّه معماري. https://aws.amazon.com/about-aws/whats-new/2025/04/amazon-bedrock-knowledge-bases-hybrid-search-aurora-postgresql-mongo-db-atlas-vector-stores/

27

Microsoft. “Azure AI Search — Agentic Retrieval overview.” 2025. أقرب عرض من مزوّد سحابة عملاق لخطّ أنابيب استرجاع متعدّد الأوضاع، لكنّ المستخدم يختار الوضع بدلًا من مُوجِّه يختاره لكل استعلام. https://learn.microsoft.com/en-us/azure/search/agentic-retrieval-overview

هل أنت مستعد لبناء حل الذكاء الاصطناعي المخصص؟

اكتشف كيف يمكن لـ Divinci AI مساعدتك في تطبيق أنظمة RAG وأتمتة ضمان الجودة وتبسيط عملية تطوير الذكاء الاصطناعي.

ابدأ اليوم