تجاوز إلى المحتوى الرئيسي

خدمة 5.4 · Agentic AI

معرفة مؤسستك، في يد وكيل

وكلاء يُجيبون من وثائقك — لا يُهلوسون. كل إجابة مع مرجع. PDF، Word، Drive — إلى قرار في ثوانٍ.

ملخّص تنفيذي

TL;DR — وكلاء يُجيبون بدقة من وثائق مؤسستك — لا يُهلوسون ولا يخترعون. pgvector + HNSW للبحث السريع، text-embedding-3-small للدقة، Re-rank بـ Haiku للاستهداف، Citation لكل إجابة. من PDF للقرار في ثوانٍ.

ما الفرق بين LLM عادي و RAG؟

ChatGPT لا يعرف وثائق شركتك. RAG يُغذّيه بمعرفة مؤسستك قبل كل إجابة — بدقة ومرجع.

جدول مقارنة بين LLM عادي و RAG
الجانب LLM عادي RAG (نحن)
مصدر المعرفة ما تدرّب عليه النموذج وثائق المؤسسة الحقيقية
الحداثة قديمة (تاريخ التدريب) لحظيّة — أي وثيقة جديدة
الخصوصية عامّة — يراها الجميع خاصة بالمؤسسة وحدها
الهلوسة تحدث كثيراً مرتكزة بمصادر مُستشهَد بها
التحقّق صعب مرجع لكل إجابة (source citation)
اللغة العربية محدودة المعرفة معرفة عربية كاملة (من وثائقك)

ما الاستخدامات الفعلية؟

  • مساعد داخلي للموظفين

    عمليات
    RAG داخلي

    الموظف يسأل عن سياسة داخلية، إجازة، سلم رواتب — الوكيل يُجيب من دليل الشركة.

    النتيجة: تقليل أسئلة HR 60%.

  • دعم عملاء معرفي

    خدمة عملاء
    RAG + Conversational

    العميل يسأل عن منتج — الوكيل يستخرج الإجابة من الكتالوج، دليل الاستخدام، أو قاعدة أخطاء.

    النتيجة: معدل رضا أعلى، تحويل أقل للبشر.

  • بحث قانوني/تقني

    قانوني/هندسي
    RAG بدقة عالية

    محامٍ أو مهندس يبحث في ملفات مشاريع سابقة — الوكيل يُعيد سياق كامل مع المرجع.

    النتيجة: بحث ساعات → دقائق.

ما القدرات التقنية الأساسية؟

  • استيعاب كل أنواع الوثائق

    PDF، Word، Markdown، Google Docs، HTML، حتى الـ scanned documents (OCR تلقائي). Chunking ذكي يحافظ على البنية العربية والفقرات.

  • text-embedding-3-small

    النموذج الأمثل للـ embedding — توازن بين الدقة والتكلفة. 1536 بُعد لكل chunk، تكلفة منخفضة لكميات كبيرة.

  • Supabase pgvector + HNSW

    HNSW indexing للبحث السريع في ملايين الـ chunks. استعلام في <50ms حتى لو قاعدة المعرفة 500K+ وثيقة.

  • Re-ranking بـ Claude Haiku

    بعد الـ vector search، Haiku يُعيد ترتيب أفضل 10 نتائج — يُزيل التشابه السطحي ويُبقي الأكثر صلة فعلاً.

  • Citation + Source Tracking

    كل إجابة مُربوطة بالوثيقة الأصلية: اسم الملف، الصفحة، الفقرة. المستخدم يستطيع التحقّق فوراً.

  • ذاكرة حوار + Tools إضافية

    ليس فقط «سؤال/جواب» — الوكيل يتذكّر سياق الحوار ويستطيع استدعاء APIs إضافية (قاعدة بيانات، CRM) عند الحاجة.

كيف يعمل RAG من الوثيقة إلى الإجابة؟

  1. Document Ingest

    مراقبة Drive/Dropbox/S3 لوثائق جديدة. أي ملف جديد يُعالَج تلقائياً.

  2. Smart Chunking

    تقسيم يحترم البنية العربية — لا قطع في منتصف جملة، احترام العناوين والفقرات.

  3. Embedding

    text-embedding-3-small لكل chunk + metadata (ملف، صفحة، تاريخ).

  4. pgvector Storage

    حفظ في Supabase مع HNSW index. Upsert ذكي — الوثيقة المُحدَّثة تستبدل القديمة.

  5. Query Embedding

    سؤال المستخدم يُحوَّل إلى vector بنفس النموذج.

  6. Vector Search

    بحث HNSW في <50ms. استرجاع top 20-50 chunks مرشّحة.

  7. LLM Re-rank

    Claude Haiku يُعيد ترتيب الـ 20-50 إلى أفضل 5-10 للسياق النهائي.

  8. Answer + Citation

    Claude Sonnet يصيغ الإجابة مع ذكر المصدر. المستخدم يستطيع النقر للذهاب للوثيقة.

الأثر — على البحث عن المعرفة

جدول الأثر — المقاييس قبل وبعد تطبيق RAG
المقياس قبل بعد
وقت البحث عن معلومة 30 دقيقة - ساعات ثوانٍ
دقة الإجابة متفاوتة 85-95% مع مرجع
اعتماد على الخبير عنق ضيق موزَّع عبر الوكيل
تحديث المعرفة يدوي ومتقطّع تلقائي عند الرفع

أسئلة شائعة عن RAG

ما الفرق بين استخدام ChatGPT مباشرة و RAG الخاص بنا؟

ChatGPT لا يعرف وثائق شركتك. RAG يُغذّي النموذج بمعرفة مؤسستك الخاصة — نتيجة: إجابات دقيقة عن سياسات داخلية، منتجات حصرية، ملفات مشاريع. بل أهم: كل إجابة مع مرجع قابل للتحقّق.

كم وثيقة يستطيع النظام التعامل معها؟

لا حد فعلي. اختبرنا على 100K+ وثيقة (ملايين الـ chunks) — البحث يبقى تحت 50ms بفضل HNSW indexing. حجم قاعدة المعرفة المثالية: 1K - 1M وثيقة. لغير ذلك نُناقش أنماط تقسيم متقدّمة.

كيف تتعاملون مع الوثائق العربية (RTL، خطوط، أرقام)؟

Chunking خاص بالعربية (يحترم علامات الترقيم العربية والتفاف الجمل). Embedding يدعم العربية بجودة عالية. الـ LLM النهائي (Claude) يُجيب بالعربية الفصحى أو العامّية حسب سياق الوثائق.

ماذا لو الوثائق محمية بـ permissions؟ هل كل موظف يرى الكل؟

لا. نبني Access Control Layer: الوكيل يعرف مَن المستخدم قبل البحث، ويُفلتر الوثائق المسموحة له فقط. متوافق مع Google Workspace ACLs، Microsoft 365 Sharing، Supabase RLS.

ماذا عن الوثائق الممسوحة ضوئياً (PDF scan بلا نص)؟

نضيف طبقة OCR (GPT-4o Vision أو Google Cloud Vision) قبل الـ chunking. الـ scan → نص → chunks → embeddings. دقة OCR العربي عالية للمستندات الرسمية ومتوسطة للكتابة اليدوية.

كم تكلفة الاستعلام الواحد؟

متوسط $0.005-$0.02 للاستعلام الكامل (بحث + re-rank + توليد إجابة). الـ embedding للوثائق مرة واحدة ($0.02 لكل مليون token). شهرياً لمؤسسة متوسطة: $50-$200 حسب الحجم.

لديك مهام متكرّرة أو تأخذ وقتاً طويلاً؟

احجز جلسة مجانية (45 دقيقة). نخرج منها بتقدير واضح: هل الأتمتة تستحق الاستثمار، وكم ستوفر، وفي كم أسبوع.