خدمة 5.4 · Agentic AI

معرفة مؤسستك، في يد وكيل

وكلاء يُجيبون من وثائقك — لا يُهلوسون. كل إجابة مع مرجع. PDF، Word، Drive — إلى قرار في ثوانٍ.

TL;DR — وكلاء يُجيبون بدقة من وثائق مؤسستك — لا يُهلوسون ولا يخترعون. pgvector + HNSW للبحث السريع، text-embedding-3-small للدقة، Re-rank بـ Haiku للاستهداف، Citation لكل إجابة. من PDF للقرار في ثوانٍ.

ما الفرق بين LLM عادي و RAG؟

ChatGPT لا يعرف وثائق شركتك. RAG يُغذّيه بمعرفة مؤسستك قبل كل إجابة — بدقة ومرجع.

جدول مقارنة بين LLM عادي و RAG
الجانب	LLM عادي	RAG (نحن)
مصدر المعرفة	ما تدرّب عليه النموذج	وثائق المؤسسة الحقيقية
الحداثة	قديمة (تاريخ التدريب)	لحظيّة — أي وثيقة جديدة
الخصوصية	عامّة — يراها الجميع	خاصة بالمؤسسة وحدها
الهلوسة	تحدث كثيراً	مرتكزة بمصادر مُستشهَد بها
التحقّق	صعب	مرجع لكل إجابة (source citation)
اللغة العربية	محدودة المعرفة	معرفة عربية كاملة (من وثائقك)

ما الاستخدامات الفعلية؟

مساعد داخلي للموظفين
عمليات

RAG داخلي

الموظف يسأل عن سياسة داخلية، إجازة، سلم رواتب — الوكيل يُجيب من دليل الشركة.

النتيجة: تقليل أسئلة HR 60%.
دعم عملاء معرفي
خدمة عملاء

RAG + Conversational

العميل يسأل عن منتج — الوكيل يستخرج الإجابة من الكتالوج، دليل الاستخدام، أو قاعدة أخطاء.

النتيجة: معدل رضا أعلى، تحويل أقل للبشر.
بحث قانوني/تقني
قانوني/هندسي

RAG بدقة عالية

محامٍ أو مهندس يبحث في ملفات مشاريع سابقة — الوكيل يُعيد سياق كامل مع المرجع.

النتيجة: بحث ساعات → دقائق.

ما القدرات التقنية الأساسية؟

استيعاب كل أنواع الوثائق

PDF، Word، Markdown، Google Docs، HTML، حتى الـ scanned documents (OCR تلقائي). Chunking ذكي يحافظ على البنية العربية والفقرات.
text-embedding-3-small

النموذج الأمثل للـ embedding — توازن بين الدقة والتكلفة. 1536 بُعد لكل chunk، تكلفة منخفضة لكميات كبيرة.
Supabase pgvector + HNSW

HNSW indexing للبحث السريع في ملايين الـ chunks. استعلام في <50ms حتى لو قاعدة المعرفة 500K+ وثيقة.
Re-ranking بـ Claude Haiku

بعد الـ vector search، Haiku يُعيد ترتيب أفضل 10 نتائج — يُزيل التشابه السطحي ويُبقي الأكثر صلة فعلاً.
Citation + Source Tracking

كل إجابة مُربوطة بالوثيقة الأصلية: اسم الملف، الصفحة، الفقرة. المستخدم يستطيع التحقّق فوراً.
ذاكرة حوار + Tools إضافية

ليس فقط «سؤال/جواب» — الوكيل يتذكّر سياق الحوار ويستطيع استدعاء APIs إضافية (قاعدة بيانات، CRM) عند الحاجة.

كيف يعمل RAG من الوثيقة إلى الإجابة؟

Document Ingest

مراقبة Drive/Dropbox/S3 لوثائق جديدة. أي ملف جديد يُعالَج تلقائياً.
Smart Chunking

تقسيم يحترم البنية العربية — لا قطع في منتصف جملة، احترام العناوين والفقرات.
Embedding

text-embedding-3-small لكل chunk + metadata (ملف، صفحة، تاريخ).
pgvector Storage

حفظ في Supabase مع HNSW index. Upsert ذكي — الوثيقة المُحدَّثة تستبدل القديمة.
Query Embedding

سؤال المستخدم يُحوَّل إلى vector بنفس النموذج.
Vector Search

بحث HNSW في <50ms. استرجاع top 20-50 chunks مرشّحة.
LLM Re-rank

Claude Haiku يُعيد ترتيب الـ 20-50 إلى أفضل 5-10 للسياق النهائي.
Answer + Citation

Claude Sonnet يصيغ الإجابة مع ذكر المصدر. المستخدم يستطيع النقر للذهاب للوثيقة.

الأثر — على البحث عن المعرفة

جدول الأثر — المقاييس قبل وبعد تطبيق RAG
المقياس	قبل	بعد
وقت البحث عن معلومة	30 دقيقة - ساعات	ثوانٍ
دقة الإجابة	متفاوتة	85-95% مع مرجع
اعتماد على الخبير	عنق ضيق	موزَّع عبر الوكيل
تحديث المعرفة	يدوي ومتقطّع	تلقائي عند الرفع

أسئلة شائعة عن RAG

ما الفرق بين استخدام ChatGPT مباشرة و RAG الخاص بنا؟

ChatGPT لا يعرف وثائق شركتك. RAG يُغذّي النموذج بمعرفة مؤسستك الخاصة — نتيجة: إجابات دقيقة عن سياسات داخلية، منتجات حصرية، ملفات مشاريع. بل أهم: كل إجابة مع مرجع قابل للتحقّق.

كم وثيقة يستطيع النظام التعامل معها؟

لا حد فعلي. اختبرنا على 100K+ وثيقة (ملايين الـ chunks) — البحث يبقى تحت 50ms بفضل HNSW indexing. حجم قاعدة المعرفة المثالية: 1K - 1M وثيقة. لغير ذلك نُناقش أنماط تقسيم متقدّمة.

كيف تتعاملون مع الوثائق العربية (RTL، خطوط، أرقام)؟

Chunking خاص بالعربية (يحترم علامات الترقيم العربية والتفاف الجمل). Embedding يدعم العربية بجودة عالية. الـ LLM النهائي (Claude) يُجيب بالعربية الفصحى أو العامّية حسب سياق الوثائق.

ماذا لو الوثائق محمية بـ permissions؟ هل كل موظف يرى الكل؟

لا. نبني Access Control Layer: الوكيل يعرف مَن المستخدم قبل البحث، ويُفلتر الوثائق المسموحة له فقط. متوافق مع Google Workspace ACLs، Microsoft 365 Sharing، Supabase RLS.

ماذا عن الوثائق الممسوحة ضوئياً (PDF scan بلا نص)؟

نضيف طبقة OCR (GPT-4o Vision أو Google Cloud Vision) قبل الـ chunking. الـ scan → نص → chunks → embeddings. دقة OCR العربي عالية للمستندات الرسمية ومتوسطة للكتابة اليدوية.

كم تكلفة الاستعلام الواحد؟

متوسط $0.005-$0.02 للاستعلام الكامل (بحث + re-rank + توليد إجابة). الـ embedding للوثائق مرة واحدة ($0.02 لكل مليون token). شهرياً لمؤسسة متوسطة: $50-$200 حسب الحجم.

لديك مهام متكرّرة أو تأخذ وقتاً طويلاً؟

احجز جلسة مجانية (45 دقيقة). نخرج منها بتقدير واضح: هل الأتمتة تستحق الاستثمار، وكم ستوفر، وفي كم أسبوع.

احجز جلسة استعرض أعمالنا

ملخّص تنفيذي

ما الفرق بين LLM عادي و RAG؟

ما الاستخدامات الفعلية؟

مساعد داخلي للموظفين

دعم عملاء معرفي

بحث قانوني/تقني

ما القدرات التقنية الأساسية؟

استيعاب كل أنواع الوثائق

text-embedding-3-small

Supabase pgvector + HNSW

Re-ranking بـ Claude Haiku

Citation + Source Tracking

ذاكرة حوار + Tools إضافية

كيف يعمل RAG من الوثيقة إلى الإجابة؟

Document Ingest

Smart Chunking

Embedding

pgvector Storage

Query Embedding

Vector Search

LLM Re-rank

Answer + Citation