الوسم: تحميل البيانات

  • بدء الاستخدام مع ميلفوس و OpenAI للبحث عن الكتب

    في عالم الكتب المتزايد، قد تجد صعوبة في اكتشاف العنوان المناسب الذي يثير اهتمامك. لكن مع تقدم تقنيات الذكاء الاصطناعي، أصبح الأمر أسهل من أي وقت مضى. في هذا المقال، سنستعرض كيفية استخدام منصة “ملفوس” (Milvus) الشهيرة مع واجهة “OpenAI” لإنشاء تمثيلات نصية (embeddings) لوصف الكتب، وكيفية استخدام هذه التمثيلات للبحث عن كتب ذات صلة…

  • تشغيل استعلامات VSS الهجينة مع Redis و OpenAI

    في عالم البيانات الحديث، أصبحت القدرة على إجراء استعلامات فعالة وسريعة أمرًا حيويًا، خاصةً في مجالات مثل التجارة الإلكترونية. في هذا المقال، نستعرض كيفية تشغيل استعلامات مختلطة باستخدام قاعدة بيانات Redis مع تعبيرات OpenAI. سنقوم بتسليط الضوء على كيفية استخدام Redis كقاعدة بيانات متجهات، وكيفية دمج ميزات البحث التقليدي مع تقنيات البحث المستندة إلى استعلامات…

  • استخدام Typesense للبحث عن embeddings

    تعتبر قاعدة البيانات الشعاعية (Vector Database) واحدة من التطورات الحديثة في مجال تخزين وإدارة البيانات، حيث تتيح إمكانية البحث عن التضمينات (embeddings) بفعالية وسرعة كبيرة. في هذا المقال، سنتناول كيفية استخدام Typesense، وهو محرك بحث مفتوح المصدر يتمتع بالقدرة على تخزين واسترجاع البيانات الشعاعية، كمثال على هذه التقنية. سنستعرض خطوات عملية لتحميل البيانات، إنشاء التضمينات،…

  • استخدام Redis في بحث التضمين

    في عصر تتزايد فيه أهمية الذكاء الاصطناعي وتعلم الآلة، يصبح من الضروري إيجاد طرق فعالة لتخزين واسترجاع البيانات غير المنظمة. واحدة من التقنيات الجوهرية في هذا المجال هي قواعد بيانات المتجهات، التي تتيح للشركات معالجة وتحليل كميات ضخمة من البيانات بطريقة آمنة وقابلة للتوسع. يتناول مقالنا هذا استخدام “ريديس” كحل فعال للبحث عن المتجهات، حيث…

  • استخدام Chroma للبحث عن التضمينات

    في ظل التطورات السريعة في مجال الذكاء الاصطناعي وتحليل البيانات، أصبحت عملية البحث عن المعلومات من خلال قواعد البيانات المتجهة واحدة من أبرز التحديات والحلول المعاصرة. يتناول هذا المقال تقنية استخدام “Chroma” للبحث عن التضمينات (embeddings)، حيث نقدم دليلاً تفصيلياً يوضح كيفية تنزيل البيانات، وإجراء عمليات تضمين لها، ومن ثم فهرستها والبحث فيها عبر مجموعة…

  • نظام إجابة الأسئلة باستخدام Langchain وTair وOpenAI

    في عالم يتسارع فيه التطور التكنولوجي بشكل غير مسبوق، تبرز أنظمة الإجابة على الأسئلة كأحد أبرز الابتكارات التي تؤثر في كيفية تفاعلنا مع المعلومات. يهدف هذا المقال إلى استكشاف كيفية بناء نظام إجابة على الأسئلة باستخدام كل من Langchain و Tair و OpenAI، مما يعزز من الخبرات الذكية التي تقدمها هذه الأدوات المتطورة. سنغوص في…

  • استخدام Azure AI Search كقاعدة بيانات متجهة مع نماذج OpenAI

    في عالم يزداد تعقيدًا من حيث البيانات والمعلومات، يصبح من الضروري استخدام تقنيات حديثة لتحسين تجربة البحث والوصول إلى المعرفة. يتناول هذا المقال كيفية استخدام خدمة البحث السحابية “Azure AI Search” كقاعدة بيانات متجهية لتعزيز أداء نماذج OpenAI. سنستعرض خطوات عملية تمكّن المطورين من إعداد هذه الخدمات مع توفير الأدوات اللازمة لبناء تجارب بحث غنية…

  • استخراج وتحويل البيانات في سير عمل ELT باستخدام GPT-4o كبديل لـ OCR

    في عالم البيانات اليوم، يتمثل التحدي الأكبر في معالجة البيانات غير الهيكلية المتراكمة في تنسيقات صعبة الاستخدام مثل PDF وPPT وPNG. رغم القيمة الكبيرة لهذه البيانات، فإنها غالبًا ما تبقى غير مستغلة، وذلك بسبب الصعوبة في استخراج المعلومات منها. قدمت تقنيات التعرف الضوئي على الأحرف (OCR) التقليدية حلاً، لكنها تعاني من قيود عندما يتعلق الأمر…

  • بحث عن متجهات البيانات في Google Cloud BigQuery باستخدام Functions و GPT في ChatGPT

    تعتبر عمليات البحث عن البيانات من الأمور الحيوية في عالم اليوم الذي يتزايد فيه إنتاج المعلومات وتنوعها. في هذا السياق، يتناول المقال الحالي خطوة بخطوة كيفية استخدام منصة Google Cloud BigQuery كقاعدة بيانات تدعم البحث المبني على المتجهات، وكيفية دمج هذه القدرة مع وظائف Google Cloud وأدوات OpenAI مثل ChatGPT. سيوفر هذا الموضوع حلاً خاصًا…