الوسم: تحميل البيانات
-
استخدام Typesense للبحث عن embeddings
تعتبر قاعدة البيانات الشعاعية (Vector Database) واحدة من التطورات الحديثة في مجال تخزين وإدارة البيانات، حيث تتيح إمكانية البحث عن التضمينات (embeddings) بفعالية وسرعة كبيرة. في هذا المقال، سنتناول كيفية استخدام Typesense، وهو محرك بحث مفتوح المصدر يتمتع بالقدرة على تخزين واسترجاع البيانات الشعاعية، كمثال على هذه التقنية. سنستعرض خطوات عملية لتحميل البيانات، إنشاء التضمينات،…
-
استخدام Redis في بحث التضمين
في عصر تتزايد فيه أهمية الذكاء الاصطناعي وتعلم الآلة، يصبح من الضروري إيجاد طرق فعالة لتخزين واسترجاع البيانات غير المنظمة. واحدة من التقنيات الجوهرية في هذا المجال هي قواعد بيانات المتجهات، التي تتيح للشركات معالجة وتحليل كميات ضخمة من البيانات بطريقة آمنة وقابلة للتوسع. يتناول مقالنا هذا استخدام “ريديس” كحل فعال للبحث عن المتجهات، حيث…
-
نظام إجابة الأسئلة باستخدام Langchain وTair وOpenAI
في عالم يتسارع فيه التطور التكنولوجي بشكل غير مسبوق، تبرز أنظمة الإجابة على الأسئلة كأحد أبرز الابتكارات التي تؤثر في كيفية تفاعلنا مع المعلومات. يهدف هذا المقال إلى استكشاف كيفية بناء نظام إجابة على الأسئلة باستخدام كل من Langchain و Tair و OpenAI، مما يعزز من الخبرات الذكية التي تقدمها هذه الأدوات المتطورة. سنغوص في…
-
استخدام Azure AI Search كقاعدة بيانات متجهة مع نماذج OpenAI
في عالم يزداد تعقيدًا من حيث البيانات والمعلومات، يصبح من الضروري استخدام تقنيات حديثة لتحسين تجربة البحث والوصول إلى المعرفة. يتناول هذا المقال كيفية استخدام خدمة البحث السحابية “Azure AI Search” كقاعدة بيانات متجهية لتعزيز أداء نماذج OpenAI. سنستعرض خطوات عملية تمكّن المطورين من إعداد هذه الخدمات مع توفير الأدوات اللازمة لبناء تجارب بحث غنية…
-
استخراج وتحويل البيانات في سير عمل ELT باستخدام GPT-4o كبديل لـ OCR
في عالم البيانات اليوم، يتمثل التحدي الأكبر في معالجة البيانات غير الهيكلية المتراكمة في تنسيقات صعبة الاستخدام مثل PDF وPPT وPNG. رغم القيمة الكبيرة لهذه البيانات، فإنها غالبًا ما تبقى غير مستغلة، وذلك بسبب الصعوبة في استخراج المعلومات منها. قدمت تقنيات التعرف الضوئي على الأحرف (OCR) التقليدية حلاً، لكنها تعاني من قيود عندما يتعلق الأمر…