




الملخص: نبحث عن مهندس تكامل بيانات موهوب لإدارة دورة حياة البيانات بالكامل، وتحويل بيانات السيارات غير المنظمة إلى قاعدة بيانات متدرجة بدقة لتشغيل ميزة بحث دقيقة. أبرز النقاط: 1. تحويل بيانات الويب الفوضوية إلى قاعدة بيانات نظيفة للغاية ومتدرجة بدقة. 2. تصميم وبناء خطوط أنابيب قوية لجمع بيانات الويب ومعالجتها. 3. تطوير عمليات متقدمة لتنظيف البيانات وتوحيدها وتطبيعها. **مهندس تكامل البيانات (البيانات والتكامل)** نبحث عن مهندس تكامل بيانات موهوب وشغوف للانضمام إلى فريقنا في البحرين. وبصفتك عالم بيانات لدينا، ستكون مسؤولًا عن دورة حياة البيانات بأكملها التي تُشغل منصتنا. ولن تقتصر مهامك على تحليل البيانات فقط، بل ستشارك بنشاط في جمعها وتنظيفها وهيكلتها. وتتمثل مهمتك في تحويل بيانات السيارات غير المنظمة والفوضوية الموجودة على الويب إلى قاعدة بيانات نظيفة للغاية ومتدرجة بدقة. وسيُسهم عملك مباشرةً في الميزة التنافسية الأساسية لمنصتنا: ميزة بحث قوية وبديهية ودقيقة تتيح للمستخدمين العثور على السيارة أو القطعة المطلوبة بدقة في كل مرة. **المهام الرئيسية** * **اكتساب البيانات:** تصميم وبناء وصيانة خطوط أنابيب قوية لجمع بيانات الويب لاستخراج كميات هائلة من البيانات المتعلقة بالمركبات والقطع والأسعار والمواصفات من مصادر إلكترونية متنوعة. * **خطوط أنابيب البيانات:** بناء وإدارة خطوط أنابيب بيانات قوية للبحث وتدريب النماذج والتحقق منها والاستنتاج منها، مع ضمان سلامة البيانات وكفاءتها. * **تقسيم البيانات وعملية الاستخراج والتحويل والتحميل (ETL):** وهذه هي جوهر هذه المهمة. تطوير وتنفيذ عمليات متقدمة لتنظيف البيانات وتوحيدها وتطبيعها. وعليك أن: * تتعامل مع بيانات النصوص الفوضوية وغير المنظمة وتُحلّلها. * تُحل التناقضات، وتزيل التكرارات، وتُكمِل القيم المفقودة. * **تُقسّم** البيانات عبر إنشاء تصنيفات واضحة وهياكل تسلسلية (مثل تصنيف القطع حسب الشركة المصنعة والطراز والسنة والنظام والتوافق). * **هندسة قواعد البيانات وميزة البحث:** * العمل بشكل وثيق مع فريق الهندسة لتصميم مخططات قواعد البيانات (SQL أو NoSQL) اللازمة لتخزين هذه البيانات المعقدة والمنظمة. * هندسة البيانات وتنظيمها خصيصًا لتشغيل محرك بحث عالي الأداء (مثل Elasticsearch). **الخبرة** * **الخبرة:** من سنتين إلى أربع سنوات أو أكثر من الخبرة العملية في هندسة البيانات ودمجها * **التقنيات الأساسية:** * إتقان قوي لـ **بايثون** وبيئتها الخاصة بالعلوم والهندسة في مجال البيانات (Pandas، NumPy). * خبرة مثبتة وواسعة في مكتبات وأطر عمل جمع بيانات الويب. * معرفة جيدة بـ TensorFlow أو PyTorch أو scikit\-learn. * **معالجة البيانات:** * مهارات استثنائية في تنظيف البيانات ومعالجتها. ويجب أن تكون على دراية تامة بالتعامل مع بيانات العالم الحقيقي الفوضوية. * فهم راسخ لتكنولوجيا قواعد البيانات، سواء كانت SQL أو NoSQL الموجهة للبحث (Postgres، MySQL). * خبرة عملية في بناء وضبط خوارزميات البحث باستخدام Elasticsearch. * خبرة في معالجة اللغة الطبيعية (NLP) لاستخراج معلومات منظمة من وصف النصوص. مكان العمل: عن بُعد


