البيانات الضخمة لعلم البيانات

Online | Self-paced | Start Anytime
Intermediate
Early Access

About the Course

هل لديك فضول بشأن الحوسبة السحابية والبيانات الضخمة؟ تعد دورة البيانات الضخمة لعلوم البيانات هي الحل الأمثل. في هذه الدورة، ستستكشف أدوات Amazon Web Services (AWS) الأساسية وSpark، وتتعلم كيفية إنشاء مشروع بيانات شامل وإدارته. بحلول نهاية الدورة، ستكون مجهزًا جيدًا لمواجهة تحديات الحوسبة السحابية ومستعدًا لمتابعة الوظائف في مجال البيانات الضخمة.

Curriculum

  • الوحدة 1: مقدمة إلى AWS EC2 (Amazon Elastic Compute Cloud)
    وصف

    ملخص:

    ستعرّف هذه الوحدة المشاركين على النظام البيئي لـ AWS وإحدى الخدمات الأساسية المعروفة باسم EC2.

    المواضيع التي يجب تغطيتها:

    • لماذا الحوسبة السحابية؟
    • ما هي خدمات أمازون ويب (AWS)؟
    • بيانات اعتماد الإعداد لـ EC2
    • إنشاء مثيل EC2 والاتصال به
  • الوحدة 2: AWS S3 (خدمة تخزين بسيطة)
    وصف

    ملخص:

    تغطي هذه الوحدة خدمة التخزين الأساسية لـ AWS والمعروفة باسم S3.

    المواضيع التي يجب تغطيتها:

    • إنشاء دلاء S3
    • افهم القيود المفروضة على مستودعات S3
    • يمكنك الاتصال بمجموعات S3 والعمل معها من خلال AWSCLI
  • الوحدة 3: AWS Kinesis & Firehose
    وصف

    ملخص:

    تختبر هذه الوحدة قوة الحركة وتدفق البيانات.

    المواضيع التي يجب تغطيتها:

    • ما هو تدفق البيانات؟
    • فهم Kinesis Firehose
    • العمل مع Kinesis Firehose من خلال boto3
    • استخدام بيانات العينة لمحاكاة تجريف وسائل التواصل الاجتماعي

  • الوحدة 4: EMR (Hadoop & Hive)
    وصف

    ملخص:

    تركز هذه الوحدة على استخدام البيانات الضخمة والحوسبة الموزعة.

    المواضيع التي يجب تغطيتها:

    • ما هي البيانات الضخمة؟
    • ما هي الحوسبة الموزعة؟
    • فهم طريقة عمل الكتلة
    • العمل مع EMR من خلال AWS CLI

  • الوحدة 5: مقدمة إلى Apache Spark وDatabricks
    وصف

    ملخص:

    تعلم هذه الوحدة المشاركين لغة Spark واستخدام Databricks.

    المواضيع التي يجب تغطيتها:

    • إنشاء حساب Databricks لإصدار المجتمع
    • افحص أوجه التشابه بين Spark وEMR
    • فهم هياكل سبارك
    • العمل مع استعلامات Spark الأساسية

  • الوحدة 6: شرارة إطار البيانات
    وصف

    ملخص:

    تتناول هذه الوحدة تطبيق Spark من خلال Spark DataFrame.

    المواضيع التي يجب تغطيتها:

    • هياكل ووظائف DataFrame
    • إنشاء الوظائف الأساسية والعمل بها في Spark DataFrame
    • فهم الوظائف المضمنة المختلفة

  • الوحدة 7: Databricks شرارة التعلم الآلي
    وصف

    ملخص:

    تعلم هذه الوحدة المشاركين كيفية العمل باستخدام Spark Machine Learning.

    المواضيع التي يجب تغطيتها:

    • ما هو سبارك للتعلم الآلي؟
    • استخدام مثال لنموذج اللغة في Spark ML
    • عملية البرمجة اللغوية العصبية في Spark ML

  • الوحدة 8: أوس سيج ميكر
    وصف

    ملخص:

    تركز هذه الوحدة على استخدام SageMaker في AWS.

    الموضوع المراد تغطيته:

    • ما هو سيج ميكر؟
    • إنشاء واستخدام SageMaker
    • تطبيقات سيج ميكر
    • نشر نماذج ML باستخدام SageMaker

  • الوحدة 9: AWS Boto3 وأثينا & نظرة سريعة
    وصف

    ملخص:

    تعلم هذه الوحدة النهائية المشاركين كيفية استخدام boto3 للاتصال بخدمات AWS من خلال Python. يركز أيضًا على Athena لتنظيم البيانات وQuicksight كلوحة تحكم في الوقت الفعلي.

    الموضوع المراد تغطيته:

    • ما هي أثينا وQuicksight؟
    • ربط البيانات من دلو S3 إلى Athena ثم إلى Quicksight
    • إعداد خط أنابيب لتدفق البيانات
    • العمل مع مثيلات EC2 ومستودعات S3 من خلال Boto3

Learning Outcomes

بنهاية هذه الدورة سيكون المشاركون قادرين على:

  • اشرح المبادئ الأساسية للحوسبة السحابية ووصف خدمات AWS الأساسية للحوسبة والتخزين وتدفق البيانات والتعلم الآلي.
  • قم بإعداد مثيلات AWS EC2 وتكوينها وإدارتها لتشغيل تطبيقات سحابية مرنة وقابلة للتطوير.
  • قم بإنشاء مجموعات S3 وإدارتها لتخزين البيانات بكفاءة، والتفاعل معها باستخدام AWSCLI لعمليات الملفات.
  • قم بتنفيذ خطوط تدفق البيانات في الوقت الفعلي باستخدام Kinesis Firehose ومعالجة البيانات برمجيًا باستخدام مكتبة Python boto3.
  • استخدم Spark وEMR لمعالجة مجموعات البيانات الكبيرة وتحليلها من خلال الحوسبة الموزعة، وعمليات البيانات باستخدام Spark DataFrames.
  • قم بتطوير نماذج التعلم الآلي وتدريبها ونشرها باستخدام AWS SageMaker، وتطبيقها في سيناريوهات العالم الحقيقي.
  • استخدم خدمات AWS مثل Athena وQuicksight وBoto3 لإنشاء مسارات بيانات شاملة تتيح الاستعلام عن البيانات وتحليلها وتصورها

Tools

أوس
مثيلات EC2
دلاء AWS S3
أوس إي إم آر
صانع الحكيم
أوس أثينا
AWS كويك سايت
طوب البيانات
شرارة
بايثون
SQL
لينكس
كوكب المشتري

HOW IT WORKS

Upgrade your skills with our short courses

Ranked #1 Data Training Program

4.9/5
4.96/5
4.95/5
4.95/5
student success

What our graduates are saying

OUR ALUMNI ARE WORKING AT
Recommended if you're interested in البيانات الضخمة لعلم البيانات
Learning Track

مسار هندسة البيانات الضخمة

Learning Track

مسار مهندس السحابة

Learning Track

المسار الهندسي التحليلي

Learning Track

المسار الهندسي للذكاء الاصطناعي

Short Course

ترحيل البيانات

Short Course

أتمتة الذكاء الاصطناعي وتقنية RPA

Short Course

لغة بايثون المتقدمة

Short Course

أزور الأساسية

Career Track to Advance Your Career

Join our comprehensive career tracks designed to accelerate your professional growth and help you achieve your goals

Unlock Your Potential with Expert Guidance

Our mentorship services provide personalized support and insights from industry experts to help you navigate your career journey with confidence

Empower Your Workforce

Enhance your team’s skills and productivity with our tailored corporate training courses, designed to meet your organization’s unique needs

FAQ

Frequently asked questions about the course

The course is structured into weekly modules, each containing video lectures, reading materials, assignments, and quizzes. You can complete the modules at your own pace, but we recommend following the weekly schedule to stay on track.

You can get support in multiple ways:

  • TA Support on Slack: Our teaching assistants are available on Slack to answer your questions and provide guidance.
  • Peer Community on Discord: Join our Discord community to discuss course topics, share ideas, and collaborate with fellow students.

TAs are available on Slack from 9 AM to 6 PM (ET) Monday to Friday. Outside these hours, you can still post your questions, and TAs will respond as soon as they are back online.

After enrolling in the course, you will receive an invitation link to join the Discord community. Follow the link to create an account or log in to your existing account.

The Discord community offers peer-to-peer support, where you can discuss course topics, share resources, collaborate on projects, and network with fellow learners

The optional mentoring service includes one-on-one sessions with an experienced mentor who can provide personalized guidance, feedback on your progress, and help you set and achieve your learning goals.

Please talk to our Program Advisors to sign up for Mentorship services for an additional cost

Yes, you will have lifetime access to the course materials, including any updates made to the content in the future.

We accept all major credit cards, PayPal, and bank transfers. You can choose your preferred payment method at checkout

Ready to kick start your career

Contact our advisors now to learn more about our programs and courses. They are here to answer all your questions and help you embark on a successful journey.

Inquire about our programs
Speak to our advisors

يشير "*" إلى الحقول المطلوبة

اسم*
This field is for validation purposes and should be left unchanged.
View our البيانات الضخمة لعلم البيانات course package
This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.