آموزش استفاده از R برای داده ها بزرگ با اسپارک (Spark)
در این بخش فیلم آموزش استفاده از R برای داده ها بزرگ (Big Data) با خوشه های اسپارک (Spark) را به زبان انگلیسی آماده کرده ایم که در قالب 6 بخش و 19 قسمت در مدت 2 ساعت و 18 دقیقه تهیه شده است. مدرس این دوره مدرس این دوره آقای مانوئل آماناتگی (Manuel Amunategui) است که یک متخصص علوم داده، مشاور، معلم و نویسنده با تجربه بالا در زمینه علوم داده می باشد.
معرفی دوره
در این دوره آموزشی R ، علاقه مندان و افرادی که تحلیلگر داده هستند و با زبان R نیز آشنایی دارند، با استفاده از توان اسپارک (Spark) ، محاسبات توزیع شده و همینطور ذخیره سازی ابر را یا می گیرند. این دوره آموزشی، چگونگی بکارگیری مهارت هایی که در زبان R دارید را در یک محیط داده عظیم را نشان می دهد.
در این دوره آموزشی R شما می آموزید که چگونه خوشه های اسپارک (Spark) را در چارچوب سرویس های تحت وب آمازون (AWS) ایجاد نمائید. همچنین مدل سازی بر مبنای خوشه بندی داده ها را بوسیله مدل های خطی تعمیم یافته گاوس، مدل های خطی تعمیم پذیری دو جانبه، بیز ساده (Naive Bayes) و مدل سازی کی میانگین (K-means)، دسترسی به داده ها بوسیله دیتا فریم های سرویس S3 Spark و دیگر فرمت ها همچون CSV ، Json و HDFS و انجام عملیات دستکاری با داده های مبتنی بر خوشه با استفاده از ابزار هایی نظیر Spark R و Spark SQL را می آموزید. شما با گذراندن این دوره می توانید با مجموعه داده ها بزرگ (Big Data) کار کنید که در یک کامپیوتر مجزا و شخصی امکان پذیر نیست.
فهرست سرفصل های آموزش استفاده از R برای داده ها بزرگ (Big Data)
مقدمه
- معرفی دوره
- درباره مدرس
ایجاد خوشه و بررسی سرویس های وب آمازون
- نحوه ایجاد یک AWS Launching instances
- اتصال به نمونه AWS با استفاده از SSH
- اتصال به نمونه AWS با استفاده از PuTTY
- شروع کار با خوشه های اسپارک – بخش اول
- شروع کار با خوشه های اسپارک – بخش دوم
- خاتمه دادن به خوشه ها
مبانی داده ها و مدل سازی
- مبانی داده ها
- مدل سازی با مدل های خطی تعمیم یافته گاوس
- مدل سازی با مدل های خطی تعمیم پذیری دو جانبه
- بیز ساده و مدل سازی K-Means
منابع داده ها و دستکاری داده ها
- داده های بزرگ تر و S3
- دسترسی به دیتا فریم های S3 Spark
- عملیات دیتا فریم Spark R
- ماژول Spark SQL
فرمت HDFS و چارچوب Databricks
- بررسی اجمالی فرمت HDFS
- بررسی اجمالی چارچوب Databricks نسخه Community
نتیجه گیری
- جمع بندی مطالب ارائه شده
هیچ نظری ثبت نشده است