مقدمه ای بر داده کاوی
در این بخش جزوه مقدمه ای بر داده کاوی از احسان زنجانی را برای دانلود رایگان قرار داده ایم که به صورت فایل PDF در 25 صفحه تهیه شده و متناسب با درس مبانی داده کاوی در مقطع کارشناسی برای رشته مهندسی کامپیوتر است. در ادامه به معرفی این درس پرداخته و فهرست مطالب جزوه به همراه لینک دانلود رایگان قرار داده شده است.
داده کاوی (Data Mining)
با زیاد شدن حجم داده های دیجیتال، مدیریت داده ها اهمیت زیادی پیدا کرده است. کاوش در این حجم وسیع از داده ها امکان استفاده هوشمندانه از حجم زیاد داده ها را فراهم می کند. داده کاوی همچون هر کاوش دیگری به دنبال گنجی است که از چشم نهان است. داده کاوی به عنوان رویکرد کشف دانش، در دریای داده ها می کاود تا مروارید ذیقیمت دانش را به چنگ آورد. هرچند داده کاوی به شکل نوین خود شاخه جدیدی در حوزه علوم دانشگاهی محسوب می شود ولی برخی از روش ها و ابزار های آن دارای سابقه بسیار دیرینه ای هستند.
درس مبانی داده کاوی
درس مبانی داده کاوی در مقطع کارشناسی رشته مهندسی کامپیوتر وجود دارد که هدف این درس آشنا کردن دانشجویان با مباحث پایه ای در کاوش حجم وسیع داده ها و کشف الگوهای جالب موجود در آنها می باشد. در این درس نخست مفاهیم پیش پردازش داده ها مورد بحث قرار می گیرد و سپس مباحث پایگاه داده تحلیلی و گزارش گیری تحلیلی کشف الگورهای مکرر، الگوریتم های خوشه بندی و رده بندی و الگوریتم های پایه ای هر زمینه با جزئیات بررسی می شود.
از دانشجویانی که این درس را با موفقیت پشت سر بگذارند بینش مناسبی در موارد زیر خواهند داشت:
- چالش های مدیریت حجم زیاد داده ها
- پیش پردازش و آماده سازی داده ها شامل پاکسازی داده ها، خلاصه سازی توصیفی داده ها و تجمیع داده ها
- طراحی و استفاده از پایگاه داده تحلیلی
- تحلیل نیاز کاربر و انتخاب روش داده کاوی مناسب برای یک مساله
- به کار بردن روش های داده کاوی در حل مساله های واقعی
فهرست مطالب جزوه
بخش اول: مقدمه ای بر داده کاوی
- چه چیزی سبب پیدایش داده کاوی شده است ؟
- مراحل کشف دانش
- جایگاه داده کاوی در میان علوم مختلف
- داده کاوی چه کارهایی نمی تواند انجام دهد ؟
- داده کاوی و انبار داده ها
- داده کاوی و OLAP
- کاربرد یادگیری ماشین و آمار در داده کاوی
بخش دوم: توصیف داده ها در داده کاوی
- خلاصه سازی و به تصویر در آوردن داده ها
- خوشه بندی
- تحلیل لینک
بخش سوم: مدل های پیش بینی داده ها
- Classification
- Regression
- Time series
بخش چهارم: مدل ها و الگوریتم های داده کاوی
- شبکه های عصبی
- Decision trees
- Multivariate Adaptive Regression Splines (MARS)
- Rule induction
- K-nearest neibour and memory-based reansoning (MBR)
- رگرسیون منطقی
- تحلیل تفکیکی
- مدل افزودنی کلی (GAM)
- Boosting
هیچ نظری ثبت نشده است