ترجمه مقاله ensemble مبتنی بر تحلیل پوششی داده ها
ترجمه مقاله Ensemble Based on Data Envelopment Analysis
در این پست ترجمه مقاله ensemble مبتنی بر تحلیل پوششی داده ها را برای شما دوستان آماده کردیم که علاوه بر چکیده و مقدمه می توانید خود مقاله اصلی را نیز به طور کاملا رایگان دانلود بفرمایید.
چکیده مقاله
تحقیقات زیادی به منظور ارزیابی کارآیی روش های مختلف ترکیب / ادغام انجام شده است. اگرچه، هنگام ترکیب طبقه بندی کننده بصورت فردی برای همجوشی و یا اهداف گروه، به طور معمول تنها نرخ اشکال در طبقه بندی به عنوان یک اندازه گیری عملکرد در نظر گرفته می شود. این ممکن است خطرناک باشد، به ویژه هنگامی که کلاس توزیع اریب است و یا زمانی هزینه های مرتبط با هر دو نوع خطا های I و II بطور قابل توجهی متفاوت از یکدیگر هستند. برای این نوع از وضعیت، در نظر گرفتن معیار های عملکرد اضافی مانند حساسیت، وضوح، خطا های منفی و یا مثبت غلط مورد نیاز است. در این مقاله، ما استفاده از DEA در جهت پیدا کردن وزن درگیر در چند ویژگی که هر یک از طبقه بندی کننده به عنوان یک عنصر از یک الگوریتم گروه داده ها است را پیشنهاد می دهیم. این الگوریتم انتظار می رود که در اهداف کلی طبقه بندی خدمت کند.
مقدمه
داده کاوی فرآیند استخراج اطلاعات معتبر، ناشناخته، و در نهایت اطلاعات قابل فهم از پایگاه داده های بزرگ است. و استفاده از آن برای تصمیم گیری کسب و کار بسیار مهم است. کاوش موثر اطلاعات لازم و دانش را از یک پایگاه داده بزرگ به عنوان یک موضوع کلیدی تحقیق توسط بسیاری از شاغلین در زمینه بازاریابی مبتنی بر داده شناخته شده است. الگوریتم هایی که اغلب برای داده کاوی استفاده می شوند را می توان به یکی از زمینه های زیر است طبقه بندی کرد: شبکه عصبی مصنوعی، یادگیری ماشین، و مدل های آماری کلاسیک. گزارش شده است که دقت طبقه بندی الگوریتم فردی را می توان با ترکیب نتایج حاصل از چند طبقه بندی کننده بهبود داد. تکنیک های ترکیب داده سعی به ترکیب نتایج طبقه بندی به دست آمده از چند طبقه بندی کننده تک و شناخته شده به منظور بهبود دقت طبقه بندی زمانی که برخی از نتایج حاصل از ترکیب طبقه بندی کننده های نسبتا نا همبسته باشند، است.
چکیده مقاله
There has been much research to evaluate the efficiency of various data fusion/ensemble approaches. However, when combining individual classifiers for fusion or ensemble purposes, typically only misclassification rate has been considered as a performance measure. This might be risky especially when the class distribution is skewed or when the costs associated with both Type I and II errors are significantly different from each other. For this kind of situation, consideration of additional performance measures such as sensitivity, specificity, false negative or positive errors are needed. In this paper, we propose to use DEA in order to find the weights involved in multi-attributes performances of each classifier as an element of a data ensemble algorithm. This algorithm is expected to serve general purposes of classification.
مشاهده ویدئو در این باره