مرحله چهارم، دادهکاوی: در این مرحله از الگوریتمهای دادهکاوی برای ساخت مدل استفاده میشود. تعدادی از الگوریتمهای دادهکاوی در همین فصل توضیح داده شدهاند.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
مرحله پنجم، ارزیابی و بازنمایی: در این مرحله دقت هر الگوریتم ارزیابی میشود. بهعبارت دیگر تشخیص الگوهای صحیح مورد نظر، از سایر الگوها در این مرحله انجام میشود و صحت الگوها بر اساس معیارهایی سنجیده میشود.
مرحله ششم، دانش: دانش بهدست آمده از الگوریتمها به روشی که برای انسان قابل درک باشد، بیان میشود.
فرایند CRISP – DM [۳۵]
روشهای گوناگونی برای پیادهسازی و اجرای پروژههای دادهکاوی وجود دارد. استفاده از این روشها باعث میشود، دادهکاو مدیریت بهتری بر روی پروژه مورد بررسی خود داشته باشد. یکی از روشهای بسیار قوی و رایج در ادبیات دادهکاوی فرایند CRISP-DM است. این فرایند استانداردی جهانی برای انجام پروژههای کاربردی در دادهکاوی است که از شش فاز به صورت یک روند حلقهای تشکیل شده است. شکل ۲-۳ نحوه قرار گرفتن این شش فاز را در این مدل نمایش میدهد (شهرابی ۱۳۹۰a).
شکل ۲‑۳ : فرایند CRISP-DM
فاز اول – درک فضای کسب و کار[۳۶]
در این فاز تمرکز اصلی بر روی تعیین اهداف پروژه و نیازهای وابسته به آن است که از منظر کسب وکار مطرح میشود. در واقع در این فاز سعی میشود با توجه به نیازهای سازمان و خواستههای مورد انتظار از سازمان مسئلهای تعریف گردد. سپس مسئلهی تعریف شده به صورتی تبدیل میشود تا تکنیکهای دادهکاوی در آن قابل اجرا باشد. بهعبارت دیگر، برای اینکه دادهکاو فعالیت خود را آغاز کند، نیاز دارد با محیط و فرآیندها آشنا شود. هدف تحلیلگر کشف شاخص مهمی در آغاز پروژه است که میتواند در خروجی نهایی تأثیرگذار باشد. این فاز از چهار زیرفاز زیر تشکیل شده است:
-
- تعیین اهداف تجاری
-
- ارزیابی موقعیت
-
- تعیین اهداف پروژه دادهکاوی
-
- تهیه برنامه پروژه
فاز دوم – درک دادهها[۳۷]
مواد اولیه یک پروژه دادهکاوی دادهها هستند. این فاز با جمع آوری دادههای اولیه آغاز میشود. سپس به منظور دستیابی به یک درک اولیه از دادهها و شناسایی مشکلات تاثیرگذار بر روی کیفیت آنها پردازشهایی بر روی دادهها انجام میشود. پردازشهای انجام شده بر روی دادهها باعث میشود، یک فرضیه جالب از دادهها به منظور کشف اطلاعات پنهان شکل گیرد. این فاز از چهار مرحله تشکیل شده است که عبارتاند از:
-
- جمع آوری دادهها
-
- تشریح و توصیف دادهها
-
- کاوش دادهها
-
- اعتبارسنجی کیفیت دادهها
فاز سوم – آمادهسازی دادهها[۳۸]
تمام فعالیتهایی که باعث ساخت مدل از روی دادههای اولیه میشود، توسط این فاز پوشش داده میشود. این فاز طولانیترین مرحله در فرایند CRISP-DM است. ایجاد جدول، انتخاب ویژگی و رکوردها با توجه به هدف تعیین شده و همچنین تبدیل و تمیز کردن دادهها برای استفاده در مدل از جمله وظایفی است که در این فاز انجام میشود. این وظایف در قالب زیرفازهای زیر انجام میشود:
-
- انتخاب دادهها
-
- پاکسازی دادهها
-
- ساختاردهی دادهها
-
- یکپارچهسازی دادهها
-
- تنظیم فرمت دادهها
فاز چهارم – مدلسازی[۳۹]
هدف اصلی پروژه دادهکاوی این فاز است. در این فاز تکنیکهای مختلفی جهت آنالیز دادهها و استخراج دانش از آنها به کار گرفته میشود، سپس کاراترین مدل انتخاب میشود. در برخی از مواقع برای استفاده از الگوریتمی خاص در مدلسازی، لازم است شکل داده تغییر پیدا کند. در نتیجه این فاز با فاز آمادهسازی دادهها در ارتباط است. این فاز از چهار زیرفاز زیر تشکیل شده است:
-
- انتخاب تکنیکهای ساخت مدل
-
- طراحی آزمایشها
-
- ساخت مدل
-
- ارزیابی مدل
فاز پنجم – ارزیابی [۴۰]
پس از انتخاب مدل، در این فاز به بررسی و ارزیابی این موضوع پرداخته میشود که آیا نتایج آنالیز دادهها ما را در رسیدن به اهداف کسب و کار یاری میکنند؟ در این فاز، دانش بهدست آمده در فاز چهار مورد تجزیه و تحلیل قرار میگیرد تا میزان سودمندی و کاربرد آن مشخص شود. بهعنوان مثال در مورد مدلهای پیشبینی کننده، دقت مدل با بهره گرفتن از دادههای آزمون تعیین میشود تا در صورت تایید نتایج حاصل بهکار گرفته شود. در پایان این فاز تصمیمی در رابطه با بهره گرفتن از نتایج دادهکاوی گرفته میشود. مراحل این فاز عبارتند از:
-
- ارزیابی نتایج
-
- مرور فرایند دادهکاوی
-
- تعیین گامهای بعدی
فاز ششم – توسعه [۴۱]
در این فاز سود حاصل از سرمایهگذاری انجام شده در مراحل قبلی بهدست میآید. تمرکز این فاز روی یکپارچهسازی دانش در فرآیندهای کسب و کار است بهگونهای که مسائل اساسی کسب و کار حل شود. با این حال، این فاز میتواند به سادگی تهیه یک گزارش ساده و یا به پیچیدگی تکرار اجرای فرایند دادهکاوی در گستره سازمان باشد. در بیشتر موارد این مشتری است که گامهای این فاز را انجام میدهد و البته برای مشتری مهم است که بداند که چه اقداماتی در جهت به اجرا درآوردن مدلهای ایجاد شده انجام دهد. این فاز از چهار مرحله تشکیل شده است که عبارت است از: