داده کاوی DataMining
داده کاوی یک فرآیند محاسباتی برای کشف الگوهای پنهان و مفید در دیتاست های بزرگ است که ازآن در هوش مصنوعی، یادگیری ماشین، سیستم های اطلاعاتی و آمار استفاده می شود. در تعریف بالا منظور از دیتاست های بزرگ، تعداد و سایز و حجم داده ها نیست. دیتاست بزرگ یعنی تمام رویدادهای مرتبط با موضوع مورد نظر و همه عوامل موثر روی آن را رویداد را شامل شود. به عنوان مثال میتوانیم فروش کالای X را رویداد در نظر بگیریم که عوامل موثر روی آن شامل جنسیت مشتری، تحصیلات مشتری، مکان فروشگاه و … می باشد که دیتا ست ما باید از هر مدل رویداد به تعداد کافی داده داشته باشد. داده کاوی یکی از اجزای و مراحل هوش تجاری می باشد.
برای پیاده سازی فرآیند داده کاوی نیاز به ابزارهای داده کاوی می باشد که این ابزارها به دو دسته تقسیم می شوند. دسته اول ابزارهایی که با دیتابیس های آنلاین کار میکنند مانند ابزار اوراکل و مایکروسافت. دسته دوم ابزارهایی هستند که با دیتابیس های آفلاین کار می کنند مانند متلب.
به صورت کلی الگوریتم های داده کاوی به دو دسته تقسیم می شوند.
- الگوریتم های Descriptive
این الگوریتم ها که نتایج را بر حسب آن چه در گذشته و حال است برای ما به نمایش می کشند.
2. الگوریتم های Pridictive
الگوریتم هایی که پیش گویی و پیش بینی میکنند و این پیش بینی هیچ وقت قطعیت 100 در 100 ای ندارد.
یکی از ابزارهایی که برای پیاده سازی الگوریتم های DataMining وجود دارد ابزار مایکروسافت می باشد که در SSAS قابل دسترس و استفاده می باشد. در ابزار مایکروسافت، 9 الگریتم داده کاوی وجود دارد که به شرح زیر می باشند که از معروف ترین این الگوریتم ها می توان به Decision Tree و Clustering اشاره کرد.
مزایای استفاده از داده کاوی
از داده کاوی میتوان در حوزههای مختلفی از جمله بهداشت و درمان، درک بهتر رفتار مشتریان کسب و کارها، تجارت، بیمه، بانکداری و علوم مالی، جامعه شناسی، علوم مهندسی و به عبارتی هر حوزهای استفاده کرد. در مجموع میتوان گفت داده کاوی به مدیران کمک میکند تا در تصمیمگیریها هوشمندانهتر عمل کنند و با کاهش ریسک تصمیمات خود، منابع را به گونهای بهینهتر تخصیص دهند. از جمله مهمترین مزایای استفاده از دادهکاوی در تصمیمگیریها و سیاستگذاریها میتوان به موارد زیر اشاره کرد:
- فراهم شدن امکان پیش بینی وقایع و درک بهتر آینده
- افزایش کارایی و راندمان سازمان
- کمک به شناخت به موقع فرصت ها و تهدید ها
- جلوگیری از تصمیم گیریهای احساسی و کاهش ریسک تصمیمات
- کاهش هزینهها و جلوگیری از اتلاف منابع سازمانی