تفاوت آمار و داده کاوی

تفاوت آمار و داده کاوی

پستتوسط rahele » 1391-شهريور ماه -11GMT16:16:38+00:00

تفاوت آمار و داده کاوی

قابلیت تعمیم نتایج عمومی یکی از مشخصه های متمایز کننده داده کاوی و تحلیل آماری است. از آنجائیکه روشهای مرسوم تحلیل آماری در رابطه با تحلیل داده های اولیه ای است که در ارتباط با فرضیه تحقیقاتی ویژه ای جمع آوری شده اند، داده کاوی میتواند در ارتباط با داده های ثانویه ای که به دلایل مختلف جمع آوری شده است، باشد. به عنوان مثال داده هایی که در یک انبار داده جمع آوری شده اند.
علاوه بر این، داده های آماری میتوانند داده های حاصل از آزمایشهای مختلف باشد (مانند نتایج یک آزمایش که به طور تصادفی در رفتارهای مختلف به همه واحدهای آماری تخصیص داده میشوند)، اما در داده کاوی داده ها بیشتر مشاهده ای میباشد.

یک رویکرد دیگر برای بیان تفاوت تحلیلهای آماری با داده کاوی، موضوع تحلیل بالا به پایین (Top-Down) و پایین به بالا (Bottom-up) است. روش بالا به پایین یا روش تحلیلی تأیید کننده (Confirmative)، نوعی تأیید و تصدیق کردن فرضیه هاست و سعی در گسترش آگاهی در مورد یک پدیده ی ویژه دارد. در روشهای آماری سعی میشود با استفاده از تحلیلهایی که مربوط به آمار هستند، روابطی را که از قبل در بین داده ها وجود داشته، تأیید نمایند. در حالی که در داده کاوی که نوعی از تحلیل پایین به بالا یا تحلیل مکاشفه ای (Explorative) است سعی در یافتن اطلاعات مفید از اطلاعات قبلی که مورد توجه نبوده  اند، دارد. هدف از جستجو در داده ها در داده کاوی ، بررسی ارتباط بین آنها و ایجاد نتایج و نظریه های جدید است. نتایج به دست آمده از تحلیل پایین به بالا سعی در معرفی ارتباط بین داده ها دارد ولی نمیتواند در مورد علت مفید بودن این کشفیات و میزان ارزشمندی آنها توضیح دهد. تحلیلهای بالا به پایین که به عنوان ابزارهای تایید کننده شناخته میشوند، در تایید  کشفیات و ارزیابی کیفیت تصمیم گیریهای مبتنی بر این کشفیات مورد استفاده قرار میگیرند.

از جنبه دیگر میتوان سه فرق اساسی را بین داده کاوی و تحلیل های آماری قائل شد:

1- داده کاوی حجم بسیار زیادی از داده ها را تحلیل میکند. به علت محدودیت منابع رایانه ای، در یک لحظه نمیتوان به همه داده ها دسترسی داشت تا بتوان تحلیلهای آماری روی آنها انجام داد.

2- ساختار داده ها در بسیاری از موارد به صورت مرسوم و رده ای ذخیره نشده است (مانند داده های موجود در اینترنت). بنابراین، روشهای تحلیل آماری در این نوع داده ها ضعف دارند.

3- نتایج حاصل از داده کاوی، کم و بیش باید مفید و نتیجه بخش باشند. این موضوع موجب میشود تا رویکرد اساسی در داده کاوی به سمت تجاری بودن آن باشد.
کاش دستان خدا پیدا بود!
تا در آن وقت که بیحوصله و تنهایی
و دلت از غم دنیا مملو،
بزنی تکیه بر آن
و بخندی به همه رنج جهان...

برای نویسنده این مطلب rahele تشکر کننده ها:
Maryam-Mohammadian (1391-بهمن ماه -6GMT13:57:05+00:00)
رتبه: 9.09%
 
نماد کاربر
rahele
کاربر جدید
کاربر جدید
 
پست ها : 9
تاريخ عضويت: 1391-مرداد ماه -12GMT00:00:00+00:00
تشکر کرده: 60 بار
تشکر شده: 19 بار
تشکر کرده: 60 بار
تشکر شده: 19 بار
امتياز: 4225

برای نویسنده این مطلب rahele:
Maryam-Mohammadian (1391-بهمن ماه -6GMT13:57:05+00:00)

بازگشت به مقاله های آماری

چه کسي حاضر است ؟

کاربران حاضر در اين انجمن: بدون كاربران آنلاين و 0 مهمان

cron