لینک دانلود و خرید پایین توضیحات
دسته بندی : پاورپوینت
نوع فایل : powerpoint (..ppt) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید : 21 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا
Data Mining چیست؟
Data Mining عبارت است از اقتباس یا استخراج دانش از مجموعه ای از داده ها ، به بیان دیگر ، Data Mining فرایندی است که با استفاده از تکنیکهای هوشمند، دانش را از مجموعه ای از داده ها استخراج می کند.
Data Mining از ساخت مدل های تحلیلی ، دسته بندی و پیش بینی اطلاعات و ارائه نتایج با استفاده از ابزارهای مرتبط استفاده می کند.
برای اینکه الگوریتم Data Mining بتواند عمل استخراج دانش را بخوبی انجام دهد، نیاز به یک سری پیش پردازش ها بر روی مجموعه آموزشی و یک سری پس پردازش ها بر روی الگوهای استخراج شده دارد.
مراحل Data Mining
پاک سازی داده ها : در این مرحله داده های غیر معتبر از مجموعه داده های آموزشی خارج می شوند. داده های دارای نویز، اطلاعات ناکامل و ... نمونه هایی از داده هایی هستند که با ید پاکسازی در مورد آنها انجام گردد.
یکپارچه سازی داده ها : در این مرحله، منابع چندگانه داده ای با هم ترکیب می شوند.
انتخاب داده ها : داده های مرتبط به فرایند Data Mining از سایر داده ها جدا می شود. این مبحث را می توان بخشی از فرایند کاهش اطلاعات نیز دانست.
تبدیل داده ها : داده ها به قالبی قابل استفاده برای Data Mining در می آیند. از اعمالی که در این مرحله صورت می گیرد ، می توان به خلاصه سازی و یا محاسبه مقادیر تجمعی اشاره کرد.
Data Mining : بخش اصلی فرایند که در آن با استفاده از روش ها و تکنیکهای خاص ، استخراج الگو های دانش صورت می گیرد.
ارزیابی الگوها : تشخیص الگو های صحیح مورد نظر ، از سایر الگو ها در این مرحله انجام می شود. صحت الگوها بر اساس یک سری معیار های جذابیت سنجیده می شود.
بازنمایی دانش : در این بخش به منظور ارائه دانش استخراج شده به کاربر ، از یک سری ابزارهای بصری سازی استفاده می گردد.
کاهش اطلاعات
کاهش اطلاعات عبارت است از تولید یک مجموعه کوچکتر از داده های اولیه که تحت عملیات Data Mining نتایج تقریبا یکسانی با نتایج Data Mining روی اطلاعات اولیه به دست می دهد.
این عمل را می توان از طریق حذف خصیصه های غیر مرتبط با نوع عملیات Data Mining مورد نظر انجام داد.
حذف خصیصه های مرتبط که در اثر اشتباه در ارزیابی میزان ارتباط آنها با عملیات Data Mining انجام می گیرد، می تواند منجر به ناکارآمدی فرایند Data Mining و استخراج قوانین ناقص و در نتیجه بی ارزش شود.
عدم حذف خصایص غیر مرتبط می تواند زمان انجاخم عملیات Data Mining را به طرز قابل ملاحظه ای افزایش دهد.
سه روش کلی برای انتخاب خصایص مرتبط با Data Mining وجود دارد:
انتخاب پیش رونده: در هر مرحله خصیصه ای که بیشترین ارتباط را دارد، برگزیده می شود.
انتخاب عقب رونده: در هر مرحله خصیصه ای که کمترین ارتباط را دارد، انتخاب و حذف می شود.
روش ترکیبی : ترکیب هر دو روش پیش رونده و پس رونده
سلسله مراتب مفهومی: روشی برای کاهش تعداد مقادیر ممکن برای یک خصیصه ارائه می دهد، اگر چه داده های خروجی کلی تر بوده و فاقد برخی جزئیات هستند، اما این داده ها بسیار ساده تر بوده و در سطح تجریدی بالاتری نسبت به داده های اولیه قرار دارند.