عنوان انگليسي

Database Preprocessing and Comparison between Data Mining Methods



نویسنده/ناشر/نام مجله :
International Journal on New Computer Architectures and Their Applications
سال انتشار
2011
کد محصول
1000717
تعداد صفحات انگليسي
13
تعداد صفحات فارسي
16
قیمت بر حسب ریال
145000
نوع فایل های ضمیمه
Word+Pdf
حجم فایل
374 کیلو بایت
تصویر پیش فرض


عنوان فارسي

پردازش پایگاه داده ها و مقایسه بین روش های داده کاوی




نام و نام خانوادگی
*


تلفن همراه
*
 


ایمیل
*






Abstarct
 

Database preprocessing is very important to utilize memory usage, compression is one of the preprocessing needed to reduce the memory required to store and load data for processing, the method of compression introduced in this paper was tested, by using proposed examples to show the effect of repetition in database, as well as the size of database, the results showed that as the repetition increased the compression ratio will be increased. The compression is one of the important activities for data preprocessing before implementing data mining. Data mining methods such as Na¨ıve Bayes, Nearest Neighbor and Decision Tree are tested. The implementation of the three methods showed that Na¨ıve Bayes method is effectively used when the data attributes are categorized, and it can be used successfully in machine learning. The Nearest Neighbor is most suitable when the data attributes are continuous or categorized. The third method tested is the Decision Tree, it is a simple predictive method implemented by using simple rule methods in data classification. The success of data mining implementation depends on the completeness of database, that represented by data warehouse, that must be organized by using the important characteristics of data warehouse

Contents

1. INTRODUCTION

2. DATA WAREHOUSE

3. DATABASE MANAGEMENT

4. DATABASE PREPROCESSING

5. DATA MINING TECHNOLOGY

6. DATA MINING

7. DATABASE CLASSIFICATIONS

8. CONCLUSIONS

چکیده

پردازش پایگاه داده ها در بهره برداری از مصرف حافظه بسیار حایز اهمیت می باشد ، متراکم سازی یکی از ابزار پیش پردازش ضروری برای کاستن از حافظه مورد نیاز برای ذخیره کردن و بارگذاری داده ها به منظور پردازش می باشد ، روش متراکم سازی ارایه شه در این مقاله از طریق بکارگیری مثال های پیشنهاد شده مورد تست قرار گرفت  تا تاثیر تکرار در پایگاه داده ها و همچنین اندازه پایگاه داده ها را نشان بدهد و نتایج مشخص نمودند که هر وقت تکرار ذافزایش یافته است ، نسیت متراکم سازی افزایش خواهد یافت . متراکم  سازی یکی از فعالیت های مهم برای پیش پردازش داده ها قبل از اجرای داده کاوی می باشد . روش های داده کاوی نظیر Na¨ıve     Bayes ، نزدیکترین همسایه   و درختان تصمیم گیری مورد تست قرار می گیرند . اجرای سه روش نشان داد که روش Naïve Bayes به طور موثری درزمانی استفاده می شود که نشانه های داده ها دسته بندی می شوند و ان روش را می توان به طور موفقیت آمیزی در یادگیری ماشینی استفاده نمود . روش Nearest neighbor در زمانی بسیار مناسب می باشد که نشانه های داده ها دایمی هستند یا دسته بندی می شوند . درختان تصمیم گیری سومین روشی می باشد که مورد تست قرار گرفت و این روش یک روش پیشگویانه ساده می باشد که از طریق بکارگیری روش های ساده قاعده در دسته بندی داده ها اجراء گردید . موفقیت اجرای داده کاوی به کامل بودن پایگاه داده ها بستگی دارد که از طریق مخزن های داده ها نشان داده شدند که بایستی از طریق بکارگیری مشخصه های مهم مخزن داده ها سازماندهی گردند .

فهرست مطالب

1-مقدمه

2-مخزن داده ها

3- مدیریت پایگاه داده ها

4- پیش پردازش پایگاه داده ها

5- فناوری داده کاوی

6- داده کاوی

7-دسته بندی های پایگاه دادها

8- نتیجه گیری ها 


1-مقدمه

استخراج اطلاعات حیاتی و غیر بدیهی از مقدار زیاد داده که برای جمع اوری در چندین حوزه مختلف علوم ، کسب و کار و مهندسی امکان پذیر می باشد ، داده کاوی (DM) نامیده می شود . داده کاوی بخشی از چارچوب بزرگ تر می باشد که به کشف دانش در پایگاه داده ها (KDD) الشاره می کند ؛ این حوزه یک فرآیند پیچیده را از آماده سازی دانش گرفته تا مدل سازی ان را پوشش می دهدذ . متراگکم سازی داده ها یکی از روش های اماده سازی ها می باشد که برای متراکم سازی مقدار زیادی از پایگاه داده ها مورد نیاز هستند .

داده کاوی عباتست از فرآیند یکه برای شناسایی الگوی مخفی غیر منتطره یا روابط در مقادیر بزرگ داده ها استفاده می گردد . از نظر تاریخی ، ایده یافتن الگو های سودمند در داده ها از دامنه گسترده اسامی از جمله داده کاوی ، استخراج دانش ، کشف اطلاعات ، برداشت اطلاعات ، باستان شناسی داده ها و پردازش الگوی داده ها ارایه شده است . اصطلاح داده کاوی عمدتا توسط آمارگران ف تحلیل گران داده ها و جوامع سیستم های مدیریت اطلاعات استفاده شده اند . عبارت کشف دانش در پایگاه داده ها در KDD اولیه اختراع گردید تا تاکید نماید که دانش محصول نهایی کشف داده محور می باشد . کشف دانش در هوش مصنوعی و حوزه های ماشینی محبوبیت یافته است . شکل یک یک بازنگری را از داده کاوی و فرآیند KDD نشان می دهد...




Skip Navigation Links
ناحیه کاربری

 
 

وارد شوید


دانلود فایل
دانلود مقالات ترجمه شده

مقالات ترجمه شده فنی مهندسی

مهندسی فناوری اطلاعات مهندسی برق مهندسی عمران مهندسی كامپيوتر مهندسي شيمی
مهندسی مکانیک مهندسی صنايع مهندسی پليمر مهندسی پزشکی مهندسی نفت
مهندسی معدن مهندسی مواد مهندسی شهرسازی مهندسي نساجی مهندسی هوافضا
مهندسی ایمنی صنعتی

مقالات ترجمه شده علوم انسانی

حسابداری مديريت روانشناسی حقوق علوم اقتصادی
تربيت بدنی و علوم ورزشی علوم تربيتی فلسفه علوم ارتباطات اجتماعی مديريت جهانگردی
مديريت اجرايی تاريخ علوم اجتماعی علوم جغرافيايی علوم سياسی
مجموعه محيط زيست باستان شناسی زبانشناسی مطالعات جهان الهیات و معارف اسلامی

مقالات ترجمه شده علوم پایه

زيست شناسی شيمی فیزیک رياضی زمين شناسی
آمار ژئوفيزيك و هواشناسی نانوفناوری

مقالات ترجمه شده علوم پزشکی

پزشكی بيوتكنولوژی پرستاری داروسازی علوم آزمايشگاهی
دامپزشكی دندانپزشكی

مقالات ترجمه شده کشاورزی

مجموعه مهندسی كشاورزی مجموعه مهندسی منابع طبيعی

مقالات ترجمه شده هنر

معماری
تماس با ما

آدرس دفتر تهران

خیابان ولیعصر، زرتشت غربی، بعد از بیمارستان مهر، پلاک 86 واحد 3
تلفن تماس 02188972928
مدیریت گروه 09124677115
مدیریت فناوری اطلاعات
09124648967
آدرس دفتر کرج
البرز - نظرآباد - الغدیر جنوبی، کوچه غدیر 4 (کوچه شهید بذرپاچ) ساختمان ستاره طبقه چهارم پلاک 6
تلفن تماس 02645344101
دعوت به همکاری