Skip Navigation Linksلیست مقالات ترجمه شده / مقالات ترجمه شده مهندسی كامپيوتر /

عنوان ترجمه شده مقاله: بکارگیری ابزار‌های داده کاوی جهت انتشار داده‌ها در مسائل دسته‌بندی

فاز انتشار داده‌ها یک مرحله حیاتی در فرآیند KDD (کشف دانش در پایگاه داده‌ها) است.

Abstract

The data preparation phase is a critical step in the KDD (Knowledge Discovery in Databases) process. This phase is crucial for a good data mining result because if data is not correctly prepared, all the next phases of the process are compromised. DMPML is a framework that stores preprocessed data for different data mining algorithms in an XML document and retrieves the correct codification by the use of an XSLT document according to the needs of the data mining algorithm. This paper presents a comparison between DMPML and three data mining applications (Weka, Rapid Miner, and KNIME) that implement the directed graph approach, concerning the time spent to create and execute the data preparation tasks for two data mining algorithms. The tests were executed using different types of data sets: numerical, categorical, and mixed. We observed that the scheme used by DMPML can simplify the usage of different data mining algorithms and significantly reduce the time spent creating the data preparation tasks

چکیده

فاز انتشار داده‌ها یک مرحله حیاتی در فرآیند KDD (کشف دانش در پایگاه داده‌ها) است. این فاز برای نتیجه یک داده کاوی خوب حیاتی است زیرا اگر داده‌ها به طور صحیح آماده نشده باشند، تمام فاز‌های بعدی فرآیند به خطر می‌افتد. DMPML چهارچوبی است که داده‌های از پیش پردازش شده را برای الگوریتم‌های مختلف داده کاوی در یک سند XML ذخیره می‌کند و کد‌گذاری صحیح را با استفاده از یک سند XSLT مطابق با نیاز‌های الگوریتم داده کاوی بازیابی می‌نماید. این مقاله مقایسه‌ای بین DMPML و سه برنامه کاربردی داده کاوی (Weka، RapidMiner، KNIME) را ارائه می‌دهد که رویکرد گراف جهت دار را با در نظر گرفتن زمان صرف شده جهت ایجاد و اجرای وظایف انتشار داده‌ها برای دو الگوریتم داده کاوی بکار می‌گیرد. آزمایشات با استفاده از انواع مختلف مجموعه‌های داده‌ای: عددی، قطعی و ترکیبی اجرا می‌شوند. ما مشاهده کردیم که طرح بکار رفته توسط DMPML می‌تواند استفاده از الگوریتم‌های مختلف داده کاوی را ساده کند و به طور قابل ملاحظه‌ای زمان صرف شده جهت ایجاد وظایف انتشار داده‌ها را کاهش دهد.

1-مقدمه

فاز انتشار داده‌ها در فرآیند KDD مسئول پاک کردن، یکپارچه کردن، انتخاب و تبدیل داده‌ها است، به طوری که برای یک الگوریتم داده کاوی مناسب باشد. بر اساس Pyle [2]، آماده سازی داده‌ها 60 تا 80 درصد از زمان مورد نیاز جهت کاوش داده‌ها را مصرف می کند و 75 تا 90 درصد از داده‌ها جهت موفقیت کاوش همکاری می‌نمایند. امروزه بسیاری از ابزار‌ها می‌توانند جهت انجام این فاز مورد استفاده قرار گیرند. رایج‌ترین رویکردی که علاوه بر توصیف فاز انتشار داده‌ها می‌تواند کل فرآیند را توصیف نماید.، بکارگیری گراف‌های جهت دار است...


موسسه ترجمه البرز اقدام به ترجمه مقاله " مهندسی فناوری اطلاعات " با موضوع " بکارگیری ابزار‌های داده کاوی جهت انتشار داده‌ها در مسائل دسته‌بندی " نموده است که شما کاربر عزیز می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.
عنوان ترجمه فارسی
بکارگیری ابزار‌های داده کاوی جهت انتشار داده‌ها در مسائل دسته‌بندی
نویسنده/ناشر/نام مجله :
Computer and Information Science (ICIS), 2012 IEEE/ACIS 11th International Conference
سال انتشار
2012
کد محصول
1003988
تعداد صفحات انگليسی
6
تعداد صفحات فارسی
16
قیمت بر حسب ریال
841,500
نوع فایل های ضمیمه
Pdf+Word
حجم فایل
772 کیلو بایت
تصویر پیش فرض


این مقاله ترجمه شده را با دوستان خود به اشتراک بگذارید
سایر مقالات ترجمه شده مهندسی فناوری اطلاعات , مهندسی كامپيوتر را مشاهده کنید.
کاربر عزیز، بلافاصله پس از خرید مقاله ترجمه شده مقاله ترجمه شده و با یک کلیک می توانید مقاله ترجمه شده خود را دانلود نمایید. مقاله ترجمه شده خوداقدام نمایید.
جهت خرید لینک دانلود ترجمه فارسی کلیک کنید
جستجوی پیشرفته مقالات ترجمه شده
برای کسب اطلاعات بیشتر، راهنمای فرایند خرید و دانلود محتوا را ببینید
هزینه این مقاله ترجمه شده 841500 ریال بوده که در مقایسه با هزینه ترجمه مجدد آن بسیار ناچیز است.
اگر امکان دانلود از لینک دانلود مستقیم به هر دلیل برای شما میسر نبود، کد دانلودی که از طریق ایمیل و پیامک برای شما ارسال می شود را در کادر زیر وارد نمایید


این مقاله ترجمه شده مهندسی فناوری اطلاعات در زمینه کلمات کلیدی زیر است:





Data preparation
DMPML
XML
Tools comparison

تاریخ انتشار در سایت: 2015-04-02
جستجوی پیشرفته مقالات ترجمه شده
نظرتان در مورد این مقاله ترجمه شده چیست؟

ثبت سفارش جدید