Abstract
The authors investigated the classification of regions of interest (ROI's) on mammograms as either mass or normal tissue using a convolution neural network (CNN). A CNN is a backpropagation neural network with two-dimensional (2-D) weight kernels that operate on images. A generalized, fast and stable implementation of the CNN was developed. The input images to the CNN were obtained from the ROI's using two techniques. The first technique employed averaging and subsampling. The second technique employed texture feature extraction methods applied to small subregions inside the ROI. Features computed over different subregions were arranged as texture images, which were subsequently used as CNN inputs. The effects of CNN architecture and texture feature parameters on classification accuracy were studied. Receiver operating characteristic (ROC) methodology was used to evaluate the classification accuracy. A data set consisting of 168 ROIs containing biopsy-proven masses and 504 ROI's containing normal breast tissue was extracted from 168 mammograms by radiologists experienced in mammography. This data set was used for training and testing the CNN. With the best combination of CNN architecture and texture feature parameters, the area under the test ROC curve reached 0.87, which corresponded to a true-positive fraction of 90% at a false positive fraction of 31%. The authors' results demonstrate the feasibility of using a CNN for classification of masses and normal tissue on mammograms
چکیده
ما طبقه بندی ناحیه های مطلوب (ROI) در ماموگرام ها را یا بصورت توده یا بصورت بافت نرمال با استفاده از یک شبکه عصبی کانولوشن (CNN) بررسی می کنیم. CNN ، یک شبکه عصبی پس انتشار با کرنل های وزن دو بعدی است که بر روی تصاویر عمل می کند. اجرای سریع، پایدار و تعمیم یافته CNN توسعه داده می شود. تصاویر ورودی به CNN از ROI با استفاده از دو تکنیک بدست می آید. تکنیک اول، میانگین گیری و زیرنمونه گیری را انجام می دهد. تکنیک دوم، روش های استخراج ویژگی بافت را برای ناحیه کوچکی در داخل ROI بکار می برد. ویژگی های محاسبه شده در نواحی مختلف به عنوان تصاویر بافت قرار می گیرند که به طور متوالی به عنوان ورودی های CNN استفاده می شوند. اثرات ساختار و پارامترهای ویژگی بافت CNN بر دقت طبقه بندی بررسی می شود. روش منحنی مشخصه عملکرد (ROC) برای ارزیابی دقت طبقه بندی استفاده می شود. یک مجموعه داده شامل 168 ROI که دارای توده های تایید شده هستند و 504 ROIکه دارای بافت نرمال سینه هستند، توسط رادیولوژیست باتجربه در ماموگرافی از 168 ماموگرام استخراج می شود. این مجموعه داده برای آموزش و تست CNN استفاده می شود. با ترکیب بهتر ساختار و پارامترهای ویژگی بافت CNN ، حوزه زیر تست منحنی ROC به 0.87 می رسد که متناظر با یک بخش مثبت واقعی 90% در یک بخش مثبت کاذب 31% می باشد. نتایج ما، امکان استفاده از CNN را برای طبقه بندی توده ها و بافت نرمال در ماموگرام ها نشان می دهد.
1-مقدمه
سرطان سینه رایج ترین سرطان درمیان زنان است و علت اصلی مرگ و میر ناشی از سرطان در میان زنان 15 تا 54 سال است. ماموگرافی موثرترین روش برای تشخیص زودرس سرطان سینه است. با این وجود، با نگاهی به گذشته آشکار می شود که تعداد زیادی از ضایعاتی که در ماموگرام قابل مشاهده هستند توسط رادیولوژیست ها از قلم می افتند که می تواند علل مختلفی داشته باشد، از قبیل: کیفیت پایین تصویر ماموگرافی، ظاهر خوش خیم ضایعات، و خستگی چشم یا غفلت توسط رادیولوژیست ها. طرح تشخیص به کمک کامپیوتر(CAD) می تواند مطابقت نظر فرد صلاحیت دار دیگر را با نظر رادیولوژیست فراهم کند که ممکن است تشخیص های منفی کاذب را کاهش دهد. علاوه براین، CAD می تواند در تفکیک ضایعات بدخیم از خوش خیم نیز مفید باشد، بنابراین تعداد موارد خوش خیمی که برای بیوپسی فرستاده می شوند را کاهش می دهد.....