Abstract
This paper presents a hybrid SVM-GMM mechanism based on a fuzzy rule-based system (FRBS), called FRBS-SVMGMM, for acoustic event detection (AED) applications. This method effectively combines the results of support vector machine (SVM) and Gaussian mixture model (GMM) calculations on acoustic data within the framework of FRBS operations. With the support of FRBS, which greatly increases AED recognition accuracy, AED can make reliable and correct detection decisions. This approach is essential to applications where low false recognition is a major concern. The proposed FRBS-SVMGMM mechanism is conceptually simple and computationally inexpensive. The comparative recognition performance experiments in this study demonstrate the effectiveness and superiority of the proposed FRBS-SVMGMM
چکیده
این مقاله یک مکانیزم SVM-GMM ترکیبی را برمبنای سیستم مبتنی بر قوانین فازی (FRBS)، به نام FRBS-SVMGMM، برای برنامههای کاربردی تشخیص رخدادهای صوتی (AED) نشانمیدهد. این روش بهطور موثری نتایج ماشین بردار پشتیبان (SVM) و محاسبات مدل مخلوط گاووس (GMM) برروی دادههای صوتی درون چارچوب عملیات FRBS را ترکیب میکند. با پشتیبان FRBS، که بهطور زیادی دقت تشخیص AED را افزایش میدهد، AED میتواند قابل اعتماد شود و تصمیمهای تشخیصی صحیحی را اتخاذ کند. این رویکرد ضرورتآ برای کاربردهایی است که تشخیصهای نادرست نگرانی اصلی آنها است. مکانیزم FRBS-SVMGMM پیشنهادشده، از لحاظ مفهومی ساده و از لحاظ محاسباتی هزینهبر است. آزمایشهای تشخیص عملکرد مقایسهای در این مطالعه تاثیر و برتری FRBS-SVMGMM پیشنهادشده را بیان میکند.
1-مقدمه
اغلب همه موجودات زنده با اندامهایی برای ادراکهای دیداری و شنیداری تجهیز شدهاند، هر سیستم امنیتی، نظارت از راه دور منزل فاقد اطلاعات صوتی، بهطور موثری فلج است. تشخیص رخدادهای صوتی (AED)، که گاهی اوقات به گروهبندی رخدادهای صوتی اشاره میکند، توجهات بیشتری را در سالهای اخیر به خود جلبکردهاست، و نقش مهمی را در زمینه پردازش اطلاعات صوتی و گفتاری بازی میکند. سیستمهای نظارتی و امنیتی متعارف راه دور منزل اگر منحصرآ به تحلیلهای حرکتی اطلاعات بصری محدود نباشند، به هم وابسته هستند. (برای مثال دادههای اتخاذشده توسط دوربین ویدیویی) [10,11]. بازیابی چندرسانهای و برنامههای نمایهسازی همچنین برروی اطلاعات ویدیویی تمرکز میکند، اما اخیرآ نشانههای صوتی به یک روش تشخیص شاتهای خاص در دنبالههای ویدیویی تبدیلشدهاست [12,13]. فرآیند پردازش عکسبرداری دارای محدودیتهای ذاتی است که توانایی دادههای بصری برای اتخاذ موقعیتها یا شرایط توسعه را محدود میکند. دادههای آکوستیک میتواند یک منبع مکمل اطلاعاتی در این زمینه باشند...