تشخیص صدا با الگوریتم MFCC پیاده سازی با متلب

یکشنبه ۱۳ دی ۱۳۹۴
بازدید ۲,۷۹۱ نفر
نوآوران گرمی
(163 امتیاز از 33 رای)
Loading...

پروژه تشخیص صدا با الگوریتم MFCC با متلب

در این پست پروژه تشخیص صدا با الگوریتم MFCC با متلب را آماده کرده ایم که در ادامه به شرح مختصری از تشخیص صدا و گفتار و الگوریتم MFCC پرداخته و فیلم و تصاویری از خروجی پروژه را نشان داده ایم.

هدف اصلی از تشخیص خودکار زبان ، شناسایی صحبت انجام شده با سرعت و با دقت می باشد که کاربردهای بسیار وسعی دارد. تا به امروز، انسان ها دقیق ترین سیستم های تشخیص زبان در جهان هستند.

در طی سال هاي اخير، كاربرد سيستم های تشخیص صدا و گفتار بسیار افزايش یافته است. يكی از اين مشكلات وجود تنوعات گفتار در شرايط متنوع صوتي می باشد كه اين سيستم ها در آنها کاربرد دارد. اين تنوعات به دلیل منابعی مانند انواع كانال صوتی، لهجه ها و شيوه های مختلف گويش، نويز اضافه شونده، مشخصات ميكروفن و … هستند.

توضیحات بیشتر، فیلم و تصاویری از خروجی پروژه تشخیص صدا با الگوریتم MFCC با متلب در ادامه مطلب.

به منظور استخراج ویژگی های مورد نیاز، ابتدا سیگنال گفتار به پنجره های کوتاهی با طول مثلا 20 میلی ثانیه که با هم همپوشانی دارند تقسیم می شود. به دلیل اینکه که مشخصات سیگنال گفتار و مجاری گفتار در حین بیان یک گویش تغییر می یابد. بنابراین، سیگنال گفتار سیگنالی غیر ایستا می باشد و خواص آماری آن در طول زمان تغییر می کند. اما از آنجا که اندام های گفتار به کندی تغییر حالت می دهند یا انسان نمی تواند آنها را سریع تراز حد خاصی تغییر دهد، در بازه های زمانی کوتاهی می توان آن را سیگنال انسان فرض نمود.

یکی از معروفترین روش های استخراج ویژگی برای تشخیص زبان گفتاری MFCC می باشد که بخشهای اصلی آن به صورت زیر است:

در مرحله اول سیگنال صحبت به فریم های 23 میلی ثانیه تقسیم شده، سپس به جهت کاهش اثر ناپیوستگی لبه از پنجره همینگ عبور داده می شود. آنگاه طیف سیگنال، محاسبه شده و از فیلتر بانک مل عبور می کند. از انرژی بدست آمده از مرحله قبل لگاریتم گرفته و در مرحله آخر از DTC استفاده می شود. فراینده فوق در شکل زیر آمده است.

ضرایب MFCC یا Mel Frequency Cepstral Coefficient به معنی ﺿﺮاﯾﺐ ﮐﭙﺴـﺘﺮال ﻓﺮﮐﺎﻧﺴـﯽ ﻣـﻞ ، الهام گرفته از خواص شنیداری گوش انسان در دریافت و فهم گفتار می باشد.

تصاویر خروجی پروژه تشخیص صدا با الگوریتم MFCC :

تصویر خروجی 1:

تصویر خروجی 2:

تصویر خروجی 3:

تصویر خروجی 4:

تصویر خروجی 5:

تصویر خروجی 6:

تصویر خروجی 7:

هادی سه شنبه , 11 خرداد
پاسخ دادن
سلام خسته نباشید من این پروژرو از شما خرید کردم دانلود نمیشه خطا میده میشه اونو برام ایمیل کنید ببخشیدا مجبور شدم .
- نوآوران گرمیسه شنبه , 11 خرداد
  پاسخ دادن
  دوست عزیز پروژه تشخیص صدا با الگوریتم MFCC به ایمیلتون ارسال شد
علی اکبر جمعه , 2 آذر
پاسخ دادن
سلام و خسته نباشید . من قصد تهیه آموزش ها رو دارم . هدف من اینه که کاربر مثلا یک کلمه انگلیسی بیان کند و در متلب تشخیص داده شود که کلمه ای ک کاربر گفته چی بوده و متناسب با اون کلمه یه سری دستور العمل ها اجرا شود . بنظر شما کدوم قسمت از آموزش ها بدرد کار من میخوره؟ سوال بعدی این هست که فایل های آموزشیتون صدا دارن؟ چون خلاصه آموزش هایی ک گذاشته اید بی صدا بودن. تشکر
- نوآوران گرمیجمعه , 2 آذر
  پاسخ دادن
  این محصول آموزش نیست و فقط پروژه در محیط متلب است. همچنین فیلم آموزشی نیز نیست و تنها کد متلب است که به همراه فیلم نحوه ران کردن پروژه ارائه شده است. بله فیلم بدون صدا هست و فقط نحوه اجرا کردن پروژه رو نشون میده. پروژه های موجود در آدرس زیر تا حدودی می تونه کدکتون کنه:
  پروژه های تشخیص گفتار و پردازش صدا
saba چهارشنبه , 13 تیر
پاسخ دادن
اگه کد رو نمیدید این پروژه دقیقا چه ارزشی داره؟ در صورتی فایده داشت که کد پروژه را بدید که بتونیم customize روش انجام بدیم!

آموزش الگوریتم رگرسیون فرآیند گاوسی (GPR) در R

آموزش طبقه بندی داده های آیریس (Iris) با الگوریتم درخت تصمیم C5 در نرم افزار R

آموزش یادگیری عمیق با پایتون (Deep Learning with Python) به همراه فایل تمرین

آموزش معماری کامپیوتر توسط دکتر گودرزی از دانشگاه شریف

آموزش طراحی الگوریتم به صورت فیلم

فیلم آموزش پیاده سازی FTP در شبکه ATM با OPNET

فیلم آموزش پیاده سازی پروژه Video Conferencing و VOIP با نرم افزار OPNET

تشخیص صدا با الگوریتم MFCC پیاده سازی با متلب

پروژه تشخیص صدا با الگوریتم MFCC با متلب