پروژه تشخیص صدا با الگوریتم MFCC با متلب
در این پست پروژه تشخیص صدا با الگوریتم MFCC با متلب را آماده کرده ایم که در ادامه به شرح مختصری از تشخیص صدا و گفتار و الگوریتم MFCC پرداخته و فیلم و تصاویری از خروجی پروژه را نشان داده ایم.
هدف اصلی از تشخیص خودکار زبان ، شناسایی صحبت انجام شده با سرعت و با دقت می باشد که کاربردهای بسیار وسعی دارد. تا به امروز، انسان ها دقیق ترین سیستم های تشخیص زبان در جهان هستند.
در طی سال هاي اخير، كاربرد سيستم های تشخیص صدا و گفتار بسیار افزايش یافته است. يكی از اين مشكلات وجود تنوعات گفتار در شرايط متنوع صوتي می باشد كه اين سيستم ها در آنها کاربرد دارد. اين تنوعات به دلیل منابعی مانند انواع كانال صوتی، لهجه ها و شيوه های مختلف گويش، نويز اضافه شونده، مشخصات ميكروفن و … هستند.
توضیحات بیشتر، فیلم و تصاویری از خروجی پروژه تشخیص صدا با الگوریتم MFCC با متلب در ادامه مطلب.
به منظور استخراج ویژگی های مورد نیاز، ابتدا سیگنال گفتار به پنجره های کوتاهی با طول مثلا 20 میلی ثانیه که با هم همپوشانی دارند تقسیم می شود. به دلیل اینکه که مشخصات سیگنال گفتار و مجاری گفتار در حین بیان یک گویش تغییر می یابد. بنابراین، سیگنال گفتار سیگنالی غیر ایستا می باشد و خواص آماری آن در طول زمان تغییر می کند. اما از آنجا که اندام های گفتار به کندی تغییر حالت می دهند یا انسان نمی تواند آنها را سریع تراز حد خاصی تغییر دهد، در بازه های زمانی کوتاهی می توان آن را سیگنال انسان فرض نمود.
یکی از معروفترین روش های استخراج ویژگی برای تشخیص زبان گفتاری MFCC می باشد که بخشهای اصلی آن به صورت زیر است:
در مرحله اول سیگنال صحبت به فریم های 23 میلی ثانیه تقسیم شده، سپس به جهت کاهش اثر ناپیوستگی لبه از پنجره همینگ عبور داده می شود. آنگاه طیف سیگنال، محاسبه شده و از فیلتر بانک مل عبور می کند. از انرژی بدست آمده از مرحله قبل لگاریتم گرفته و در مرحله آخر از DTC استفاده می شود. فراینده فوق در شکل زیر آمده است.
ضرایب MFCC یا Mel Frequency Cepstral Coefficient به معنی ﺿﺮاﯾﺐ ﮐﭙﺴـﺘﺮال ﻓﺮﮐﺎﻧﺴـﯽ ﻣـﻞ ، الهام گرفته از خواص شنیداری گوش انسان در دریافت و فهم گفتار می باشد.
تصاویر خروجی پروژه تشخیص صدا با الگوریتم MFCC :
تصویر خروجی 1:
تصویر خروجی 2:
تصویر خروجی 3:
تصویر خروجی 4:
تصویر خروجی 5:
تصویر خروجی 6:
تصویر خروجی 7:
سلام خسته نباشید من این پروژرو از شما خرید کردم دانلود نمیشه خطا میده میشه اونو برام ایمیل کنید ببخشیدا مجبور شدم .
دوست عزیز پروژه تشخیص صدا با الگوریتم MFCC به ایمیلتون ارسال شد
سلام و خسته نباشید . من قصد تهیه آموزش ها رو دارم . هدف من اینه که کاربر مثلا یک کلمه انگلیسی بیان کند و در متلب تشخیص داده شود که کلمه ای ک کاربر گفته چی بوده و متناسب با اون کلمه یه سری دستور العمل ها اجرا شود . بنظر شما کدوم قسمت از آموزش ها بدرد کار من میخوره؟ سوال بعدی این هست که فایل های آموزشیتون صدا دارن؟ چون خلاصه آموزش هایی ک گذاشته اید بی صدا بودن. تشکر
این محصول آموزش نیست و فقط پروژه در محیط متلب است. همچنین فیلم آموزشی نیز نیست و تنها کد متلب است که به همراه فیلم نحوه ران کردن پروژه ارائه شده است. بله فیلم بدون صدا هست و فقط نحوه اجرا کردن پروژه رو نشون میده. پروژه های موجود در آدرس زیر تا حدودی می تونه کدکتون کنه:
پروژه های تشخیص گفتار و پردازش صدا
اگه کد رو نمیدید این پروژه دقیقا چه ارزشی داره؟ در صورتی فایده داشت که کد پروژه را بدید که بتونیم customize روش انجام بدیم!