پروژه استخراج متن از تصاویر منوی غذای رستوران (OCR) در MATLAB
پروژه استخراج متن از تصاویر منوی غذای رستوران را با نرم افزار MATLAB آماده کردیم که یک نوع سیستم OCR بوده و یک پروژه مناسب پردازش تصویر، بینایی ماشین، شناسی الگو و هوش مصنوعی است. در ادامه به معرفی سیستم های OCR و این پروژه پرداخته و فیلم و تصاویری از خروجی آن قرار داده شده است.
هنگام مراجعه به رستوران کشور های خارجی، اغلب مردم با نام غذا های موجود در منو آشنا نیستند. این موضوع نه تنها به دلیل متفاوت بودن زبان است، بلکه مهم تر دلیل در تفاوت های فرهنگی می باشد. در این پروژه پردازش تصویر و بینایی ماشین، برنامه ای برای کمک به مردم طراحی شده است که پس از استحراج اطلاعات از تصاویر، می توان آن متن را با یک ابزار مترجم، به زبان مورد نظر تبدیل کرد.
سیستم های استخراج متن از تصاویر (OCR):
هدف سیستم های استخراج متن از تصاویر یا (Optical character recognition – OCR)، بازیابی متن از روی عکس مربوط به صفحه اسکن شده و یا عکس های دیجیتالی می باشد. سیستم های OCR قابلیت تبدیل متن چاپ شده به فایل الکترونیکی را به صورت مستقیم فراهم می سازد که دقت تشخیص و تبدیل صحیح نیز به قدرت الگوریتم های پردازش تصویر و شناسایی الگو مورد استفاده در سیستم بستگی دارد. سیستم های استخراج متن از تصاویر یا استخراج ویژگی های تصاویر کاربرد های مهمی نظیر کمک به قرائت روشندلان (نابینا و کم بینا)، اتوماسیون اداری و فرآیند تولید کتابخانه با منابع دیجیتالی و غیره است.
توضیحات بیشتر، فیلم و تصاویری از خروجی پروژه استخراج متن از تصاویر منوی غذای رستوران در ادامه مطلب.
بررسی پیشرفت و آینده OCR:
بازدهی الگوریتم های مورد استفاده در سیستم های OCR هنوز به صد درصد نرسیده و روز به روز در حال تکامل است. اصلی ترین مشکل در بازسازی تصاویر اسناد با کیفیت پایین، چسبیدن کاراکتر ها در کنار هم یا بریده شدن استروک ها می باشد که در الگوریتم هایی که جدیدا شاهد ارائه شدن آنها در مقالات مختلف هستیم، تلاش می شود تا به این مشکل غلبه کنند. سیستم های OCR را می توان گسترده ترین موضوع پژوهشی و تحقیق در زمینه بازشناسی الگو (Pattern Recognition) دانست.
شناسایی و تفسیر گرافیک یک امر مهم در تحلیل اسناد می باشد چرا که عناصر گرافیکی به شکل های مختلفی در کنار متن قرار دارند، به طور مثال: دیاگرام هایی که مفاهیم متن را روشن و واضح تر می کنند، لوگو های شرکت ها در سربرگ نامه های اداری، خط های جدا کننده فیلد ها در جداول و همینطور قسمت های متنی. به طور کلی هدف این است که اطلاعاتی به دست آید که بتوانیم معنای محتوای تصاویر اسناد را توصیف کنیم.
تصویر خروجی 2:
هیچ نظری ثبت نشده است