تاریخ : چهارشنبه 28 اسفند 1392 | 12:49 ق.ظ | نویسنده : Me
پس از فشردن کلیدهای  shift و F4  در پنجره Page Property   از بخش Reference می توان رفرنس های پروژه  را ویرایش کرد



طبقه بندی: Visual Stadio،
برچسب ها: Visual Stadio Remove Reference،

تاریخ : یکشنبه 28 مهر 1392 | 12:29 ق.ظ | نویسنده : Me
اگر هنگام Attach بانک اطلاعاتی در SQL SERVER 2008 با خطای شماره 5123 روبرو شدین
به این دلیل است که لاگینی که برای Attach کردن بانک اطلاعاتی از آن استفاده می شود با لاگینی که همان بانک را Detach کرده متفاوت است . به بیان دیگر لاگینی که ابا استفاده از آن به SQL SERVER  لاگین کردین  Owner فایل های بانک شما نیست و می بایست این لاگین را برای فایلهای بانک مورد نظرتون تعریف کرده و جوزهای لازم رو بهش بدین .
برای این کار در محیط ویندوز روی یکی از فایل های بانک کلیک راست کرده و Properties را  انتخاب کنید و از طریق تب Security لاگین مورد نظر را تعریف کرده و مجوز Full Control رو بهش بدین .
تعریف لاگین و مجوز باید برای هر دو قایل بانک (فایل ldf و mdf ) صورت گیرد.



طبقه بندی: SQL SERVER،
برچسب ها: SQL SERVER 2008، خطای 5123 در اس کیو ال، خطای 5123 در SQL SERVER،

تاریخ : سه شنبه 25 مهر 1391 | 07:28 ب.ظ | نویسنده : Me

سلام
این وبلاگ رو تقریبا 2 سال پیش واسه درس محیط های چندرسانه ایی زدم
الان تصمیم دارم هرچیز جدیدی رو که یادمیگیرم توی این وبلاگ قرار بدم و یه جورایی چراغشو روشن نگاه دارم
امیدوارم آموخته های روزانه ام روز به روز  زیادتر  بشه
 


تاریخ : دوشنبه 11 بهمن 1389 | 11:06 ب.ظ | نویسنده : Me
با استفاده از این سایت می توانید به راحتی بدون نیاز به نصب برنامه ای متن مورد نیاز خود را با هر فونتی که نیاز دارید نوشته و تصویر آن را ذخیره کرده و یا در سایت و وبلاگ خود استفاده کنید .



کافی است که فونت مورد نظر ورنگ آن را تعیین کنید و نوع تصویر مورد نظرتان هم قابل تعیین است پس از نوشتن متن مورد نظر بر روی  خطاطی کن کلیک کنید
حال برای استفاده از تصویر می توانید بر روی ذخیره در رایانه کلیک کرده و تصویر را ذخیره کنید و یا با کلیک بر  استفاده در اینترنت , لینک آن برای استفاده در وبلاگ یا وب سایت به شما داده می شود






طبقه بندی: وبـــــــ گردی،

تاریخ : یکشنبه 26 دی 1389 | 08:41 ب.ظ | نویسنده : Me
OCR چیست؟

OCR سرنام اصطلاحی است كه صورت كامل آن در واژه‌نامه انگلیسی Optical Character Recognition و به معنی بازشناسایی كاراكتر نوری می‌باشد.
فرض كنید كه ما متنی را روی كاغذ داریم و می‌خواهیم آن را وارد رایانه كنیم. اولین روشی كه به ذهن می‌رسد این است كه متن را به تایپیست بدهیم تا با كامپیوتر تایپ كند. اما آیا می‌شود عین همان متن را وارد رایانه بكنیم تا نیازی به تایپ نباشد؟ البته دستگاه «اسكنر» می‌تواند تصویری از آن متن را وارد رایانه كند، تا اینجا بخشی از مشكل ما حل شده است. اما رایانه كه نه عقلی دارد و نه «زبان» می‌فهمد، نمی‌تواند حروف و كلمات را از هم تشخیص دهد. مثلاً اگر از كامپیوتر بخواهیم به ما بگوید كه در متن اسكن‌شده كلمة «علی» چند بار آمده است، بی‌آنكه شرمنده شود، می‌گوید: «error»، یعنی: «نمی‌توانم تشخیص بدهم!» در واقع این «تصویر دیجیتال‌شده» باید به «تصویر قابل پردازش» تبدیل شود. موضوع اصلی OCR همین است.
. فرض كنید كه مثلاً می‌خواهیم متن مقالات روزنامه اطلاعات سال 1340 شمسی را (كه اكنون نه تنها فایل تایپی‌اش موجود نیست ــ چون آن زمان اصلاً تایپ كامپیوتری در كار نبود! ــ بلكه خود نسخه‌های روزنامه را هم به زحمت می‌توان پیدا كرد) تایپ دیجیتالی كنیم، و این متن‌ها را داخل بسته‌های نرم‌افزاری یا اینترنت قرار دهیم. اگر هر شماره از روزنامه را 24 صفحه فرض كنیم، و هر تایپیست بتواند در هر روز حداكثر یك صفحه از آن صفحات كاهی و كهنه شدة قدیمی را دوباره تایپ كند، مجموعاً 24 روز لازم است تا تنها مقالات یك شماره از روزنامه تایپ شود. بنابراین در عرض یك سال یك نفر می‌تواند تنها 15 شماره از روزنامه را تایپ كند. حال اگر نرم‌افزاری باشد كه بتواند با اسكن كردن هر صفحة روزنامه، به طور خودكار مقالات آن را تایپ كند، تحولی عظیم رخ می‌دهد، یعنی مطالب و مقالات هزاران شماره از روزنامه‌های قدیمی به سرعت وارد فایل‌های رایانه‌ای می‌شود. حال این امكان را تعمیم بدهید به هزاران كتاب و دست نویس‌های قدیمی یا جدید، كه هر كس بخواهد تنها یك صفحه از آنها را تایپ كند، باید كلی وقت صرف كند. می‌بینید كه نرم‌افزار OCR به راستی می‌تواند هزاران هزار روز در وقت ما صرفه‌جویی كند، و البته هزینه‌ها را هم كاهش دهد. البته فقط یك مشكل كوچك به وجود می‌آید و آن بیكار شدن تایپیست‌هاست! قبل از اینکه وارد مبحث  «OCR» شویم، لازم است اشاره مختصری به حوزه های بازشناسی الگو داشته باشیم .

 ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ
  ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ ﺷﺎﺧﻪ ای اﺯ ﻫﻮﺵ ﻣﺼﻨﻮﻋﻲ است كه با ﻃﺒﻘﻪ بندی (ﻛﻼﺳﻪ ﺑﻨﺪﻱ) ﻭ ﺗﻮﺻﻴﻒ ﻣﺸﺎﻫﺪﺍﺕ ﺳﺮﻭﻛﺎﺭ ﺩﺍﺭﺩ.  ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ ﺑﻪ ﻣﺎ ﻛﻤﻚ ﻣﻲ ﻛﻨﺪ ﺗﺎ ﺩﺍﺩﻩ ها ( ﺍﻟﮕﻮﻫﺎ ) ﺭﺍ ﺑﺎ ﺗﻜﻴﻪ ﺑﺮ ﺩﺍﻧﺶ ﻗﺒﻠﻲ ﻳﺎ اطلاعات ﺁﻣﺎﺭﻱ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺍﺯ ﺍﻟﮕﻮﻫﺎ، ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻧﻤﺎﻳﻴﻢ. ﺍﻟﮕﻮﻫﺎﻳﻲ ﻛﻪ ﻣﻲ ﺑﺎﻳﺴﺖ ﻛﻼﺳﻪ ﺑﻨﺪﻱ شوند،  ﻣﻌﻤﻮﻻً گروهی ﺍﺯ ﺳﻨﺠﺸﻬﺎ ﻳﺎ ﻣﺸﺎﻫﺪﺍﺕ ﻫﺴﺘﻨﺪ ﻛﻪ ﻣﺠﻤﻮﻋﻪ ﻧﻘﺎﻃﻲ ﺭﺍ ﺩﺭ ﻳﻚ ﻓﻀﺎﻱ ﭼﻨﺪ ﺑﻌﺪﻱ ﻣﻨﺎﺳﺐ ﺗﻌﺮﻳﻒ ﻣﻲ ﻧﻤﺎﻳﻨﺪ.
ﻳﻚ ﺳﻴﺴﺘﻢ ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮﻱ ﻛﺎﻣﻞ ﻣﺘﺸﻜﻞ ﺍﺳﺖ ﺍﺯ ﻳﻚ ﺣﺴﮕﺮ ﻛﻪ ﻣﺸﺎﻫﺪﺍﺗﻲ ﺭﺍ ﻛﻪ ﻣﻲبایست ﺗﻮﺻﻴﻒ ﻳﺎ ﻛﻼﺳﻪ بندی گردند جمع آوری می نماید، ﻳﻚ ﻣﻜﺎﻧﻴﺰﻡ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ كه اطلاعات عددی ﻳﺎ ﻧﻤﺎﺩﻳﻦ ( ﺳﻤﺒﻮﻟﻴﻚ ) ﺭﺍ ﺍﺯ ﻣﺸﺎﻫﺪﺍﺕ ﻣﺤﺎﺳﺒﻪ می كند و  ﻳﻚ ﻧﻈﺎﻡ ﻛﻼﺳﻪ بندی یا ﺗﻮﺻﻴﻒ ﺍﻟﮕﻮﻫﺎ ﺭﺍ ﺑﺎ ﺗﻜﻴﻪ ﺑﺮ ﻭﻳﮋﮔﻴﻬﺎﻱ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﻋﻬﺪﻩ دار است. شكل زیر ﺑﻠﻮﻙ ﺩﻳﺎﮔﺮﺍﻡ ﻳﻚ ﺳﻴﺴﺘﻢ ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ ﺭﺍ ﻧﺸﺎﻥ می دهد همانطور كه از ﭘﻴﻜﺎﻧﻬﺎﻱ ﺑﺮﮔﺸﺘﻲ ﻣﺸﺨﺺ ﺍﺳﺖ، ﺍﻳﻦ ﺑﻠﻮﻛﻬﺎ ﻟﺰﻭﻣﺎً ﻣﺴﺘﻘﻞ ﻧﻴﺴﺘﻨﺪ ﻭ ﺑﺴﺘﻪ ﺑﻪ ﻧﺘﺎﻳﺞ ﺣﺎﺻﻠﻪ ﻣﻤﻜﻦ ﺍﺳﺖ ﻻﺯﻡ ﺑﺎﺷﺪ ﻛﻪ ﺑﻠﻮكﻫﺎﻱ ﺍﻭﻟﻴﻪ ﻣﺠﺪﺩﺍً ﻃﺮﺍﺣﻲ ﮔﺮﺩﻧﺪ ﺗﺎ ﺭﺍﻧﺪﻣﺎﻥ ﻛﻠﻲ ﺳﻴﺴﺘﻢ ﺑﻬﺒﻮﺩ ﻳﺎﺑﺪ.
 
شکل (1)  ﺑﻠﻮﻙ ﺩﻳﺎﮔﺮﺍﻡ ﻳﻚ ﺳﻴﺴﺘﻢ ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ

ﺑﺎﺯﺷﻨﺎﺳﻲ ﺍﻟﮕﻮ ﺩﺭ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﺯﻣﻴﻨﻪها ﻧﻘﺶ ﻛﺎﺭبردی دارد. ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ، ﺑﺎﺯﺷﻨﺎﺳﻲ  ﻧﻮﻳﺴﻨﺪﻩ ﺗﺼﺪﻳﻖ ﺍﻣﻀﺎﺀ ، ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﺍﺛﺮ ﺍﻧﮕﺸﺖ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﮔﻔﺘﺎﺭ ﻧﻤﻮﻧﻪ ﻫﺎﻳﻲ ﺍﺯ ﺍﻳﻦ ﻛﺎﺭﺑﺮﺩﻫﺎ ﻫﺴﺘﻨﺪ.
 ﺑﺎﺯﺷﻨﺎﺳﻲ ﻧﻮﺭﻱ ﺣﺮﻭﻑ OCR
ﺩﺭ ﭼﻨﺪ ﺩﻫﺔ ﮔﺬﺷﺘﻪ مسئله ﺑﺎﺯﺷﻨﺎﺳﻲ ﺍﻟﮕﻮﻫﺎﻱ ﻧﻮﺷﺘﺎﺭﻱ ﺷﺎﻣﻞ ﺣﺮﻭﻑ، ﺍﺭﻗﺎﻡ ﻭ ﺳﺎﻳﺮ ﻧﻤﺎﺩﻫﺎﻱ ﻣﺘﺪﺍﻭﻝ ﺩﺭ ﺍﺳﻨﺎﺩ ﻣﻜﺘﻮﺏ ﺷﺪﻩ ﺑﻪ ﺯﺑﺎﻧﻬﺎﻱ ﻣﺨﺘﻠﻒ، ﺗﻮﺳﻂ ﮔﺮﻭﻫﻬﺎﻱ ﻣﺨﺘﻠﻔﻲ ﺍﺯ ﻣﺤﻘﻘﻴﻦ ﻣﻮﺭﺩ ﻣﻄﺎلعه و ﺑﺮﺭﺳﻲ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ ﺍﺳﺖ ﻧﺘﻴﺠه ﺍﻳﻦ ﺗﺤﻘﻴﻘﺎﺕ ﻣﻨﺠﺮ ﺑﻪ ﭘﻴﺪﺍﻳﺶ ﻣﺠﻤﻮﻋﻪ ﺍﻱ ﺍﺯ ﺭﻭﺷﻬﺎﻱ ﺳﺮﻳﻊ ﻭ ﺗﺎ ﺣﺪ ﺯﻳﺎﺩﻱ ﻣﻄﻤﺌﻦ ﻣﻮﺳﻮﻡ ﺑﻪ OCR یا « ﺑﺎﺯﺷﻨﺎﺳﻲ ﻧﻮﺭﻱ ﺣﺮﻭﻑ » ﺑﻤﻨﻈﻮﺭ ﻭﺍﺭﺩ ﻧﻤﻮﺩﻥ اطلاعات ﻣﻮﺟﻮﺩ ﺩﺭ  ﺍﺳﻨﺎﺩ، ﻣﺪﺍﺭﻙ، ﻛﺘﺎﺑﻬﺎ ﻭ ﺳﺎﻳﺮ ﻣﻜﺘﻮﺑﺎﺕ ﭼﺎﭘﻲ ﻳﺎ ﺗﺎﻳﭗ ﺷﺪﻩ ﻭ ﺣﺘﻲ ﺩﺳﺘﻨﻮﻳﺲ ﺑﻪ ﺩﺍﺧﻞ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺷﺪﻩ ﺍﺳﺖ  ﻫﻨﮕﺎﻣﻲ ﻛﻪ ﻳﻚ ﺳﻨﺪ ﻣﺘﻨﻲ ﺍﺳﻜﻦ ﻣﻲ ﺷﻮﺩ، ﻛﺎﻣﭙﻴﻮﺗﺮ ﺍﻳﻦ ﻣﺘﻦ ﺭﺍ ﺑﺼﻮﺭﺕ ﻳﻚ ﺗﺼﻮﻳﺮ ﮔﺮﺍﻓﻴﻜﻲ ﺗﺸﺨﻴﺺ ﻣﻲ ﺩﻫﺪ ﺩﺭ ﻧﺘﻴﺠﻪ ﻛﺎﺭﺑﺮﺍﻥ ﻗﺎﺩﺭ ﻧﺨﻮﺍﻫﻨﺪ ﺑﻮﺩ ﻛﻪ ﻣﺘﻦ ﻣﻮﺟﻮﺩ ﺩﺭ ﺗﺼﻮﻳﺮ ﺳﻨﺪ ﺭﺍ ﻭﻳﺮﺍﻳﺶ ﻧﻤﺎﻳﻨﺪ ﻭ ﻳﺎ ﺁﻥ ﺭﺍ ﻣﻮﺭﺩ ﺟﺴﺘﺠﻮ ﻗﺮﺍﺭ ﺩﻫﻨﺪ.   ﻳﻚ ﻧﺮﻡ ﺍﻓﺰﺍﺭ OCR ﺍﻳﻦ ﻣﺘﻦ ﺍﺳﻜﻦ ﺷﺪﻩ ﺭا ﺧﻮﺍﻧﺪﻩ و ﻣﺤﺘﻮﻳﺎﺕ ﺁﻧﺮﺍ  ﺷﻨﺎﺳﺎﻳﻲ ﻧﻤﻮﺩﻩ ﻭ ﺑﺼﻮﺭﺕ ﻳﻚ ﻓﺎﻳﻞ ﺩﺭ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺫﺧﻴﺮﻩ ﻣﻲ ﺳﺎﺯﺩ.
استفاده از سیستم های  OCR دو مزیت عمده دارد:
الف) افزایش چشمگیر سرعت دسترسی به اطلاعات؛ زیرا در متن برخلاف تصویر، امکان جستجو و ویرایش وجود دارد.
ب) کاهش فضای ذخیره سازی؛ زیرا حجم فایل متنی استخراج شده از یک تصویر، معمولا بسیار کمتر از حجم خود فایل تصویری است.    
ﭼﻨﻴﻦ ﻗﺎﺑﻠﻴﺘﻲ ﺍﻣﻜﺎﻥ ﺍﺳﺘﻔﺎﺩه ﮔﺴﺘﺮﺩﻩ ﺍﺯ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺭﺍ ﺩﺭ ﭘﺮﺩﺍﺯﺵ ﺳﺮﻳﻊ ﺣﺠﻢ ﻭﺳﻴﻌﻲ ﺍﺯ ﺩﺍﺩﻩ ﻫﺎی ﻣﻜﺘﻮﺏ ﺗﻮﻟﻴﺪ ﺷﺪﻩ ﺗﻮﺳﻂ ﺍﺩﺍﺭه ﭘﺴﺖ ﻭ ﺷﺮﻛﺘﻬﺎ ﻭ ﻣﺆﺳﺴﺎﺕ ﻣﺨﺘﻠﻒ ﻧﻈﻴﺮ ﺑﺎﻧﻜﻬﺎ، ﺷﺮﻛﺘﻬﺎی ﺑﻴﻤﻪ و ﻣﺆﺳﺴﺎﺕ ﺧﺪﻣﺎﺕ ﻋﻤﻮﻣﻲ و ﺳﺎﻳﺮ ﻧﻬﺎﺩﻫﺎﻳﻲ ﻛﻪ ﺳﺎﻟﻴﺎﻧﻪ ﺑﺎ ﻣﻴﻠﻴﻮﻧﻬﺎ ﻣﻮﺭﺩ ﭘﺮﺩﺍﺧﺖ، ﺩﺭﻳﺎﻓﺖ ﻭ ﺣﺴﺎﺑﺮﺳﻲ ﺍﻣﻮﺭ ﻣﺸﺘﺮﻳﺎﻥ ﺧﻮﺩ ﻣﻮﺍﺟﻬﻨﺪ، ﻓﺮﺍﻫﻢ ﻣﻲ ﺁﻭﺭﺩ .





طبقه بندی: optical character recognition (ocr)،

تاریخ : یکشنبه 26 دی 1389 | 12:52 ق.ظ | نویسنده : Me
ﺗﺎﺭﻳﺨﭽه ﺳﻴﺴﺘﻤﻬﺎﻱ  OCR
   از جنبه تاریخی سیستم های OCR تا کنون سه مرحله تکاملی را پشت سر گذاشته اند:

ﺍﻟﻒ ) ﻣﺮﺣﻠﺔ ﺗﻜﻮﻳﻦ : (از سال 1900 تا 1980)
ﺭﺩ ﭘﺎﻱ ﺍﻭﻟﻴﺔ ﺍﻗﺪﺍﻣﺎﺕ ﺻﻮﺭﺕ ﮔﺮﻓﺘﻪ ﺩﺭ ﺯﻣﻴﻨﺔ ﺑﺎﺯﺷﻨﺎﺳﻲ حروف را ﺩﺭ ﺳﺎﻟﻬﺎﻱ ﺍﻭﻝ ﺩﻫﺔ 1900 می ﺗﻮﺍﻥ ﻳﺎﻓﺖ ﻭ ﺁﻥ ﺯﻣﺎﻧﻲ ﺍﺳﺖ ﻛﻪ Tyuring ﺩﺍﻧﺸﻤﻨﺪ ﺭوسی بر آن بود  ﻛﻪ ﺑﻪ ﺍﻓﺮﺍﺩ ﻣﺒﺘﻼ ﺑﻪ ﻧﺎﺭﺳﺎﻳﻴﻬﺎﻱ ﺑﻴﻨﺎﻳﻲ ﻛﻤﻚ ﻧﻤﺎﻳﺪ و ﺍﻭﻟﻴﻦ ﺍﺧﺘﺮﺍﻉ های ﺛﺒﺖ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﺯﻣﻴﻨﻪ مربوط به سالهای 1929 و 1933 هستند
ﺍﻳﻦ ﺳﻴﺴﺘﻢ ﻫﺎ ﺣﺮﻭﻑ ﭼﺎﭘﻲ ﺭﺍ ﺑﺎ ﺭﻭﺵ ﺗﻄﺎﺑﻖ ﻗﺎﻟﺒﻲ ﺷﻨﺎﺳﺎﻳﻲ ﻣﻲ كردند. ﻣﺎﺳﻜﻬﺎﻱ ﻣﻜﺎﻧﻴﻜﻲ ﻣﺨﺘﻠﻔﻲ ﺍﺯ ﻣﻘﺎﺑﻞ ﺗﺼﻮﻳﺮ ﺣﺮﻑ ﻋﺒﻮﺭ می ﻛﺮﺩﻧﺪ و نور از یك سو ﺑﻪ ﺁﻥ ﺗﺎﺑﺎﻧﺪﻩ ﺷﺪﻩ ﻭ ﺍﺯ ﺳﻮﻱ ﺩﻳﮕﺮ ﺗﻮﺳﻂ ﻳﻚ ﺁﺷﻜﺎﺭﺳﺎﺯ ﻧﻮﺭﻱ ﺩﺭﻳﺎﻓﺖ ﻣﻲ شد. وقتی یك انطباق كامل صورت می گرفت ﻧﻮﺭ ﺑﻪ ﺁﺷﻜﺎﺭﺳﺎﺯ ﻧﻤﻲ ﺭﺳﻴﺪ ﻭ ﺣﺮﻑ ﻭﺭﻭﺩﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ شد. این ﺍﺧﺘﺮﺍﻉ ﺑﻪ ﺩﻟﻴﻞ ﺗﻜﻨﻮﻟﻮﮊﻱ ﺍﭘﺘﻮﻣﻜﺎﻧﻴﻜﻲ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺁﻧﻬﺎ ﻛﺎﺭﺑﺮﺩﻱ ﻧﺒﻮﺩ و ﺗﺼﻮﺭ ﺩﺳﺘﺮﺳﻲ ﺑﻪ ﺩﺳﺘﮕﺎﻫﻲ ﺑﺮﺍﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﺗﺎ ﺩﻫﻪ 1940 ﻣﻴﻼﺩﻱ ﻭ ﻇﻬﻮﺭ ﻛﺎﻣﭙﻴﻮﺗﺮﻫﺎﻱ ﺩﻳﺠﻴﺘﺎﻝ ﺑﺼﻮﺭﺕ ﻳﻚ ﺭﺅﻳﺎ ﺑﺎﻗﻲ ﻣﺎﻧﺪ.
ﺍﻗﺪﺍﻣﺎﺕ ﺍﻭﻟﻴﻪ ﺩﺭ ﺯﻣﻴﻨﺔ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ، ﺑﺮ ﺭﻭﻱ ﻣﺘﻮﻥ ﭼﺎﭘﻲ ﻭ ﻳﺎ ﻣﺠﻤﻮﻋﺔ ﻛﻮﭼﻜﻲ ﺍﺯ ﺣﺮﻭﻑ ﻭ ﻧﻤﺎﺩﻫﺎﻱ ﺩﺳﺘﻨﻮﻳﺲ ﻛﻪ ﺑﺮﺍﺣﺘﻲ ﻗﺎﺑﻞ ﺗﺸﺨﻴﺺ ﺑﻮﺩﻧﺪ، ﻣﺘﻤﺮﻛﺰ ﮔﺮﺩﻳﺪﻩ ﺑﻮﺩ. ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﭼﺎﭘﻲ ﻛﻪ ﺩﺭ ﺍﻳﻦ ﻣﻘﻄﻊ ﺯﻣﺎﻧﻲ ﻣﻌﺮﻓﻲ ﺷﺪﻧﺪ، ﻋﻤﺪﺗﺎً ﺍﺯ ﺭﻭﺵ ﺗﻄﺎﺑﻖ ﻗﺎﻟﺒﻲ ﺍﺳﺘﻔﺎﺩﻩ می نمودند ﻛﻪ ﺩﺭ ﺁﻥ ﺗﺼﻮﻳﺮ ﻭﺭﻭﺩﻱ ﺑﺎ ﻛﺘﺎﺑﺨﺎﻧﻪ ای از تصاویر ﺣﺮﻭﻑ ﻣﻮﺭﺩ ﻣﻘﺎﻳﺴﻪ ﻗﺮﺍﺭ ﻣﻲ گرفت. در ﻣﻮﺭﺩ ﻣﺘﻮﻥ ﺩﺳﺘﻨﻮﻳﺲ ﻧﻴز ﺍﻟﮕﻮﺭﻳﺘﻤﻬﺎﻱ ﭘﺮﺩﺍﺯﺵ ﺗﺼﻮﻳﺮ ﻛﻪ ﻭﻳﮋﮔﻴﻬﺎﻱ ﺳﻄﺢ ﭘﺎﻳﻴﻦ را از تصاویر ﺍﺳﺘﺨﺮﺍﺝ ﻣﻲ كنند، ﺑﻪ ﺗﺼﺎﻭﻳﺮ ﺩﻭﺩﻭﻳﻲ ﺍﻋﻤﺎﻝ ﻣﻲ ﺷﺪ ﺗﺎ ﺑﺮﺩﺍﺭﻫﺎﻱ ﻭﻳﮋﮔﻲ ﺍﺳﺘﺨﺮﺍﺝ ﮔﺮﺩﻧﺪ. ﺳﭙﺲ ﺍﻳﻦ ﺑﺮﺩﺍﺭﻫﺎﻱ ﻭﻳﮋﮔﻲ ﺑﻪ ﻃﺒﻘﻪ ﻛﻨﻨﺪﻩ ﺁﻣﺎﺭﻱ ﺳﭙﺮﺩﻩ ﻣﻲ ﺷﺪﻧﺪ.
ﺩﺭ ﺍﻳﻦ ﺩﻭﺭﻩ، ﺗﺤﻘﻴﻘﺎﺕ ﻣﻮﻓﻖ ﺍﻣﺎ ﻣﻘﻴﺪﻱ ﺑﻴﺸﺘﺮ ﺑﺮ ﺭﻭﻱ ﺣﺮﻭﻑ ﻭ ﺍﻋﺪﺍﺩ لاتین ﺍﻧﺠﺎﻡ ﮔﺮﻓﺖ با ﺍﻳﻦ ﻭﺟﻮﺩ ﻣﻄﺎﻟﻌﺎﺕ ﭼﻨﺪﻱ ﻧﻴﺰ ﺩﺭ ﺯﻣﻴﻨﺔ ﺣﺮﻭﻑ ﮊﺍﭘﻨﻲ، ﭼﻴﻨﻲ، ﻋﺒﺮﻱ، ﻫﻨﺪﻱ، ﺳﻴﺮﻳﻠﻴﻜﻲ، ﻳﻮﻧﺎﻧﻲ ﻭ ﻋﺮﺑﻲ ﺩﺭ ﻫﺮ ﺩﻭ ﺯﻣﻴﻨﺔ ﺣﺮﻭﻑ ﭼﺎﭘﻲ ﻭ ﺩﺳﺘﻨﻮﻳﺲ ﺁﻏﺎﺯ ﮔﺮﺩﻳﺪ ﺑﺎ ﻇﻬﻮﺭ ﺻﻔﺤﺎﺕ ﺭﻗﻮﻣﻲ كننده ( ﺩﻳﺠﻴﺘﺎﻳﺰﺭﻫﺎ ) در دهه 1950 كه ﻗﺎﺩﺭ ﺑﻪ ﺗﺸﺨﻴﺺ ﻣﺨﺘﺼﺎﺕ ﺣﺮﻛﺘﻲ ﻧﻮﻙ ﻳﻚ ﻗﻠﻢ ﻣﺨﺼﻮﺹ ﺑﻮﺩﻧﺪ، ﺳﻴﺴﺘﻤﻬﺎﻱ OCR ﺗﺠﺎﺭﻱ ﻧﻴﺰ ﺍﻣﻜﺎﻥ ﻋﺮﺿﻪ ﻳﺎﻓﺘﻨﺪ. ﺍﻳﻦ ﻧﻮﺁﻭﺭﻱ ﺳﺒﺐ ﺷﺪ ﻛﻪ ﻣﺤﻘﻘﺎﻥ ﺑﺘﻮﺍﻧﻨﺪ ﺩﺭ ﺯﻣﻴﻨﺔ بازشناسایی حروف دست نویس فعالیت خود را آغاز نمایند.


ب ) ﻣﺮﺣﻠﺔ توسعه: (از سال 1980 تا 1990)
ﻣﻄﺎﻟﻌﺎﺕ ﺻﻮﺭﺕ ﮔﺮﻓﺘﻪ ﺗﺎ ﻗﺒﻞ ﺍﺯ ﺳﺎﻝ 1980 ﺍﺯ ﻓﻘﺪﺍﻥ سخت افزارهای ﻛﺎﻣﭙﻴﻮﺗﺮﻱ ﻗﺪﺭﺗﻤﻨﺪ ﻭ ﺩﺳﺘﮕﺎﻫﻬﺎﻱ ﺍﺧﺬ ﺩﺍﺩﻩها رنج می بردند. در ﺍﻳﻦ ﺩﻫﻪ ﺑﻮﺍﺳﻄﺔ ﺭﺷﺪ ﺍﻧﻔﺠﺎﺭﮔﻮﻧﺔ ﺗﻜﻨﻮﻟﻮﮊﻱ اطلاعات، ﻭﺿﻌﻴﺖ ﺑﺴﻴﺎﺭ ﻣﻨﺎﺳﺒﻲ ﺑﺮﺍﻱ ﺯﻣﻴﻨﻪ ﻫﺎﻱ ﺗﺤﻘﻴﻘﺎﺗﻲ ﻣﺨﺘﻠﻒ ﺍﺯ ﺟﻤﻠﻪ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻓﺮﺍﻫﻢ ﮔﺮﺩﻳﺪ. ﺭﻭﺷﻬﺎﻱ ﺳﺎﺧﺘﺎﺭﻱ ﺑﻪ ﻫﻤﺮﺍﻩ ﺭﻭﺷﻬﺎﻱ ﺁﻣﺎﺭﻱ ﺩﺭ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﺳﻴﺴﺘﻤﻬﺎ ﻇﺎﻫﺮ ﮔﺮﺩﻳﺪﻧﺪ.  ﺗﺤﻘﻴﻘﺎﺕ ﺩﺭ ﺯﻣﻴﻨﺔ OCR ﺍﺳﺎﺳﺎً ﺗﻮﺟﻪ ﺧﻮﺩ ﺭﺍ ﺑﻪ ﺭﻭﺷﻬﺎﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺍﺷﻜﺎﻝ ﺑﺪﻭﻥ ﺗﻮﺟﻪ ﺑﻪ ﻫﺮﮔﻮﻧﻪ اطلاعات ﻣﻌﻨﺎﺷﻨﺎﺧﺘﻲ ﻣﻌﻄﻮﻑ ﻧﻤﻮﺩ. این مسئله سبب ﮔﺮﺩﻳﺪ ﻛﻪ ﻧﺮﺥ ﺑﺎﺯﺷﻨﺎﺳﻲ نتواند ﺍﺯ ﻳﻚ ﺣﺪ ﺧﺎﺹ ﻓﺮﺍﺗﺮ ﺭﻭﺩ. ﻛﻪ ﺩﺭ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﻛﺎﺭﺑﺮﺩﻫﺎﻱ OCR ﻗﺎﺑﻞ ﻗﺒﻮﻝ ﻧﺒﻮﺩ.


ج ) ﻣﺮﺣﻠﺔ بهبود: (از سال 1990 به بعد)
ﺩﺭ ﺍﻳﻦ ﻣﻘﻄﻊ ﺯﻣﺎﻧﻲ ﺑﻮﺩ ﻛﻪ ﺑﺎ ﺗﻜﻮﻳﻦ ﺍﺑﺰﺍﺭﻫﺎ ﻭ ﺗﻜﻨﻴﻜﻬﺎﻱ ﭘﺮﺩﺍﺯﺷﻲ ﺟﺪﻳﺪ، ﭘﻴﺸﺮﻓﺖ ﻭﺍﻗﻌﻲ ﺳﻴﺴﺘﻤﻬﺎﻱ OCR ﻣﺤﻘﻖ ﮔﺮﺩﻳﺪ. ﺩﺭ ﺍﻭﺍﻳﻞ ﺩﻫﺔ 1990 ﺭﻭﺷﻬﺎﻱ ﭘﺮﺩﺍﺯﺵ ﺗﺼﻮﻳﺮ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺍﻟﮕﻮ ﺑﺎ ﺗﻜﻨﻴﻜﻬﺎﻱ ﻛﺎﺭﺁﻣﺪ ﻫﻮﺵ ﻣﺼﻨﻮﻋﻲ (AI) ﺍﺩﻏﺎﻡ ﮔﺸﺘﻨﺪ. ﻣﺤﻘﻘﺎﻥ ﺍﻟﮕﻮﺭﻳﺘﻤﻬﺎﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﭘﻴﭽﻴﺪﻩ ﺭﺍ ﺍﺑﺪﺍع ﻧﻤﻮﺩﻧﺪ ﻛﻪ ﻗﺎﺩﺭ بودند ﺩﺍﺩﻩ ﻫﺎﻱ ﻭﺭﻭﺩﻱ ﺑﺎ ﺗﻔﻜﻴﻚ پذیری ﺑﺎﻻ ﺭﺍ ﺩﺭﻳﺎﻓﺖ ﻛﻨﻨﺪ ﻭ ﺩﺭ ﻣﺮﺣﻠﺔ ﭘﻴﺎﺩﻩ سازی، ﻣﺤﺎﺳﺒﺎﺕ ﺑﺴﻴﺎﺭ ﺯﻳﺎﺩﻱ ﺭﺍ ﺑﺮ ﺭﻭﻱ ﺩﺍﺩﻩ ﺍﻧﺠﺎﻡ ﺩﻫﻨﺪ. كه عبارتند از شبكه های عصبی ، منطق فازی و پردازش زبانهای طبیعی و غیره. 



طبقه بندی: optical character recognition (ocr)،

تاریخ : یکشنبه 26 دی 1389 | 12:51 ق.ظ | نویسنده : Me
 ocrدر ایران چگونه آغاز شد؟

ماجرا از ثبت‌نام داوطلبان آزمون «سازمان ملی پرورش استعدادهای درخشان (تیزهوشان)» در سال 1380 ‎آغاز شد. ثبت‌نام از روی فرم‌هایی كه توسط دانش‌آموزان تكمیل می‌شد انجام می‌گرفت. دانش‌آموزان شركت‌كننده در آزمون ــ مانند آزمون‌های سراسری ــ باید نام، نام خانوادگی، نام پدر، نام شهرستان محل تولد و سكونت، نام مدرسه و دین خود را در داخل كادرهای مربعی شكل و به صورت حروف مقطع (یعنی هر حرف داخل یك كادر) می‌نوشتند. وقتی كه همة فرم‌ها از طریق پست به سازمان مركزی برگزاركننده آزمون می‌رسید، عدة زیادی تایپیست متن آنها را دوباره وارد رایانه می‌كردند. در واقع همان حرف‌های داخل كادر را دوباره تایپ می‌كردند تا اطلاعات شناسنامه‌ای هر دانش‌آموز به صورت دیجیتالی درآید. این روش هم بسیار زمان‌بُر بود و هم نیاز به تعداد زیادی تایپیست داشت. احتمال داشت كه تایپیست‌ها هم هنگام تایپ اشتباه كنند و با ثبت نادرست یك نام، مشخصات فردی در رایانه مركزی وارد شود كه اصلاً متولد نشده است! مثلاً فرض كنید تایپیست محترم نام «جواد» را، كه داخل كادرها به صورت «ج.و.ا.د» نوشته شده بود،« فؤاد» تایپ می‌كرد؛ در آن صورت در كارت شناسایی جواد سابق، فؤاد فعلی ثبت می‌شد! (جوادِ موجود حذف می‌شد و فؤاد ناموجود وارد فهرست داوطلبان می‌شد!) افزون بر این، هزینة كار نیز بسیار زیاد بود.
به علت همین مشكلات، در بهمن‌ماه 1380، نخستین طرح OCR برای بازشناسی حروف فارسی توسط كامپیوتر ارائه شد و در سال‌های 1381 و 1382 نیز ثبت‌نام آزمون تیزهوشان به یاری این نرم‌افزار انجام شد.
در زبان‌های دیگر، به ویژه زبان‌هایی كه با حروف لاتینی نوشته می‌شوند، سال‌هاست كه از OCR استفاده می‌شود. اما در ایران تازه دو سه سالی است كه به فكر استفاده از OCR در زبان فارسی افتاده‌ایم.
و اما OCR چند نوع است: یا تایپی است یا دست‌نویس. یعنی یا باید یك متن قبلاً تایپ شده را (مثل كتاب‌ها و روزنامه‌های چندین سال قبل، یا حتی متنی را كه فایل تایپی آن موجود نیست و فقط پرینت آن را داریم) وارد رایانه كنیم، یا متن دست‌نویس را. متن‌های دست‌نویس هم به دو صورت «گسسته» و «پیوسته» وجود دارند: متن «دست‌نویس پیوسته» مثل همان چیزهایی است كه ما هر از گاهی كه دلمان تنگ می‌شود روی كاغذ می‌نویسیم، یا یك نامه، یا یك قطعه شعر و ... اما متن «دست‌نویس گسسته» همان نوشته‌‌هایی است كه حروف آن جدا از هم و به صورت گسسته نوشته شده‌اند، مثل نام و نام‌خانوادگی كه در فرم‌های آزمون ثبت‌نام، به صورت هر حرف داخل یك كادر، نوشته می‌شوند. طراحی OCR گسستة فارسی تقریباً در مراحل پایانی كار قرار دارد ولی، OCR پیوسته ظاهراً سال‌های زیادی كار می‌برد. «رضا صدیق» و «پرویز رزازی»، كه در رشتة مخابرات تحصیل كرده‌اند و مسئولان یك شركت كامپیوتری به نام «اندیشه نرم‌افزار پایا» هستند، برای اولین بار به طور جدی پروژة OCR فارسی را دنبال كرده‌اند. رزازی كه دانشجوی مخابرات و مسئول بخش پردازش سیگنال شركت «پایا» و مدیر پروژة OCR در این شركت است، می‌گوید : « OCR در دنیا موضوعی ناشناخته نیست، و بر روی آن زیاد كار شده است، ولی در ایران با آنكه مدت‌هاست روی آن كار شده، اما بسیاری از این كارها در حد كارهای دانشگاهی و مقاله‌های علمی باقی‌مانده بود و تبدیل به یك محصول كاربردی در ابعاد وسیع (مثل ثبت‌نام آزمون‌های بزرگ) نشده بود. ما بر روی این طرح كار كردیم و هدفمان هم این بود كه محصول را به شكل صنعتی آن تولید كنیم. البته غیر از شركت «پایا»، دو شركت دیگر نیز با حمایت دبیرخانه طرح «تكفا» (توسعه كاربرد فناوری اطلاعات و ارتباطات) مشغول پژوهش و آزمایش بر روی OCR فارسی هستند. یكی از این شركت‌ها «داده‌پردازان دوران نوین» نام دارد كه مدیریت آن را دكتر «حسام فیلی» بر عهده دارد. دكتر فیلی متخصص در رشتة هوش مصنوعی، از دانشگاه صنعتی شریف، است و شركت «دوران نوین» را از سال 1381، با هدف كار تخصصی بر روی پروژه‌های هوش مصنوعی تأسیس كرده است. او دربارة چگونگی پیوستن شركتش به این طرح می‌گوید: «از تیرماه سال 82 با شروع فعالیت طرح «تكفا» و حمایت‌های مالی آنها، این شركت تصمیم گرفت كه در زمینة طراحی OCR فارسی پژوهش و فعالیت كند. این پروژه در شركت «دوران نوین» با همكاری آقای دكتر «ابراهیمی مقدم» كه او هم از دانشجویان دورة دكتری هوش مصنوعی دانشگاه صنعتی شریف است، انجام می‌گیرد.
ﭘﻴﺪﺍﻳﺶ ﻋﻠﻮﻡ ﻭ ﻓﻨﻮﻥ ﺟﺪﻳﺪ، ﺟﻮﺍﻣﻊ ﺑﺸﺮﻱ ﺭﺍ ﺑﺎ ﺷﻜﻠﻬﺎﻱ ﻣﺨﺘﻠﻔﻲ ﺍﺯ اطلاعات ﺭﻭﺑﺮﻭ ﻧﻤﻮﺩﻩ است ﺳﻄﺢ ﺗﻮﺳﻌﺔ ﻳﻚ ﺟﺎﻣﻌﻪ ﺭﺍ ﻣﻲ ﺗﻮﺍﻥ ﺑﺎ ﻣﻘﺪﺍﺭ اطلاعات ﻭ ﺩﺍﻧﺶ ﺗﻮﻟﻴﺪ ﺷﺪﻩ ﺩﺭ ﺁﻥ ﺍﺭﺯﻳﺎﺑﻲ ﻛﺮﺩ. ﺗﻮﻟﻴﺪ ﻓﺰﺍﻳﻨﺪﺓ اطلاعات ﺑﻪ ﺷﻜﻠﻬﺎﻱ ﻣﺨﺘﻠﻒ ﺻﻮﺭﺕ ﻣﻲ گیرد و با درجات متفاوتی ﺍﺯ ﭘﻴﭽﻴﺪﮔﻲ ﻫﻤﺮﺍﻩ می باشد. ﺩﺭ ﻧﺘﻴﺠﻪ ﻧﻴﺎﺯ ﺑﻪ ﺳﻴﺴﺘﻤﻬﺎﻱ ﭘﺮﺩﺍﺯﺵ اطلاعات ﺑﺼﻮﺭﺕ ﺭﻭﺯﺍﻓﺰﻭﻥ ﺍﻓﺰﺍﻳﺶ ﻣﻲ یابد یكی از ﻣﺴﺎﺋﻞ ﻣﻬﻢ ﺩﺭ ﻃﺮﺍﺣﻲ ﺳﻴﺴﺘﻤﻬﺎﻱ ﻣﺪﺭﻥ ﺍﻃﻼﻋﺎﺗﻲ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺧﻮﺩﻛﺎﺭ ﺍﻟﮕﻮﻫﺎ ﺍﺳﺖ.

ﺑﺮﺧﻲ ﻭﻳﮋﮔﻴﻬﺎﻱ ﻣﺘﻮﻥ ﭼﺎﭘﻲ ﻓﺎﺭﺳﻲ
ﻧﮕﺎﺭﺵ ﻓﺎﺭﺳﻲ ﻭﻳﮋﮔﻴﻬﺎﻱ ﻣﻨﺤﺼﺮ ﺑﻪ ﻓﺮﺩﻱ ﺩﺍﺭﺩ ﻛﻪ ﺁﻥ ﺭﺍ ﻛﺎﻣﻼً ﺍﺯ ﻧﮕﺎﺭﺵ لاتین ﻣﺘﻤﺎﻳﺰ ﻣﻲسازد.
ﺑﻤﻨﻈﻮﺭ ﻓﻌﺎﻟﻴﺖ ﺩﺭ ﺯﻣﻴﻨﺔ OCR فارسی ﺁﮔﺎﻫﻲ ﺍﺯ ﻗﻮﺍﻧﻴﻦ ﻧﮕﺎﺭﺷﻲ ﻭ ﻧﺤﻮﺓ ﭼﺎﭖ ﺣﺮﻭﻑ ﺩﺭ ﺍﻳﻦ ﺯﺑﺎﻥ ﺍﻣﺮﻱ ﺿﺮﻭﺭﻱ ﺍﺳﺖ. ﺩﺭ ﺍﻳﻨﺠﺎ ﺑﻪ ﻭﻳﮋﮔﻴﻬﺎﻱ ﻛﻠﻲ ﻧﮕﺎﺭﺵ ﻓﺎﺭﺳﻲ ﺍﺷﺎﺭﻩ ﻣﻲ ﺷﻮﺩ :

1-    ﻣﺘﻮﻥ ﻓﺎﺭﺳﻲ ﺑﺮﺧﻼﻑ متون لاتین ﺍﺯ ﭼﭗ ﺑﻪ ﺭﺍﺳﺖ ﻧﻮﺷﺘﻪ ﻣﻲشود.
2-     ﺩﺭ ﻛﻠﻤﺎﺕ ﻓﺎﺭﺳﻲ ﺑﺮﺧﻲ ﺍﺯ ﺣﺮﻭﻑ ﺍﺯ ﻳﻚ ﻳﺎ ﺩﻭ ﻃﺮﻑ ﺑﻪ ﺣﺮﻭﻑ ﻣﺠﺎﻭﺭ ﺧﻮﺩ ﺍﺗﺼﺎﻝ ﺩﺍﺷﺘﻪ ﻭ ﺑﺮﺧﻲ ﻧﻴﺰ ﺑﺼﻮﺭﺕ ﻣﺠﺰﺍ ﻧﻮﺷﺘﻪ ﻣﻲ ﺷﻮﻧﺪ. ﺩﺭ ﻧﺘﻴﺠﻪ ﻫﺮ ﻛﻠﻤﻪ ﻣﻤﻜﻦ ﺍﺳﺖ ﺷﺎﻣﻞ ﻳﻚ ﻳﺎ ﭼﻨﺪ ﺑﺨﺶ ﻣﺘﺼﻞ ﺑﺎﺷﺪ ﻛﻪ « ﺯﻳﺮﻛﻠﻤﻪ » ﻧﺎﻣﻴﺪﻩ ﻣﻲ ﺷﻮﻧﺪ. (الف)
3-    ﺣﺮﻭﻑ ﻓﺎﺭﺳﻲ ﻣﻲﺗﻮﺍﻧﻨﺪ ﭼﻬﺎﺭ ﻣﻮﻗﻌﻴﺖ ﻣﺠﺰﺍ ﻭ ﺩﺭ ﻧﺘﻴﺠﻪ ﭼﻬﺎﺭ ﺷﻜﻞ ﻣﺘﻔﺎﻭﺕ ﻧﮕﺎﺭﺵ ﺩﺍﺷﺘﻪ باشند. ﺣﺮﻭﻑ ﺍﺑﺘﺪﺍﻳﻲ، ﻣﻴﺎﻧﻲ، ﺍﻧﺘﻬﺎﻳﻲ ﻭ ﻣﺠﺰﺍ. (ب)
4-     ﺣﺮﻭﻑ ﻭﺍﻗﻊ ﺩﺭ ﻳﻚ ﻛﻠﻤﻪ ﻣﻤﻜﻦ ﺍﺳﺖ ﻫﻤﭙﻮﺷﺎﻧﻲ ﺩﺍﺷﺘﻪ ﺑﺎﺷﻨﺪ، ﺑﺪﻳﻦ ﻣﻌﻨﻲ ﻛﻪ ﻧﺘﻮﺍﻥ ﺑﺎ ﺭﺳﻢ ﺧﻄﻮﻁ ﻋﻤﻮﺩﻱ، ﺣﺮﻭﻑ ﺭﺍ ﺑﻄﻮﺭ ﻛﺎﻣﻞ ﺍﺯ ﻳﻜﺪﻳﮕﺮ ﻣﺠﺰﺍ ﻧﻤﻮﺩ. (ج)
5-    ﺑﺮﺧﻲ ﺍﺯ ﻓﻮﻧﺘﻬﺎ ﺑﻌﻀﻲ ﺍﺯ ﺣﺮﻭﻑ ﺩﺭ ﺩﻭ ﻣﺤﻞ ﺑﻪ ﻳﻜﺪﻳﮕﺮ ﺍﺗﺼﺎﻝ ﺩﺍﺭﻧﺪ (د)
6-    ﺑﺮﺧﻲ ﺍﺯ ﺣﺮﻭﻑ ﺑﻴﻦ ﻳﻚ ﺗﺎ ﺳﻪ ﻋﺪﺩ ﻧﻘﻄﻪ ﺩﺍﺭﻧﺪ ﻛﻪ ﻣﻤﻜﻦ ﺍﺳﺖ ﺩﺭ ﺑﺎﻻ ﻳﺎ ﭘﺎﻳﻴﻦ ﺑﺪﻧﺔ ﺣﺮﻑ ﻭﺍﻗﻊ ﺑﺎﺷﻨﺪ.
7-    ﺩﺭ ﺑﻌﻀﻲ ﺍﺯ ﺣﺮﻭﻑ ﺑﺪﻧﺔ ﻣﺸﺎﺑﻪ ﺩﺍﺭﻧﺪ ﻭ ﺗﻔﺎﻭﺕ ﺁﻧﻬﺎ ﺗﻨﻬﺎ ﺩﺭ ﺗﻌﺪﺍﺩ ﻭ ﻣﺤﻞ ﻗﺮﺍﺭﮔﻴﺮﻱ ﻧﻘﺎﻁ ﺁﻧﻬﺎﺳﺖ (ﻩ)
8-    ﺣﺮﻭﻑ ﻓﺎﺭﺳﻲ ﻣﻲ ﺗﻮﺍﻧﻨﺪ ﺩﺭ ﺑﺎﻻ ﻳﺎ ﭘﺎﻳﻴﻦ ﺑﺪﻧﺔ ﺧﻮﺩ ﺩﺍﺭﺍﻱ ﺍﻋﺮﺍﺏ ﺑﺎﺷﻨﺪ. سه اعراب ﺩﺭ ﺯﺑﺎﻥ ُ  ِ  َ در زبان فارسی ﺍﻋﺮﺍﺑﻬﺎﻱ ﺍﺻﻠﻲ ﺑﻮﺩﻩ و ﺍﻋﺮﺍﺏ ً ﺩﺭ ﺑﺮﺧﻲ ﻛﻠﻤﺎﺕ ﻋﺮﺑﻲ ﺭﺍﻳﺞ ﺩﺭ ﺯﺑﺎﻥ ﻓﺎﺭﺳﻲ ﺩﻳﺪﻩ ﻣﻲ ﺷﻮﺩ. ﻛﻠﻤﺎﺕ ﻋﺮﺑﻲ ﺩﺍﺭﺍﻱ اعراب  ٍ   ٌ  ﺩﺭ ﺯﺑﺎﻥ ﻓﺎﺭﺳﻲ ﻋﻤﻮﻣﻴﺖ ندارد.
9-    ﺩﺭ ﺑﺎﻻﻱ ﺑﺪﻧﺔ ﻳﻚ ﺣﺮﻑ ﻣﻤﻜﻦ ﺍﺳﺖ ﻋﻼﻣﺖ ﺗﺸﺪﻳﺪ ﻭﺟﻮﺩ ﺩﺍﺷﺘﻪ ﺑﺎﺷﺪ.
10-ﺑﺮﺧﻲ ﺍﺯ ﺣﺮﻭﻑ ﺷﺎﻣﻞ ﻫﻤﺰﻩ ﻫﺴﺘﻨﺪ.
11-ﺣﺮﻭﻓﻲ ﻛﻪ ﺍﺯ ﻃﺮﻑ ﭼﭗ ﻗﺎﺑﻠﻴﺖ ﺍﺗﺼﺎﻝ ﺑﻪ ﺣﺮﻑ ﻣﺠﺎﻭﺭ ﺧﻮﺩ ﺭﺍ ﺩﺍﺭﻧﺪ، ﻣﻲ ﺗﻮﺍﻧﻨﺪ ﺑﺼﻮﺭﺕ ﻛﺸﻴﺪﻩ ﻧﻮﺷﺘﻪ ﺷﻮﻧﺪ.
ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﺧﻮﺩ ﺯﻳﺮﻣﺠﻤﻮﻋﻪ ﺍﺯ ﺩﺳﺘﺔ بزرگی از ﺗﻜﻨﻴﻜﻬﺎ ﺑه نامﺁﻧﺎﻟﻴﺰ ﺍﺳﻨﺎﺩ ﺍﺳﺖ ﻛﻪ ﻣﺒﺤﺚ ﺍﺻﻠﻲ ﺍﻳﻦ ﻃﺮﺡ می باشد.
هدف از مبحث آنالیز اسناد، شناسایی اجزای متنی، گرافیكی و عكس در تصاویر اسناد و استخراج اطلاعات مورد نظر از آنها می باشد. آنایز اسناد مشتمل بر كلیه مراحل پردازشی است كه محتویات یك سند اسكن یا دورنگاری شده چند صفحه ای را به یك فرم الكترونیكی مناسب كد می كنند. این كد كردن می توان چندین شكل داشته باشد : یك توصیف قابل ویرایش، یك نمایش فشرده كه تصویر سند از ان قابل بازیابی باشد و یا یك توصیف معناشناختی سطح بالا كه به منظور پاسخگویی به پرس و جوها می توان بكار رود.


تاریخ : یکشنبه 26 دی 1389 | 12:50 ق.ظ | نویسنده : Me

ﺍﻧﻮﺍﻉ ﺳﻴﺴﺘﻤﻬﺎﻱ OCR

ﺩﺭ ﻳﻚ ﺗﻘﺴﻴﻢ كلی می توان سیستمهای OCR را به ﻟﺤﺎﻅ ﻧﻮﻉ ﺍﻟﮕﻮﻱ ﻭﺭﻭﺩﻱ ﺑﻪ ﺩﻭ ﮔﺮﻭﻩ ﺍﺻﻠﻲ ﺗﻘﺴﻴﻢ ﻛﺮﺩ :
الف ) ﺳﻴﺴﺘم های ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺘﻮﻥ ﭼﺎﭘﻲ
ب ) ﺳﻴﺴﺘم های ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺘﻮﻥ ﺩﺳﺘﻨﻮﻳﺲ
ﻫﺮ ﻳﻚ ﺍﺯ ﺍﻳﻦ ﮔﺮﻭﻫﻬﺎ ﺗﻜﻨﻴﻜﻬﺎﻱ ﺧﺎﺹ ﺧﻮﺩ ﺭﺍ ﺩﺍﺭﻧﺪ. همچنین ﺍﺯ ﺟﻨﺒﺔ ﻧﺤﻮﺓ ﻭﺭﻭﺩ اطلاعات، سیستمهای OCR به دو دسته زیر تقسیم میﺷﻮﻧﺪ :
الف ) ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺮﺧﻂ (OnLine)
ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺮﺧﻂ، حروف در همان زمان نگارش ﺗﻮﺳﻂ ﺳﻴﺴﺘﻢ ﺗﺸﺨﻴﺺ ﺩﺍﺩه می شوند. دستگاههای ورودی ﺍﻳﻦ ﺳﻴﺴﺘﻤﻬﺎ ﻳﻚ ﻗﻠﻢ ﻧﻮﺭﻱ ﺍﺳﺖ. ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ ﻋﻼﻭﻩ ﺑﺮ اطلاعات ﻣﺮﺑﻮﻁ ﺑﻪ ﻣﻮﻗﻌﻴﺖ قلم، اطلاعات ﺯﻣﺎﻧﻲ ﻣﺮﺑﻮﻁ ﺑﻪ ﻣﺴﻴﺮ ﻗﻠﻢ ﻧﻴﺰ ﺩﺭ ﺍﺧﺘﻴﺎﺭ می باشد. ﺍﻳﻦ اطلاعات ﻣﻌﻤﻮﻻً ﺗﻮﺳﻂ ﻳﻚ صفحه Digitizer اخذ می شوند.
ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ ﻣﻲ توان ﺍﺯ اطلاعات ﺯﻣﺎﻧﻲ، ﺳﺮﻋﺖ، شتاب، ﻓﺸﺎﺭ ﻭ ﺯﻣﺎﻥ برداشتن و گذاشتن قلم روی صفحه در بازشناسایی استفاده كرد.
ب ) ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺮﻭﻥ ﺧﻂ (OutLine)
ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺮﻭﻥ خط، ﺍﺯ ﺗﺼﻮﻳﺮ ﺩﻭ ﺑﻌﺪی ﻣﺘﻦ ﻭﺭﻭﺩی ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲشود. ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ ﺑﻪ ﻫﻴﭻ ﻧﻮﻉ ﻭﺳﻴﻠﻪ ﻧﮕﺎﺭﺵ ﺧﺎﺻﻲ ﻧﻴﺎﺯ ﻧﻴﺴﺖ ﻭ ﺗﻔﺴﻴﺮ ﺩﺍﺩﻩ ﻣﺴﺘﻘﻞ ﺍﺯ ﻓﺮﺁﻳﻨﺪ ﺗﻮﻟﻴﺪ ﺁﻧﻬﺎ ﺗﻨﻬﺎ ﺑﺮﺍﺳﺎﺱ ﺗﺼﻮﻳﺮ ﻣﺘﻦ ﺻﻮﺭﺕ ﻣﻲ’گیرد. ﺍﻳﻦ ﺭﻭﺵ ﺑﻪ ﻧﺤﻮﺓ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺗﻮﺳﻂ انسان ﺷﺒﺎﻫﺖ ﺑﻴﺸﺘﺮﻱ ﺩﺍﺭﺩ.


ﺑﺨﺸﻬﺎﻱ ﻣﺨﺘﻠﻒ ﻳﻚ ﺳﻴﺴﺘﻢ OCR ﻛﺎﻣﻞ

ﻳﻚ ﺳﻴﺴﺘﻢ OCR ﻛﺎﻣﻞ مركب از 5 ﻗﺴﻤﺖ ﺍﺻﻠﻲ زیر می باشد :

الف ) ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ  (Preprocessing):
ﺷﺎﻣﻞ ﻛﻠﻴه ﺍﻋﻤﺎﻟﻲ ﻛﻪ ﺭﻭﻱ ﺳﻴﮕﻨﺎﻝ ﺗﺼﻮﻳﺮﻱ ﺧﺎﻡ ﺻﻮﺭﺕ ﻣﻲ ﮔﻴﺮﻧﺪ ﺗﺎ موجب ﺗﺴﻬﻴﻞ ﺭﻭﻧﺪ ﺍﺟﺮﺍﻱ ﻓﺎﺯﻫﺎﻱ ﺑﻌﺪﻱﮔﺮﺩﻧﺪ؛ ﻣﺎﻧﻨﺪ ﺑﺎﻳﻨﺮﻱ ﻛﺮﺩﻥ ﺗﺼﻮﻳﺮ ، ﺣﺬﻑ ﻧﻮﻳﺰ ، ﻫﻤﻮﺍﺭﺳﺎﺯﻱ، ﻧﺎﺯﻛﺴﺎﺯﻱ ، ﺗﺸﺨﻴﺺ ﺯﺑﺎﻥ ﻭ ﻓﻮﻧﺖ ﻛﻠﻤﺎﺕ و ﻧﻈﺎﻳﺮ ﺍﻳﻨﻬﺎ
.

ب) قطعه بندی (Segmentation) :
ﻋﺒﺎﺭﺕ ﺍﺳﺖ ﺍﺯ ﺭﻭﺷﻬﺎﻳﻲ ﻛﻪ ﺑﺨﺸﻬﺎﻱ ﻣﺨﺘﻠﻔﻲ ﻫﻤﭽﻮﻥ ﭘﺎﺭﺍﮔﺮﺍﻓﻬﺎ، ﺟﻤﻼﺕ ﻳﺎ ﻛﻠﻤﺎﺕ ﻭ ﺣﺮﻭﻑ ﺭﺍ ﺍﺯ ﺗﺼﻮﻳﺮﺳﻨﺪ ﺍﺳﺘﺨﺮﺍﺝ ﻣﻲ ﻧﻤﺎﻳﻨﺪ.

ج ) ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ (Feature Extraction) :
ﻣﺠﻤﻮﻋﺔ از ﻛﻠیه ﻣﺤﺎﺳﺒﺎﺗﻲ است ﻛﻪ ﺭﻭﻱ ﺍﻟﮕﻮﻫﺎﻱ ﺑﺪﺳﺖ ﺁﻣﺪﻩ ﺍﺯ ﻣﺮحله ﭘﻴﺶ پردازش ﺍﻧﺠﺎﻡ ﻣﻲ شود ﺗﺎ ﺑﺮﺩﺍﺭ ﻭﻳﮋﮔﻴﻬﺎﻱ ﻣﺘﻨﺎﻇﺮ ﺑﺎ ﻫﺮ ﺍﻟﮕﻮ ﺗﻌﻴﻴﻦ گردد.

د ) ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺎ ﻳﻚ ﻳﺎ ﭼﻨﺪ ﻃﺒﻘﻪ بندی كننده (Classification & Recognition):
ﺷﺎﻣﻞ ﺭﻭﺷﻬﺎﻳﻲ ﺑﺮﺍﻱ ﻣﺘﻨﺎﻇﺮ ﺳﺎﺧﺘﻦ ﻫﺮ ﻳﻚ ﺍﺯ ﺍﻟﮕﻮﻫﺎﻱ ﺑﺪﺳﺖ ﺁﻣﺪﻩ ﺍﺯ ﻣﺮﺣﻠﺔ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ ﺑﺎ ﻳﻜﻲ ﺍﺯ ﻛﻼﺳﻬﺎﻱ ﻓﻀﺎﻱ ﺍﻟﮕﻮﻫﺎﻱ ﻣﻮﺭﺩ ﺑﺤﺚ ﺍﺳﺖ ﻛﻪ ﺍﺯ ﻃﺮﻳﻖ ﻛﻤﻴﻨﻪ ﺳﺎﺧﺘﻦ ﻓﺎصله ﺑﺮﺩﺍﺭ ﻭﻳﮋﮔﻴﻬﺎی ﻫﺮ ﺍﻟﮕﻮ ﻧﺴﺒﺖ ﺑﻪ ﻳﻜﻲ ﺍﺯ ﺑﺮﺩﺍﺭﻫﺎﻱ ﻣﺮﺟﻊ ﻣﻮﺟﻮﺩ ﺩﺭ ﭘﺎﻳﮕﺎﻩ ﺩﺍﺩﻩ های ﺳﻴﺴﺘﻢ ﺍﻧﺠﺎﻡ ﻣﻲ ﮔﻴﺮﺩ.

هـ ) ﺑﻜﺎﺭﮔﻴﺮﻱ اطلاعات ﺟﺎﻧﺒﻲ (ﭘﺲ ﭘﺮﺩﺍﺯﺵ) :
ﻣﺎﻧﻨﺪ ﻣﺠﻤﻮﻋﻪ اطلاعات ﺁﻣﺎﺭﻱ ﻣﺮﺑﻮﻁ به رخداد حروف ، اطلاعات ﺩﺳﺘﻮﺭﻱ ﻭ ﻣﻌﻨﺎﻳﻲ.
 




طبقه بندی: optical character recognition (ocr)،

تاریخ : یکشنبه 26 دی 1389 | 12:49 ق.ظ | نویسنده : Me
ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ :
ﺍﻳﻦ ﻣﺮﺣﻠﻪ ﺷﺎﻣﻞ ﻛﻠﻴﺔ ﭘﺮﺩﺍﺯﺷﻬﺎﻳﻲ ﺍﺳﺖ ﻛﻪ ﺑﺮ ﺭﻭﻱ ﺳﻴﮕﻨﺎﻟﻬﺎﻱ ﺗﺼﻮﻳﺮﻱ ﺧﺎﻡ ﺍﻧﺠﺎﻡ ﻣﻲ ﺷﻮﻧﺪ. ﺗﺎ ﻣﻮﺟﺐ ﺗﺴﻬﻴﻞ ﻳﺎ ﺍﻓﺰﺍﻳﺶ ﺩﻗﺖ ﺭﻭﻧﺪ ﺍﺟﺮﺍﻱ ﻓﺎﺯﻫﺎﻱ ﺑﻌﺪﻱ ﮔﺮﺩﻧﺪ. ﺍﺯ ﻣﺠﻤﻮﻋﺔ ﺍﻳﻦ ﭘﺮﺩﺍﺯﺷﻬﺎ، ﻫﺪﻓﻬﺎﻱ ﺯﻳﺮ ﺩﻧﺒﺎﻝ ﻣﻲ ﺷﻮﺩ :
1-    ﻛﺎﻫﺶ ﻧﻮﻳﺰ
2-    ﻧﺮﻣﺎﻟﻴﺰﻩ ﻧﻤﻮﺩﻥ ﺩﺍﺩهﻫﺎ
3-    ﻓﺸﺮﺩﻩ ﺳﺎﺯﻱ ﻣﻴﺰﺍﻥ ﺍﻃﻼﻋﺎﺗﻲ ﻛﻪ ﻣﻲ ﺑﺎﻳﺴﺖ ﻣﺤﻔﻮﻅ ﺑﻤﺎﻧﺪ.
4-    ﺑﺎﺯﺷﻨﺎﺳﻲ ﺧﻂ ، ﺯﺑﺎﻥ ﻭ ﻓﻮﻧﺖ

1-كاهش نویز :
ﻧﻮﻳﺰ ﺍﻳﺠﺎﺩ ﺷﺪﻩ ﺑﻮﺍﺳﻄﺔ ﺩﺳﺘﮕﺎﻫﻬﺎﻱ ﺍﺳﻜﻨﺮ ﻧﻮﺭﻱ ﻳﺎ ﺍﺑﺰﺍﺭﻫﺎﻱ ﻧﮕﺎﺭﺷﻲ ﻣﻨﺠﺮ ﺑﻪ ﺍﻳﺠﺎﺩ ﻗﻄﻌﻪ ﺧﻄﻬﺎﻱ ﮔﺴﺴﺘﻪ ، ﺍﺗﺼﺎﻝ ﺑﻴﻦ ﺧﻄﻮﻁ، ﻓﻀﺎﻫﺎﻱ ﺧﺎﻟﻲ ﺩﺭ ﺧﻄﻮﻁ ﻣﺘﻦ، ﭘﺮ ﺷﺪﻥ ﺣﻔﺮه‌های ﻣﻮﺟﻮﺩ ﺩﺭ ﺗﺼﻮﻳﺮ ﺑﺮﺧﻲ ﺣﺮﻭﻑ ﻭ ﻏﻴﺮﻩ ﻣﻲ ﮔﺮﺩﺩ. ﻫﻤﭽﻨﻴﻦ ﺍﻋﻮﺟﺎﺟﻬﺎﻱ ﻣﺨﺘﻠﻒ ﺷﺎﻣﻞ ﺗﻐﻴﻴﺮﺍﺕ ﻣﺤﻠﻲ، ﻣﻨﺤﻨﻲ ﺷﺪﻥ ﮔﻮﺷﻪ ﺣﺮﻭﻑ، ﺗﻐﻴﻴﺮ ﺷﻜﻞ ﻭ ﻳﺎ ﺧﻮﺭﺩﮔﻲ ﺣﺮﻭﻑ ﺭﺍ ﻧﻴﺰ ﺑﺎﻳﺴﺘﻲ ﻣﺪ ﻧﻈﺮ ﻗﺮﺍﺭ ﺩﺍﺩ. ﻗﺒﻞ ﺍﺯ. ﻣﺮﺣﻠﺔ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻻﺯﻡ ﺍﺳﺖ ﻛﻪ ﺍﻳﻦ ﻧﻘﺎﻳﺺ ﺑﺮﻃﺮﻑ ﺷﻮﻧﺪ. یكی از ﺗﻜﻨﻴﻜﻬﺎﻱ ﻣﺨﺘﻠﻒ ﻛﺎﻫﺶ ﻧﻮﻳﺰ فیلتر كردن می‌باشد :

1-1 : فیلتر كردن
ﺍﻳﻦ ﺭﻭﺵ ﺑﻪ ﺣﺬﻑ ﻧﻮﻳﺰ ﻛﻤﻚ ﻣﻲ ﻛﻨﺪ ﻭ ﻧﺎﺻﺎﻓﻴﻬﺎﻱ ﺑﺪﻧﺔ ﺣﺮﻭﻑ ﺭﺍ ﻛﻪ ﻣﻌﻤﻮﻻً ﺑﻮﺳﻴﻠﺔ ﺳﻄﻮﺡ ﻧﮕﺎﺭﺵ ﻧﺎﻫﻤﻮﺍﺭ ( ﺩﺭ ﻣﻮﺭﺩ ﻣﺘﻮﻥ ﺩﺳﺘﻨﻮﻳﺲ ) ﻭ ﻳﺎ ﻧﺮﺥ ﻧﻤﻮﻧﻪ ﺑﺮﺩﺍﺭﻱ ﺿﻌﻴﻒ ﺩﺳﺘﮕﺎﻫﻬﺎﻱ ﺍﺧﺬ ﺩﺍﺩﻩ ﺍﻳﺠﺎﺩ می‌شوند، كاهش می‌دهد. ﻓﻴﻠﺘﺮﻫﺎﻱ ﺣﻮﺯﺓ ﻣﻜﺎﻧﻲ ﻳﺎ ﻓﺮﻛﺎﻧﺴﻲ ﻣﺘﻌﺪﺩﻱ ﺭﺍ ﻣﻲ ﺗﻮﺍﻥ ﺑﺮﺍﻱ ﺍﻳﻦ ﻣﻨﻈﻮﺭ ﻃﺮﺍﺣﻲ ﻛﺮﺩ. ﺍﻳﺪﺓ ﺍﺻﻠﻲ ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ، ﻛﺎﻧﻮﻭﻟﻮ ﻛﺮﺩﻥ (Convolute) (به معنی پیچاپیچ كردن) یك ماسك از پیش تعریف شده با تصویر ﺟﻬﺖ ﺗﺨﺼﻴﺺ ﻳﻚ ﻣﻘﺪﺍﺭ ﺟﺪﻳﺪ ﺑﻪ ﭘﻴﻜﺴﻞ ﺑﺮﺣﺴﺐ ﺗﺎﺑﻌﻲ ﺍﺯ ﻣﻘﺎﺩﻳﺮ ﭘﻴﻜﺴﻠﻬﺎﻱ مجاور است. فیلترها ﺭﺍ ﻣﻲ ﺗﻮﺍﻥ ﺑﺮﺍﻱ ﻣﻘﺎﺻﺪ ﻣﺨﺘﻠﻔﻲ ﭼﻮﻥ ﻫﻤﻮﺍﺭﺳﺎﺯﻱ، ﺷﺎﺭﭖ ﻛﺮﺩﻥ ، ﺍﻋﻤﺎﻝ ﺳﻄﻮﺡ ﺁﺳﺘﺎﻧﻪ، ﺣﺬﻑ ﭘﺲ ﺯﻣﻴﻨﺔ ﺑﺎﻓﺖ ﮔﻮﻧﻪ ﻳﺎ ﺭﻧﮕﻲ ﺧﻔﻴﻒ ﻭ ﺗﻨﻈﻴﻢ ﻛﻨﺘﺮﺍﺳﺖ (ﭘﺎﺩﻧﻤﺎﻳﻲ) طراحی نمود.

2 : ﻧﺮﻣﺎﻟﻴﺰﻩ ﻧﻤﻮﺩﻥ ﺩﺍﺩهﻫﺎ :
ﺭﻭﺷﻬﺎﻱ ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﺩﺍﺩﻩ ﻫﺎﻱ ﺑﻪ ﺣﺬﻑ ﺗﻐﻴﻴﺮﺍﺕ ﻧﮕﺎﺭﺷﻲ ﻛﻤﻚ ﻧﻤﻮﺩﻩ و ﺩﺍﺩﻩهای ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺷﺪﻩﺍﻱ ﺭﺍ ﻧﺘﻴﺠﻪ ﻣﻲﺩﻫﺪ.
ﺭﻭﺷﻬﺎﻱ ﭘﺎﻳﺔ ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﻋﺒﺎﺭﺗﻨﺪ ﺍﺯ :
2-1 : ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﻛﺠﻲ ﻣﺘﻦ ﻭ ﺍﺳﺘﺨﺮﺍﺝ ﺧﻄﻮﻁ ﺯﻣﻴﻨﻪ :
ﺑﺪﻳﻞ ﻋﺪﻡ ﺩﻗﺖ ﺩﺭ ﻣﺮﺣﻠﺔ ﺍﺳﻜﻦ ﻭ ﻳﺎ ﺑﻲ ﺩﻗﺘﻲ ﻧﻮﻳﺴﻨﺪﻩ ﺩﺭ ﻫﻨﮕﺎﻡ ﻧﮕﺎﺭﺵ ﻣﺘﻦ ﺩﺳﺘﻨﻮﻳﺲ، ﻣﻤﻜﻦ است ﺧﻄﻮﻁ ﻣﺘﻦ ﻧﺴﺒﺖ ﺑﻪ ﺗﺼﻮﻳﺮ ﺍﻧﺪﻛﻲ ﺍﻧﺤﺮﺍﻑ ﻳﺎ ﭼﺮﺧﺶ ﺩﺍﺷﺘﻪ ﺑﺎﺷﻨﺪ، ﺍﻳﻦ ﻣﺴﺌﻠﻪ ﻣﻲ ﺗﻮﺍﻧﺪ ﻛﺎﺭﺍﻳﻲ ﺍﻟﮕﻮﺭﻳﺘﻤﻬﺎﻱ ﺑﻜﺎﺭ ﺭﻓﺘﻪ ﺩﺭ ﻃﺒﻘﺎﺕ ﺑﻌﺪﻱ ﺳﻴﺴﺘﻢ OCR ﺭﺍ ﺗﺄﺛﻴﺮ ﻗﺮﺍﺭ ﺩﻫﺪ؛ ﭼﺮﺍ ﻛﻪ ﻳﻜﻲ ﺍﺯ ﻣﻔﺮﻭﺿﺎﺕ ﺑﻴﺸﺘﺮ ﺭﻭﺷﻬﺎﻱ ﻗﻄﻌﻪ ﺑﻨﺪﻱ، ﻋﺪﻡ ﻛﺞ ﺑﻮﺩﻥ ﺗﺼﻮﻳﺮ ﻣﺘﻦ ﻭﺭﻭﺩﻱ ﺍﺳﺖ ﻭ ﺩﺭ ﻧﺘﻴﺠﻪ ﻻﺯﻡ ﺍﺳﺖ ﻛﻪ ﺍﻳﻦ ﻧﻘﻴﺼﻪ ﺁﺷﻜﺎﺭ ﻭ ﺗﺼﺤﻴﺢ ﮔﺮﺩﺩ. ﺁﺷﻜﺎﺭﺳﺎﺯﻱ ﺧﻂ ﺯﻣﻴﻨﻪ ﺩﺭ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﺗﻜﻨﻴﻜﻬﺎﻱ ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺘﻮﻥ ﻓﺎﺭﺳﻲ، ﻋﺮﺑﻲ ﻭ لاتین ﻧﻘﺶ ﺍﺳﺎﺳﻲ ﺩﺍﺭﺩ. ﻋﻼﻭﻩ ﺑﺮ ﺍﻳﻦ، ﺑﺮﺧﻲ ﺍﺯ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﻣﺎﻧﻨﺪ « g » ﻭ « 9 » ﺭﺍ ﻣﻲ ﺗﻮﺍﻥ ﺑﻮﺍﺳﻄﺔ ﻣﻮﻗﻌﻴﺖ ﻧﺴﺒﻲ ﺷﺎﻥ ﻧﺴﺒﺖ ﺑﻪ ﺧﻂ ﺯﻣﻴﻨﻪ ﺁﺷﻜﺎﺭ ﺳﺎﺧﺖ

3-1-2-2 : ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﺍﺭﻳﺐ ﺷﺪﮔﻲ :
ﺩﺭ ﻣﺘﻮﻥ ﭼﺎﭘﻲ فارسی ﻭ ﻻﺗﻴﻦ، ﻛﺎﺭﺍﻛﺘﺮﻫﺎﻱ ﺩﺍﺭﺍﻱ ﻓﺮﻣﺖ ﺍﻳﺘﺎﻟﻴﻚ ﺍﺯ ﺭﺍﺳﺘﺎﻱ ﻋﻤﻮﺩ ﺍﻧﺤﺮﺍﻑ دارند. ﻫﻤﭽﻨﻴﻦ ﺩﺭ ﻣﺘﻮﻥ ﺩﺳﺘﻨﻮﻳﺲ ﺑﺮﺧﻲ ﺍﺯ ﻧﻮﻳﺴﻨﺪﻩ ها ﺍﻳﻦ ﭘﺪﻳﺪﻩ ﺗﺤﺖ ﻋﻨﻮﺍﻥ « ﺷﺪﮔﻲ ﺍﺭﻳﺐ » ﺷﻨﺎﺧﺘﻪ ﻣﻲشود و می‌تواند ﺩﻗﺖ ﺑﺮﺧﻲ ﺍﺯ ﺍﻟﮕﻮﺭﻳﺘﻤﻬﺎﻱ ﻗﻄﻌﻪ بندی ﻳﺎ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺭﺍ ﺗﺤﺖ ﺗﺄﺛﻴﺮ ﻗﺮﺍﺭ ﺩﻫﺪ ﻭ ﻟﺬﺍ ﺩﺭ ﺍﻳﻦ ﺳﻴﺴﺘﻤﻬﺎ ﻻﺯﻡ ﺍﺳﺖ ﻛﻪ ﺩﺭ ﻣﺮﺣﻠﺔ ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ ﻣﻴﺰﺍﻥ ﺍﺭﻳﺐ ﺑﻮﺩﻥ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﺷﻨﺎﺳﺎﻳﻲ ﻭ ﺗﺼﺤﻴﺢ ﮔﺮﺩﺩ. اریب ﺷﺪﮔﻲ ﺑﺼﻮﺭﺕ ﺯﺍﻭﻳﺔ ﺷﻴﺐ ﺑﻴﻦ ﻃﻮﻳﻠﺘﺮﻳﻦ ﺯﻳﺮﺣﺮﻑ ﺩﺭ ﻳﻚ ﻛﻠﻤﻪ ﻭ ﺟﻬﺖ ﻋﻤﻮﺩﻱ ﺗﻌﺮﻳﻒ ﻣﻲ ﺷﻮﺩ. ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﺍﺭﻳﺐ، ﺑﻨﻈﻮﺭ ﻧﺮﻣﺎﻟﻴﺰﻩ ﻧﻤﻮﺩﻥ ﻛﻠﻴﺔ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﺑﻪ ﻳﻚ ﻓﺮﻡ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺑﻜﺎﺭ می‌رود. ﻣﻌﻤﻮﻟﺘﺮﻳﻦ ﺭﻭﺵ ﺩﺭ ﺗﺨﻤﻴﻦ ﻣﻴﺰﺍﻥ ﺍﺭﻳﺐ ﺷﺪﮔﻲ، ﻣﺤﺎﺳﺒﺔ ﺯﺍﻭﻳﺔ ﻣﺘﻮﺳﻂ ﺍﺟﺰﺍﺀ ﻧﺰﺩﻳﻚ ﺑﻪ ﺧﻂ ﻋﻤﻮﺩ ﺍﺳﺖ. در ﺍﺳﺘﺨﺮﺍﺝ ﺧﻄﻮﻁ ﻋﻤﻮﺩﻱ ﺍﺯ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﺑﻮﺳﻴﻠﺔ ﺩﻧﺒﺎﻝ ﻛﺮﺩﻥ ﻣﺆﻟﻔﻪ های ﻛﺪ ﺯﻧﺠﻴﺮﻩای ﺗﻮﺳﻂ ﻳﻚ ﺟﻔﺖ ﻓﻴﻠﺘﺮ ﻳﻚ ﺑﻌﺪﻱ ﺍﻧﺠﺎﻡ ﻣﻲﭘﺬﻳﺮﺩ. ﻣﺨﺘﺼﺎﺕ ﺷﺮﻭﻉ ﻭ ﭘﺎﻳﺎﻥ ﻫﺮ ﺧﻂ، ﺯﺍﻭﻳﺔ ﺍﺭﻳﺐ ﺭﺍ ﺑﺪﺳﺖ ﻣﻲ دهد.
 

شکل(12)ﺗﺨﻤﻴﻦ ﺯﺍﻭﻳﺔ ﺍﺭﻳﺐ ﺑﺎ ﻣﻼﺣﻈﺔ
ﺍﻟﻒ) ﺍﺟﺰﺍﺀ ﻧﺰﺩﻳﻚ ﺑﻪ ﺧﻂ ﻋﻤﻮﺩﻱ          ﺏ) ﺯﺍﻭﻳﺔ ﺷﻴﺐ ﻣﺘﻮﺳﻂ



3-1-2-3 : ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﺍﻧﺪﺍﺯﻩ (ﺗﻐﻴﻴﺮ ﻣﻘﻴﺎﺱ ﺩﺍﺩﻥ) :
ﺩﺭ ﺳﻴﺴﺘﻤﻬﺎﻱ OCR ﺍﻏﻠﺐ ﺗﺼﺎﻭﻳﺮ ﻛﻠﻤﺎﺕ ﺧﻴﻠﻲ ﻛﻮﭼﻚ ﻳﺎ ﺧﻴﻠﻲ ﺑﺰﺭﮒ ، ﺑﻪ ﻳﻚ ﺍﻧﺪﺍﺯﺓ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﻧﺮﻣﺎﻟﻴﺰﻩ ﻣﻲﺷﻮﻧﺪ. ﺍﻳﻦ ﻋﻤﻞ ﻣﻌﻤﻮﻻﹰ ﺑﺎ ﻧﻤﻮﻧﻪ ﺑﺮﺩﺍﺭﻱ ﻣﺠﺪﺩ ﺗﺼﻮﻳﺮ ﺍﻧﺠﺎﻡ ﻣﻲ ﮔﻴﺮﺩ.
روشهای بازشناسی حروف ممكن است نرمالیزه كردن اندازه را در هر دو جهت افقی و عمودی انجام دهند. هر كاراكتر به تعدادی ناحیه تقسیم می‌شود و هر یك از این نواحی بصورت جداگانه تغییر مقیاس داده می‌شوند.
 

شکل (13) ﻧﺮﻣﺎﻟﻴﺰﻩ ﻛﺮﺩﻥ ﺣﺮﻭﻑ l ﻭ e

3 : ﻓﺸﺮﺩﻩ ﺳﺎﺯﻱ ﻣﻴﺰﺍﻥ ﺍﻃﻼﻋﺎﺗﻲ ﻛﻪ ﻣﻲ ﺑﺎﻳﺴﺖ ﻣﺤﻔﻮﻅ ﺑﻤﺎﻧﺪ :
ﺍﻳﻦ ﻣﺴﺌﻠﻪ ﭘﺬﻳﺮﻓﺘﻪ ﺷﺪﻩ ﺍﺳﺖ ﻛﻪ ﺗﻜﻨﻴﻜﻬﺎﻱ ﻛﻼﺳﻴﻚ ﻓﺸﺮﺩﻩ ﺳﺎﺯﻱ ﺗﺼﺎﻭﻳﺮ ﻛﻪ ﺗﺼﻮﻳﺮ ﺭﺍ ﺍﺯ ﺣﻮﺯﺓ ﻣﻜﺎﻧﻲ ﺑﻪ ﺣﻮﺯﻩ ﺩﻳﮕﺮ ﻣﻨﺘﻘﻞ ﻣﻲ ﻛﻨﻨﺪ، ﺑﺮﺍﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﻨﺎﺳﺐ ﻧﻤﻲ ﺑﺎﺷﻨﺪ. در ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ، ﻋﻤﻞ ﻓﺸﺮﺩﻩ سازی ﻧﻴﺎﺯﻣﻨﺪ ﺁﻥ ﺩﺳﺘﻪ ﺍﺯ ﺗﻜﻨﻴﻜﻬﺎﻱ ﺣﻮﺯﺓ ﻣﻜﺎﻧﻲ ﺍﺳﺖ ﻛﻪ اطلاعات ﺷﻜﻠﻲ ﺭﺍ ﺣﻔﻆ ﻣﻲ ﻧﻤﺎﻳﻨﺪ.
ﺩﻭ ﺗﻜﻨﻴﻚ ﻣﺘﻌﺎﺭﻑ ﻓﺸﺮﺩﻩ ﺳﺎﺯﻱ، ﻳﻜﻲ ﺗﻜﻨﻴﻚ ﺍﻋﻤﺎﻝ ﺳﻄﺢ ﺁﺳﺘﺎﻧﻪ (ﺑﻤﻨﻈﻮﺭ ﺑﺎﻳﻨﺮﻱ ﻛﺮﺩﻥ ﺗﺼﺎﻭﻳﺮ ﺳﻄﺢ ﺧﺎﻛﺴﺘﺮﻱ ﻣﺘﻮﻥ) و دیگری ﺩﻳﮕﺮﻱ ﻧﺎﺯﻙ سازی می‌باشد.
 


شکل(14) اعمال ﻳﻚ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﻤﻮﺍﺭﺳﺎﺯﻱ ﺑﺮ ﻣﺘﻦ ﺩﺳﺘﻨﻮﻳﺲ
الف) ﺗﺼﻮﻳﺮ ﺍﺻﻠﻲ  ﺏ) یك ﻣﺮﺣﻠﻪ ﻫﻤﻮﺍﺭﺳﺎﺯﻱ  ج) دو ﻣﺮﺣﻠﻪ ﻫﻤﻮﺍﺭﺳﺎﺯﻱ


3-1-3-1 : ﺑﺎﻳﻨﺮﻱ ( ﺩﻭﺳﻄﺤﻲ ) ﻛﺮﺩﻥ ﺗﺼﻮﻳﺮ ﻣﺘﻦ:
ﺑﻤﻨﻈﻮﺭ ﻛﺎﻫﺶ ﺣﺠﻢ ﺫﺧﻴﺮﻩ ﺳﺎﺯﻱ ﻣﻮﺭﺩ ﻧﻴﺎﺯ ﻭ ﺍﻓﺰﺍﻳﺶ ﺳﺮﻋﺖ ﭘﺮﺩﺍﺯﺵ، ﺍﻏﻠﺐ ﻣﻄﻠﻮﺏ ﺍﺳﺖ ﻛﻪ ﺑﺎ ﺍﻧﺘﺨﺎﺏ ﻳﻚ ﺳﻄﺢ ﺁﺳﺘﺎﻧﻪ، ﺗﺼﺎﻭﻳﺮ ﺳﻄﺢ ﺧﺎﻛﺴﺘﺮﻱ ﻳﺎ ﺭﻧﮕﻲ ﺭﺍ ﺑﻪ ﺗﺼﺎﻭﻳﺮ ﺑﺎﻳﻨﺮﻱ ﺗﺒﺪﻳﻞ ﻧﻤﻮﺩ. دو ﺭﻭﺵ ﺍﻋﻤﺎﻝ ﺳﻄﺢ ﺁﺳﺘﺎﻧﻪ ﻋﺒﺎﺭﺗﻨﺪ ﺍﺯ سراسری (Global) و محلی (Local). ﺩﺭ ﺭﻭﺵ ﺍﻋﻤﺎﻝ ﺳﻄﺢ ﺁﺳﺘﺎﻧﺔ ﺳﺮﺍﺳﺮﻱ، ﻣﻘﺪﺍﺭ ﺳﻄﺢ ﺁﺳﺘﺎﻧﻪ ﺑﺮﺍﻱ ﻛﻞ ﺗﺼﻮﻳﺮ ﺳﻨﺪ ﺍﻧﺘﺨﺎﺏ ﻣﻲ شود. ﺍﻳﻦ ﻣﻘﺪﺍﺭ ﺍﻏﻠﺐ ﺑﺮ ﻣﺒﻨﺎﻱ ﺗﺨﻤﻴﻨﻲ ﺍﺯ سطح ﭘﺲ ﺯﻣﻴﻨﻪ ﻛﻪ ﺍﺯ ﻫﻴﺴﺘﻮﮔﺮﺍﻡ ﺳﻄﺢ ﺭﻭﺷﻨﺎﻳﻲ ﺗﺼﻮﻳﺮ ﻣﺤﺎﺳﺒﻪ ﻣﻲگردد، ﺳﻨﺠﻴﺪﻩ ﻣﻲ ﺷﻮﺩ. روش اعمال ﺳﻄﺢ ﺁﺳﺘﺎﻧﺔ ﻣﺤﻠﻲ ( ﺗﻄﺒﻴﻘﻲ ) ﺑﺮﺍﺳﺎﺱ اطلاعات ﻧﻮﺍﺣﻲ ﻣﺤﻠﻲ، ﺍﺯ ﻣﻘﺎﺩﻳﺮ ﻣﺘﻔﺎﻭﺗﻲ ﺑﺮﺍﻱ ﻫﺮ ﭘﻴﻜﺴﻞ ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲ ﻛﻨﺪ. ﻣﻘﺎﻳﺴﻪ ﺍﻱ ﺑﻴﻦ ﺗﻜﻨﻴﻜﻬﺎﻱ ﻣﻌﻤﻮﻝ ﺍﻋﻤﺎﻝ ﺳﻄﺢ ﺁﺳﺘﺎﻧﻪ ﺑﺼﻮﺭﺕ ﺳﺮﺍﺳﺮﻱ ﻭ ﻣﺤﻠﻲ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﻳﻚ ﻣﻌﻴﺎﺭ ﺍﺭﺯﻳﺎﺑﻲ ﺍﻧﺠﺎﻡ ﭘﺬﻳﺮﻓﺘﻪ ﺍﺳﺖ. ﺍﻳﻦ ﻣﻌﻴﺎﺭ ﺍﺭﺯﻳﺎﺑﻲ ﻋﺒﺎﺭﺕ ﺍﺳﺖ ﺍﺯ ﻣﻘﺎﻳﺴﺔ ﺩﻗﺖ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺻﺤﻴﺢ ﻳﻚ ﺳﻴﺴﺘﻢ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﺑﺎ ﺍﻋﻤﺎﻝ ﺗﻜﻨﻴﻜﻬﺎﻱ ﻣﺨﺘﻠﻒ ﺳﻄﺢ ﺁﺳﺘﺎﻧﻪ ﮔﺬﺍﺭﻱ.

3-1-3-2 : ﻧﺎﺯﻙ ﺳﺎﺯﻱ:
ﺍﻳﻦ ﻋﻤﻞ ﺩﺭﺣﺎﻟﻴﻜﻪ ﻛﺎﻫﺶ ﻗﺎﺑﻞ ﻣﻼﺣﻈﻪای ﺩﺭ ﺣﺠﻢ ﺩﺍﺩﻩ ایجاد میﻛﻨﺪ، اطلاعات ﺷﻜﻠﻲ ﻛﺎﺭﺍﻛﺘﺮ ﺭﺍ ﻧﻴﺰ ﺍﺳﺘﺨﺮﺍﺝ می ﻧﻤﺎﻳﺪ. ﺩﻭ ﺭﻭﺵ ﭘﺎﻳﻪ ﺑﺮﺍﻱ ﻧﺎﺯﻙ ﺳﺎﺯﻱ ﻋﺒﺎﺭﺗﻨﺪ ﺍﺯ :
-    ﻧﺎﺯﻙ ﺳﺎﺯﻱ ﺍﺯ ﻃﺮﻳﻖ ﭘﻴﻜﺴﻞ
-    ﻧﺎﺯﻙ ﺳﺎﺯﻱ ﻏﻴﺮ ﺍﺯ ﻃﺮﻳﻖ ﭘﻴﻜﺴﻞ
ﻧﺎﺯﻙ ﺳﺎﺯﻱ ﺍﺯ ﻃﺮﻳﻖ ﭘﻴﻜﺴﻞ ﺑﺼﻮﺭﺕ ﻣﺤﻠﻲ ﻭ ﺗﻜﺮﺍﺭﻱ ﺗﺼﻮﻳﺮ ﺭﺍ ﻣﻮﺭﺩ ﭘﺮﺩﺍﺯﺵ ﻗﺮﺍﺭ ﻣﻲ ﺩﻫﺪ ﺗﺎ ﻭﻗﺘﻲ ﻛﻪ ﺍﺯ ﺗﺼﻮﻳﺮ ﻛﺎﺭﺍﻛﺘﺮ ﺗﻨﻬﺎ ﺍﺳﻜﻠﺖ ﺁﻥ ﺑﻪ ﻋﺮﺽ ﻳﻚ ﭘﻴﻜﺴﻞ ﺑﺎﻗﻲ ﺑﻤﺎﻧﺪ. ﺍﻳﻦ ﺭﻭﺵ ﻧﺴﺒﺖ ﺑﻪ ﻧﻮﻳﺰ ﺑﺴﻴﺎﺭ ﺣﺴﺎﺱ ﺑﻮﺩﻩ، ﻣﻤﻜﻦ ﺍﺳﺖ ﺗﺼﻮﻳﺮ ﻛﺎﺭﺍﻛﺘﺮ ﺭﺍ ﻣﺨﺪﻭﺵ ﺳﺎﺯﺩ. ﺍﺯ ﺳﻮﻱ ﺩﻳﮕﺮ، ﺭﻭﺷﻬﺎﻱ ﻧﺎﺯﻙ ﺳﺎﺯﻱ ﻏﻴﺮ ﺍﺯ ﻃﺮﻳﻖ ﭘﻴﻜﺴﻞ، ﻃﻲ ﻓﺮﺍﻳﻨﺪ ﻧﺎﺯﻙ سازی ﻣﻘﺪﺍﺭﻱ ﺍﺯ اطلاعات ﺳﺮﺍﺳﺮﻱ ﺩﺭﺑﺎﺭﺓ ﻛﺎﺭﺍﻛﺘﺮ ﺭﺍ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻗﺮﺍﺭ ﻣﻲ ﺩﻫﻨﺪ. ﺍﻳﻦ ﺭﻭﺷﻬﺎ ﻳﻚ ﺧﻂ ﻣﺮﻛﺰﻱ ﻳﺎ ﻣﻴﺎﻧﺔ ﺑﺨﺼﻮﺹ ﺍﺯ ﺗﺼﻮﻳﺮ ﭘرتر ﺭﺍ ﺑﺪﻭﻥ ﺁﺯﻣﺎﻳﺶ ﻫﻤﺔ ﭘﻴﻜﺴﻠﻬﺎ ﺗﻮﻟﻴﺪ ﻣﻲ نمایند. 
 

شکل(15) ﺍﻋﻤﺎﻝ ﻋﻤﻠﻴﺎﺕ ﻧﺎﺯﻙ ﺳﺎﺯﻱ ﺑﺮ ﺭﻭﻱ ﻳﻚ ﺗﺼﻮﻳﺮ ﻣﺘﻨﻲ ﻧﻤﻮﻧﻪ

4 : ﺑﺎﺯﺷﻨﺎﺳﻲ ﺧﻂ ، ﺯﺑﺎﻥ ﻭ ﻓﻮﻧﺖ :
ﺑﺎﺯﺷﻨﺎﺳﻲ ﺧﻂ، ﺗﻌﺪﺍﺩ ﻛﻼﺳﻬﺎﻱ ﻣﺨﺘﻠﻒ ﺳﻤﺒﻞ ﻛﻪ ﺑﺎﻳﺴﺘﻲ ﻣﻮﺭﺩ ملاحظه ﻗﺮﺍﺭ ﮔﻴﺮﻧﺪ ﺭﺍ ﻛﺎﻫﺶ ﻣﻲ ﺩﻫﺪ. ﺷﻨﺎﺳﺎﻳﻲ ﺯﺑﺎﻥ ﻣﺘﻦ، ﺑﻤﻨﻈﻮﺭ ﺑﻜﺎﺭﮔﻴﺮﻱ ﻣﺪﻟﻬﺎﻱ ﻣﺘﻨﻲ ﺧﺎﺹ ﺿﺮﻭﺭت دارد. ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻓﻮﻧﺘﻬﺎ، ﺗﻌﺪﺩ ﺷﻜﻠﻬﺎﻱ ﻣﺨﺘﻠﻒ ﺣﺮﻭﻑ ﺩﺭ ﻫﺮ ﻛﻼﺱ كه می‌بایست ﺩﺭ ﻓﺮﺍﻳﻨﺪ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻟﺤﺎﻅ ﮔﺮﺩﺩ ﺭﺍ ﻛﺎﻫﺶ می‌دهد و سبب می‌شود كه امر شناسایی، تنها به یك كلاس فونت محدود گردد. ﺑﺎﺯﺷﻨﺎﺳﻲ خط و ﺯﺑﺎﻥ ﻭ ﻓﻮﻧﺖ ﺩﺭ ﻛﺎﺭﺑﺮﺩﻫﺎﻳﻲ ﻣﺎﻧﻨﺪ ﻧﻤﺎﻳﻪ سازی و ﺩﺳﺘﻜﺎﺭﻱ ﺍﺳﻨﺎﺩ نیز مطلوب می باشد.
 



طبقه بندی: optical character recognition (ocr)،

تاریخ : یکشنبه 26 دی 1389 | 12:48 ق.ظ | نویسنده : Me
 ﻗﻄﻌﻪ ﺑﻨﺪﻱ :
ﻣﺮﺣﻠﺔ ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ ﻳﻚ ﺗﺼﻮﻳﺮ ﺍﺻﻼﺡ ﺷﺪﻩ ﺍﺯ ﺳﻨﺪ ﺭﺍ ﻧﺘﻴﺠﻪ ﻣﻲ ﺩﻫﺪ ﺑﮕﻮﻧﻪ ﺍﻱ ﻛﻪ ﻣﻘﺪﺍﺭ ﻛﺎﻓﻲ ﺍﺯ اطلاعات ﺷﻜﻠﻲ، ﻓﺸﺮﺩﻩ ﺳﺎﺯﻱ ﺑﺎﻻ ﻭ ﻧﻮﻳﺰ ﭘﺎﻳﻴﻦ، ﺍﺯ ﺗﺼﻮﻳﺮ ﻧﺮﻣﺎﻟﻴﺰﻩ ﺷﺪﺓ ﺳﻨﺪ ﻗﺎﺑﻞ ﺣﺼﻮﻝ است. ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﻳﻚ ﻣﺮﺣﻠﺔ ﺑﺴﻴﺎﺭ ﺑﺎ ﺍﻫﻤﻴﺖ ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﺨﺼﻮﺻﺎﹰ ﺣﺮﻭﻑ ﻓﺎﺭﺳﻲ ﻭ ﻋﺮﺑﻲ ﻛﻪ ﺑﺼﻮﺭﺕ ﭘﻴﻮﺳﺘﻪ ﻧﻮﺷﺘﻪ ﻣﻲ ﺑﺎﺷﺪ؛ ﭼﺮﺍ ﻛﻪ ﻧﺘﻴﺠﺔ ﺑﺪﺳﺖ ﺁﻣﺪﻩ ﺍﺯ ﺟﺪﺍﺳﺎﺯﻱ ﻛﻠﻤﺎﺕ، ﺧﻄﻮﻁ ﻳﺎ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﻣﺴﺘﻘﻴﻤﺎً ﺑﺮ ﺭﻭﻱ ﻧﺮﺥ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺳﻴﺴﺘﻢ ﺗﺄﺛﻴﺮ ﻣﻲ ﮔﺬﺍﺭﺩ. ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﻏﻠﻂ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ، ﻋﺎﻣﻞ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﺧﻄﺎﻫﺎﻱ OCR است. مانند : nr →  mیا m →  nr
ﻣﻴﺰﺍﻥ ﺩﻗﺖ ﻳﻚ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﺑﻪ ﺳﺒﻚ ﻧﮕﺎﺭﺵ ﺣﺮﻭﻑ، ﻛﻴﻔﻴﺖ ﺩﺳﺘﮕﺎﻩ ﭘﺮﻳﻨﺖ، ﻛﺎﺭﺍﻛﺘﺮﻫﺎﻱ ﺍﻳﺘﺎﻟﻴﻚ ﻟﻜﻪ ﺷﺪﻩ و ﻧﻴﺰ ﻧﺴﺒﺖ ﺍﻧﺪﺍﺯﺓ ﻓﻮﻧﺖ ﺑﻪ ﺭﺯﻭﻟﻮﺷﻦ ﺩﺳﺘﮕﺎﻩ ﺍﺳﻜﻨﺮ ﺑﺴﺘﮕﻲ ﺩﺍﺭﺩ.
 

شکل(16) ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﻳﻚ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ

ﺩﻭ ﻧﻮﻉ ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﻭﺟﻮﺩ ﺩﺍﺭﺩ :
الف ) ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﺑﻴﺮﻭﻧﻲ، ﻛﻪ ﻋﺒﺎﺭﺕ ﺍﺳﺖ ﺍﺯ ﺟﺪﺍﺳﺎﺯﻱ ﺑﺨﺸﻬﺎﻱ ﻣﺨﺘﻠﻒ ﻧﮕﺎﺭﺵ ﻣﺎﻧﻨﺪ ﭘﺎﺭﺍﮔﺮﺍﻓﻬﺎ، ﺟﻤﻼﺕ ﻳﺎ ﻛﻠﻤﺎﺕ
ب ) ﻗﻄﻌﻪ ﺑﻨﺪﻱ درونی، ﻛﻪ ﻣﻨﻈﻮﺭ ﺍﺯ ﺁﻥ، ﺟﺪﺍﺳﺎﺯﻱ ﺣﺮﻭﻑ ﻛﻠﻤﺎﺕ ﻣﺨﺼﻮﺻﺎً ﺩﺭ ﻣﻮﺭﺩ ﻛﻠﻤﺎﺕ ﺳﺮ ﻫﻢ ﻧﻮﺷﺘﻪ ﺷﺪﻩ ﺩﺭ ﻣﺘﻮﻥ لاتین ﻭ ﻳﺎ ﺭﺳﻢﺍﻟﺨﻄﻬﺎﻱ ﭘﻴﻮﺳﺘﻪ ﻧﻈﻴﺮ ﻓﺎﺭﺳﻲ ﻭ ﻋﺮﺑﻲ ﺍﺳﺖ.

ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﺑﻴﺮﻭﻧﻲ :
ﺩﺭ ﻣﻮﺍﺭﺩﻱ ﻫﻤﭽﻮﻥ ﻣﺘﻮﻥ ﻓﺎﺭﺳﻲ ﻛﻪ ﺣﺮﻭﻑ ﺑﺼﻮﺭﺕ ﺳﺮﻫﻢ ﻧﻮﺷﺘﻪ ﻣﻲ ﺷﻮﻧﺪ، ﺳﻪ ﺭﻭﻳﻜﺮﺩ ﻣﺨﺘﻠﻒ ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺮﻭﻥ ﺧﻂ ﻣﺘﻮﻥ ﻛﻠﻤﺎﺕ ﻳﺎ ﺯﻳﺮكلمات ﻭﺟﻮﺩ ﺩﺍﺭﺩ.
الف ) ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﻛﻠﻤﺎﺕ
ب ) ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻠﻤﻪ ﺑﻪ ﻋﻨﻮﺍﻥ ﻳﻚ ﺍﻟﮕﻮﻱ ﻭﺍحد
ج ) ﺭﻭﻳﻜﺮﺩ ﺗﺮﻛﻴﺒﻲ

ﻗﻄﻌﻪ ﺑﻨﺪﻱ درﻭﻧﻲ :
ﺩﺭ ﺭﻭﻳﻜﺮﺩ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺒﺘﻨﻲ ﺑﺮ ﺟﺪﺍﺳﺎﺯﻱ، ﺍﺑﺘﺪﺍ ﻛﻠﻤﻪ ﺩﺭ ﻣﺮﺣﻠﺔ ﺟﺪﺍﺳﺎﺯﻱ ﺑﻪ ﺣﺮﻭﻑ ﻳﺎ ﺯﻳﺮ ﺣﺮﻭﻑ ﺷﻜﺴﺘﻪ ﻣﻲ ﺷﻮﻧﺪ.
ﺁﻧﮕﺎﻩ ﻗﻄﻌﺎﺕ ﺟﺪﺍ ﺷﺪﻩ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ شوند و ﺍﺯ ﻛﻨﺎﺭ ﻫﻢ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻦ ﺁﻧﻬﺎ ﻛﻠﻤﻪ خواهد ﺷﺩ؛ ﺭﻭﺷﻬﺎﻱ ﺑﻜﺎﺭﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﺭﻭﻳﻜﺮﺩ ﺑﻪ ﺩﻭ ﮔﺮﻭﻩ ﻣﺨﺘﻠﻒ ﺗﻘﺴﻴﻢ ﻣﻲ ﺷﻮﻧﺪ :
-    ﺗﻘﻄﻴﻊ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ
-    ﺗﻘﻄﻴﻊ ﻛﻠﻤﻪ ﺑﻪ ﺯﻳﺮﺣﺮﻭﻑ
ﺩﺭ ﮔﺮﻭﻩ ﺍﻭﻝ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ ﺟﺪﺍﺳﺎﺯﻱ می ﺷﻮﺩ ﻭ ﺑﺎ ﺷﻨﺎﺳﺎﻳﻲ ﺣﺮﻭﻑ ﺟﺪﺍ ﺷﺪﻩ، ﻛﻠﻤﻪ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ ﮔﺮﺩﺩ. ﺭﻭﻳﻜﺮﺩ ﺑﻜﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﮔﺮﻭﻩ ﺭﺍ ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﺟﺪﺍﺳﺎﺯﻱ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﻲ ﻧﺎﻣﻨﺪ.
ﺩﺭ ﮔﺮﻭﻩ ﺩﻭ، ﻛﻠﻤﻪ ﺑﻪ ﺯﻳﺮﺣﺮﻭﻑ ﻣﺜﻞ ﭘﺎﺭﻩ ﻣﻨﺤﻨﻲ ﻫﺎ ﻭ ﺳﺎﺧﺘﺎﺭﻫﺎﻱ ﭘﺎﻳﺔ ﺩﻳﮕﺮ ﺟﺪﺍﺳﺎﺯﻱ ﻣﻲ شود و ﺑﺎ ﺷﻨﺎﺳﺎﻳﻲ ﺯﻳﺮﺣﺮﻭﻑ ﻭ ﺗﺮﻛﻴﺐ ﺁﻧﻬﺎ ﻛﻠﻤﻪ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ ﮔﺮﺩﺩ. ﺩﺭ ﺭﻭﻳﻜﺮﺩ ﺑﻜﺎﺭ گرفته شده در ﮔﺮﻭﻩ ﺩﻭﻡ ﻛﻪ ﺍﺻﻄﻼﺣﺎﹲ ﺟﺪﺍﺳﺎﺯﻱ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺗﻮﺃﻡ ﻧﺎﻣﻴﺪﻩ ﻣﻲ شود. نمیﺗﻮﺍﻥ ﺩﺭ ﺍﺑﺘﺪﺍ ﻣﺮﺯ ﺣﺮﻭﻑ ﺭﺍ ﺑﻄﻮﺭ ﻛﺎﻣﻞ ﻣﺸﺨﺺ ﻛﺮﺩ. ﺑﻠﻜﻪ ﺣﺮﻭﻑ ﺍﺯ ﺍﺑﺘﺪﺍ ﺑﻪ ﺍﻧﺘﻬﺎﻱ ﻛﻠﻤﻪ ﺑﻪ ﺗﺮﺗﻴﺐ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻭ  ﺟﺪﺍﺳﺎﺯﻱ ﻣﻲ ﺷﻮﻧﺪ. ﺩﺭ ﻫﻴﭽﻜﺪﺍﻡ ﺍﺯ ﺩﻭ ﺷﻜﻞ ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﺟﺪﺍﺳﺎﺯﻱ، ﺑﻪ ﺷﻜﻞ ﻛﻠﻲ ﻛﻠﻤﻪ ﺗﻮﺟﻬﻲ نمی ﺷﻮﺩ ﻭ ﺳﻌﻲ ﺑﺮ ﺁﻥ ﺍﺳﺖ ﻛﻪ ﺑﺎ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻳﻚ ﻛﻠﻤﻪ، ﺁﻥ ﻛﻠﻤﻪ ﺷﻨﺎﺧﺘﻪ ﺷﻮﺩ.
ﺩﺭ ﺭﻭﻳﻜﺮﺩ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻠﻤﻪ ﺑﻪ ﻋﻨﻮﺍﻥ ﻳﻚ ﺍﻟﮕﻮﻱ ﻭﺍﺣﺪ، ﺗﻼﺷﻲ ﺑﺮﺍﻱ ﺗﻘﻄﻴﻊ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﻮﺟﻮﺩ ﺩﺭ ﻛﻠﻤﻪ ﺻﻮﺭﺕ ﻧﻤﻲ ﮔﻴﺮﺩ ﻭ ﻛﻠﻤﻪ ﺩﺭ ﻗﺎﻟﺐ ﻳﻚ ﺍﻟﮕﻮ ﺑﺮﺭﺳﻲ ﻣﻲ گردد.
ﺭﻭﺷﻬﺎﻱ ﺑﻜﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﺭﻭﻳﻜﺮﺩ ﺭﺍ ﻣﻲ ﺗﻮﺍﻥ ﺑﻪ ﺩﻭ ﮔﺮﻭﻩ ﺗﻘﺴﻴﻢ ﻛﺮﺩ :                                  
ﮔﺮﻭﻩ ﺍﻭﻝ ﺭﻭﺷﻬﺎﻳﻲ ﻫﺴﺘﻨﺪ ﻛﻪ ﺗﺼﻮﻳﺮ ﻛﻠﻤﻪ ﺭﺍ ﺑﺼﻮﺭﺕ ﻳﻚ ﺍﻟﮕﻮﻱ ﺩﻭ ﺳﻄﺤﻲ ( ﺑﺎﻳﻨﺮﻱ ) ﻳﺎ ﺑﺎ ﺳﻄﻮﺡ ﺧﺎﻛﺴﺘﺮﻱ ﺩﺭ    ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻭ ﺍﺯ ﺭﻭﺷﻬﺎﻱ ﻣﻌﻤﻮﻝ ﺩﺭ ﺷﻨﺎﺳﺎﻳﻲ ﺗﺼﺎﻭﻳﺮ ﻛﻪ ﻣﻌﻤﻮﻻً ﻣﺒﺘﻨﻲ ﺑﺮ ﺗﻮﺍﺑﻊ ﻓﺎﺻﻠﻪ ﻣﻲ ﺑﺎﺷﻨﺪ ﻭ ﻳﺎ ﺭﻭﺷﻬﺎﻳﻲ ﻫﻤﭽﻮﻥ ﺷﺒﻜﻪ ﻋﺼﺒﻲ ﻭ ﻏﻴﺮﻩ ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲ ﻧﻤﺎﻳﻨﺪ.
 ﮔﺮﻭﻩ ﺩﻭﻡ ﺭﻭﺷﻬﺎﻱ ﻣﺒﺘﻨﻲ ﺑﺮ ﭘﺮﺩﺍﺯﺵ ﺳﻴﮕﻨﺎﻟﻬﺎﻱ ﺗﺼﺎﺩﻓﻲ ﻫﺴﺘﻨﺪ. ﺍﻳﻦ ﺭﻭﺷﻬﺎ ﺍﺑﺘﺪﺍ ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﮔﻔﺘﺎﺭ ﺑﻜﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﻭ ﺳﭙﺲ ﺩﺭ ﺯﻣﻴﻨﺔ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻠﻤﺎﺕ ﻣﺨﺼﻮﺻﺎً ﻛﻠﻤﺎﺕ ﺩﺳﺘﻨﻮﻳﺲ لاتین ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ اند.
 



طبقه بندی: optical character recognition (ocr)،

ﺑﺎﺯﻧﻤﺎﻳﻲ و ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ :

ﺑﺎﺯﻧﻤﺎﻳﻲ ﺗﺼﺎﻭﻳﺮ ﻣﻬﻤﺘﺮﻳﻦ ﻧﻘﺶ ﺭﺍ ﺩﺭ ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﺍﻳﻔﺎ ﻣﻲكند. در ﺳﺎﺩﻩﺗﺮﻳﻦ ﺣﺎﻟﺖ، ﺗﺼﺎﻭﻳﺮ ﺳﻄﺢ ﺧﺎﻛﺴﺘﺮﻱ ﻳﺎ ﺑﺎﻳﻨﺮﻱ ﺑﻪ ﻳﻚ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻨﻨﺪﻩ ﺩﺍﺩﻩ ﻣﻲ ﺷﻮﻧﺪ. ﻟﻴﻜﻦ ﺩﺭ ﺑﻴﺸﺘﺮ ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﻤﻨﻈﻮﺭ ﺍﺟﺘﻨﺎﺏ ﺍﺯ ﭘﻴﭽﻴﺪﮔﻲ ﺍﺿﺎﻓﻲ ﻭ ﺍﻓﺰﺍﻳﺶ ﺩﻗﺖ ﺍﻟﮕﻮﺭﻳﺘﻤﻬﺎ، ﻳﻚ ﺭﻭﺵ ﺑﺎﺯﻧﻤﺎﻳﻲ ﻓﺸﺮﺩﻩ ﺗﺮ ﻭ ﺑﺎ ﻗﺪﺭﺕ ﺗﻤﺎﻳﺰ ﺑﻴﺸﺘﺮ ﻣﻮﺭﺩ ﻧﻴﺎﺯ ﻣﻲ ﺑﺎﺷﺪ. ﺑﺮﺍﻱ ﺍﻳﻦ ﻣﻨﻈﻮﺭ ﻣﺠﻤﻮﻋﻪ ﺍﻱ ﺍﺯ ﻭﻳﮋﮔﻴﻬﺎ ﻫﺮ ﻛﻼﺱ ﺍﺳﺘﺨﺮﺍﺝ ﻣﻲشوند ﻛﻪ ﺑﻪ ﺗﺸﺨﻴﺺ ﺁﻥ ﺍﺯ ﺳﺎﻳﺮ ﻛﻼﺳﻬﺎ ﻛﻤﻚ ﻣﻲ گیرد. ﺩﺭ ﻋﻴﻦ ﺣﺎﻟﻲ ﻛﻪ ﻧﺴﺒﺖ ﺑﻪ ﺗﻐﻴﻴﺮﺍﺕ ﻣﺸﺨﺼﺎﺕ ﺍﻋﻀﺎﻱ ﻳﻚ ﻛﻼﺱ ﻣﺴﺘﻘﻞ ﺑﺎﻗﻲ ﻣﻲ ﻣﺎﻧﺪ. ﻭﻳﮋﮔﻴﻬﺎﻱ ﺍﻧﺘﺨﺎﺏ ﺷﺪﻩ ﺑﺎﻳﺴﺘﻲ ﻧﺴﺒﺖ ﺑﻪ ﺍﻋﻮﺟﺎﺟﻬﺎ ﻭ ﺗﻐﻴﻴﺮﺍﺕ ﺍﺣﺘﻤﺎﻟﻲ ﻛﻪ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﺩﺭ ﻳﻚ ﻛﺎﺭﺑﺮﺩ ﺧﺎﺹ پیدا كنند، ﺗﻐﻴﻴﺮﻧﺎﭘﺬﻳﺮ ﺑﺎﺷﻨﺪ. ﻫﻤﭽﻨﻴﻦ ﭘﺪﻳﺪﻩﺍﻱ ﺗﺤﺖ ﻋﻨﻮﺍﻥ « ﻧﻔﺮﻳﻦ ابعادی » (Curse of Dimensionality) به ما ﻫﺸﺪﺍﺭ ﻣﻲ ﺩﻫﺪ ﻛﻪ ﺑﺎ ﻳﻚ ﻣﺠﻤﻮﻋﺔ ﺁﻣﻮﺯﺷﻲ ﻣﺤﺪﻭﺩ ﭼﻨﺎﻧﭽﻪ ﺑﺨﻮﺍﻫﻴﻢ ﺍﺯ ﻳﻚ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﺓ ﺁﻣﺎﺭﻱ ﺍﺳﺘﻔﺎﺩﻩ ﻛﻨﻴﻢ، ﺗﻌﺪﺍﺩ ﻭﻳﮋﮔﻴﻬﺎ ﺑﻄﻮﺭ ﻣﻨﻄﻘﻲ ﺑﺎﻳﺴﺘﻲ ﻛﻮﭼﻚ ﺑﺎﺷﺪ. ﺑﺮﻃﺒﻖ ﻳﻚ ﻗﺎﻧﻮﻥ ﺗﺠﺮﺑﻲ، ﺗﻌﺪﺍﺩ ﺍﻟﮕﻮﻫﺎﻱ ﺁﻣﻮﺯﺷﻲ ﻫﺮ ﻛﻼﺱ ﺑﺎﻳﺴﺘﻲ 5 تا 10 برابر ابعاد بردار ویژگی انتخابی باشد. در عمل مقتضیات ﺭﻭﺷﻬﺎﻱ ﺑﺎﺯﻧﻤﺎﻳﻲ، ﺍﻧﺘﺨﺎﺏ ﺑﻬﺘﺮﻳﻦ ﺭﻭﺵ ﺑﺮﺍﻱ ﻳﻚ ﻛﺎﺭﺑﺮﺩ ﺧﺎﺹ ﺭﺍ ﺑﺎ ﻣﺸﻜﻞ ﻣﻮﺍﺟﻪ ﻣﻲﻛﻨﺪ. ﻫﻤﭽﻨﻴﻦ ﺍﻳﻦ ﻣﺴﺌﻠﻪ ﺭﺍ ﻧﻴﺰ ﺑﺎﻳﺪ ﻣﺪ ﻧﻈﺮ ﻗﺮﺍﺭ ﺩﺍﺩ ﻛﻪ ﺁﻳﺎ ﺣﺮﻭﻑ ﻳﺎ ﻛﻠﻤﺎﺗﻲ ﻛﻪ ﻣﻲ ﺑﺎﻳﺴﺖ ﺗﺸﺨﻴﺺ ﺩﺍﺩﻩ ﺷﻮﻧﺪ  ﺟﻬﺖ ﻭ ﺍﻧﺪﺍﺯﺓ ﻣﺸﺨﺼﻲ ﺩﺍﺭﻧﺪ ﻳﺎ ﺧﻴﺮ، ﺩﺳﺘﻨﻮﻳﺲ ﻳﺎ ﭼﺎﭘﻲ ﻫﺴﺘﻨﺪ، ﻭ ﻳﺎ ﻣﻤﻜﻦ ﺍﺳﺖ ﺗﺎ ﭼﻪ ﺣﺪ ﺑﻮﺳﻴﻠﺔ ﻧﻮﻳﺰ ﻣﻐﺸﻮﺵ ﺷﺪﻩ ﺑﺎﺷﻨﺪ. ﺍﺯ ﻃﺮﻑ ﺩﻳﮕﺮ ﺩﺭ ﻣﻮﺭﺩ ﺣﺮﻭﻓﻲ ﻛﻪ ﺑﻪ ﭼﻨﺪﻳﻦ ﺷﻜﻞ ﻧﻮﺷﺘﻪ ﻣﻲ ﺷﻮﻧﺪ. (ﻣﺎﻧﻨﺪ ’a‘ ﻭ ’A‘) ﻣﻤﻜﻦ ﺍﺳﺖ ﻻﺯﻡ ﺑﺎﺷﺪ ﻛﻪ ﺑﻴﺶ ﺍﺯ ﻳﻚ ﻛﻼﺱ ﺍﻟﮕﻮ ﺑﻪ ﻳﻚ ﻛﺎﺭﺍﻛﺘﺮ ﺧﺎﺹ ﺗﻌﻠﻖ ﻳﺎﺑﺪ.
ﻫﻤﺎﻧﻄﻮﺭ ﻛﻪ ﻋﻨﻮﺍﻥ ﺷﺪ، ﺑﺎﺯﻧﻤﺎﻳﻲ ﻳﻚ ﻣﺮﺣﻠﺔ ﺑﺴﻴﺎﺭ ﻣﻬﻢ ﺩﺭ ﺣﺼﻮﻝ ﺭﺍﻧﺪﻣﺎﻥ ﻣﻨﺎﺳﺐ ﺑﺮﺍﻱ ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﺍﺳﺖ؛ ﻟﻴﻜﻦ ﺟﻬﺖ ﺩﺳﺘﻴﺎﺑﻲ ﺑﻪ ﻋﻤﻠﻜﺮﺩ ﺑﻬﻴﻨﻪ ﻻﺯﻡ ﺍﺳﺖ ﻛﻪ ﺳﺎﻳﺮ ﻣﺮﺍﺣﻞ ﻧﻴﺰ ﺑﻬﻴﻨﻪ ﮔﺮﺩﻧﺪ ﻭ ﺑﺎﻳﺴﺘﻲ ﺗﻮﺟﻪ ﻧﻤﻮﺩ ﻛﻪ ﺍﻳﻦ ﻣﺮﺍﺣﻞ ﻣﺴﺘﻘﻞ ﻧﻤﻲ ﺑﺎﺷﻨﺪ. ﺍﺳﺘﺨﺮﺍﺝ ﻳﻚ ﺭﻭﺵ ﺧﺎﺹ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ، ﻃﺒﻴﻌﺖ ﺧﺮﻭﺟﻲ ﻣﺮﺣﻠﺔ ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ ﺭﺍ ﺑﻪ ﻣﺎ ﺩﻳﻜﺘﻪ ﻣﻲ ﻛﻨﺪ ﻭ ﻳﺎ ﺣﺪﺍﻗﻞ ﻣﺎ ﺭﺍ ﺩﺭ ﺍﻧﺘﺨﺎﺑﻤﺎﻥ ﻣﺤﺪﻭﺩ ﻣﻲ ﺳﺎﺯﺩ. ﺑﻌﻀﻲ ﺍﺯ ﺭﻭﺷﻬﺎﻱ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ ﺑﺮ ﺭﻭﻱ ﺗﺼﺎﻭﻳﺮ ﺳﻄﺢ ﺧﺎﻛﺴﺘﺮﻱ ﺣﺮﻭﻑ ﻣﻨﻔﺮﺩ ﻋﻤﻞ ﻣﻲ ﻧﻤﺎﻳﻨﺪ. ﺩﺭﺣﺎﻟﻴﻜﻪ ﺳﺎﻳﺮ ﺭﻭﺷﻬﺎ ﺑﺮ ﺭﻭﻱ ﺳﻤﺒﻠﻬﺎﻱ ﺑﺎ ﭘﻴﻮﺳﺘﮕﻲ ﻣﺮﺗﺒﺔ 4 یا 8 كه از ﺗﺼﻮﻳﺮ ﺑﺎﻳﻨﺮﻱ ﺍﺻﻠﻲ ﺟﺪﺍ ﮔﺮﺩﻳﺪﻩ ﻳﺎ ﺑﺮ ﺭﻭﻱ ﺳﻤﺒﻠﻬﺎﻱ ﻧﺎﺯﻙ ﺷﺪﻩ ﻳﺎ ﺑﺮ ﺭﻭﻱ ﻛﺎﻧﺘﻮﺭ ﺳﻤﺒﻠﻬﺎ ﺍﻋﻤﺎﻝ ﻣﻲ ﮔﺮﺩﻧﺪ.
ﻋﻼﻭﻩ ﺑﺮ ﺍﻳﻦ، ﻧﻮﻉ ﻓﺮﻣﺖ ﻭﻳﮋﮔﻴﻬﺎﻱ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺑﺎﻳﺴﺘﻲ ﺑﺎ ﻧﻴﺎﺯﻣﻨﺪﻳﻬﺎﻱ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﺓ ﻣﻨﺘﺨﺐ ﻣﻄﺎﺑﻘﺖ ﺩﺍﺷﺘﻪ ﺑﺎﺷﺪ. ﻭﻳﮋﮔﻴﻬﺎﻱ ﻧﻮﻉ ﮔﺮﺍﻓﻲ ﻳﺎ ﮔﺮﺍﻣﺮﻱ ﺑﺮﺍﻱ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﻩ ﻫﺎﻱ ﺳﺎﺧﺘﺎﺭﻱ ﻳﺎ ﻧﺤﻮﻱ ﻣﻨﺎﺳﺐ ﻣﻲ ﺑﺎﺷﻨﺪ.
ﻭﻳﮋﮔﻴﻬﺎﻱ ﮔﺴﺴﺘﻪ ﻛﻪ ﻓﺮﺿﺎﹰ ﺗﻨﻬﺎ ﺩﻭ ﻳﺎ ﺳﻪ ﻣﻘﺪﺍﺭ ﻣﺠﺰﺍ ﺩﺍﺭﻧﺪ، ﺑﺮﺍﻱ ﺩﺭﺧﺘﻬﺎﻱ ﺗﺼﻤﻴﻢ ﮔﻴﺮﻱ ﺍﻳﺪﻩ ﺁﻝ ﻣﻲ ﺑﺎﺷﻨﺪ. ﺑﺮﺩﺍﺭﻫﺎﻱ ﻭﻳﮋﮔﻲ ﺑﺎ ﻣﻘﺎﺩﻳﺮ ﺣﻘﻴﻘﻲ، ﻣﻨﺎﺳﺐ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﻩ ﻫﺎﻱ ﺁﻣﺎﺭﻱ ﻫﺴﺘﻨﺪ.
ﻫﻤﭽﻨﻴﻦ ﭼﻨﺪﻳﻦ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﻩ ﻧﻴﺰ ﻣﻤﻜﻦ ﺍﺳﺖ ﺑﻪ ﻋﻨﻮﺍﻥ ﻳﻚ ﺭﻭﺵ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﭼﻨﺪ ﻃﺒﻘﻪ ﻳﺎ ﺑﻪ ﻋﻨﻮﺍﻥ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﻩ ﻫﺎﻱ ﻣﻮﺍﺯﻱ (ﻛﻪ ﺩﺭ ﺁﻥ ﺗﺮﻛﻴﺒﻲ ﺍﺯ ﻧﺘﺎﻳﺞ ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻛﻨﻨﺪﻩ های ﻣﺠﺰﺍ ﺩﺭ ﺣﺼﻮﻝ ﻧﺘﻴﺠﺔ ﻧﻬﺎﻳﻲ ﺩﺧﺎﻟﺖ ﺩﺍﺭﻧﺪ) ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻗﺮﺍﺭ ﮔﻴﺮﻧﺪ. ﺩﺭ ﺍﻳﻦ ﺣﺎﻟﺖ ﻣﻤﻜﻦ ﺍﺳﺖ ﻭﻳﮋﮔﻴﻬﺎﻱ ﺩﺍﺭﺍﻱ ﭼﻨﺪ ﻓﺮﻣﺖ ﻣﺨﺘﻠﻒ ﺍﺯ ﺣﺮﻭﻑ ﻭﺭﻭﺩﻱ ﺍﺳﺘﺨﺮﺍﺝ ﮔﺮﺩﻧﺪ.
                                            
 
شکل(18)

الف) ﺗﺼﻮﻳﺮ ﺳﻄﺢ ﺧﺎﻛﺴﺘﺮﻱ ﺑﺨﺸﻲ ﺍﺯ ﻳﻚ ﻧﻘﺸﺔ عددی
ب) تصاویر ﺳﻄﺢ ﺧﺎﻛﺴﺘﺮﻱ ﺣﺮﻭﻑ ﻗﻄﻌﻪ ﺑﻨﺪﻱ ﺷﺪﻩ ﻛﻪ ﺍﺯ ﺑﺨﺸﻲ ﺍﺯ ﺷﻜﻞ الف ﺍﺳﺘﺨﺮﺍﺝ ﮔﺮﺩﻳﺪﻩ ﺍﻧﺪ.
ج) ﺗﺼﻮﻳﺮ ﺑﺎﻳﻨﺮﻱ ﺷﺪﺓ ﺷﻜﻞ ب
ﺩ) ﺗﺼﻮﻳﺮ ﻧﺎﺯﻙ ﺷﺪﺓ ﺷﻜﻞ ﺝ
هـ) ﻛﺎﻧﺘﻮﺭﻫﺎﻱ ﺩﻭ ﺗﺎ ﺍﺯ ﺍﺭﻗﺎﻡ ﺷﻜﻞ د
 



طبقه بندی: optical character recognition (ocr)،

تاریخ : سه شنبه 7 دی 1389 | 10:32 ب.ظ | نویسنده : Me
سایت videotoolbox.com

این سایت ابزاری رایگان و آنلاین برای ویرایش فیلم ها تا حجم 300 مگابایت را فراهم می کند. همچنین امکان تبدیل این فرمت ها به هم رانیز فراهم می کند (. 3GP, AMV, ASF, AVI, FLV, MKV, MOV, M4V, MP4, MPEG, MPG, RM, VOB, WMV) که برای تبدیل کردن در ساده ترین شکل کافی است که فرمت خروجی را تعیین کنید  و به صورت پیشرفته می توانید تنظیماتی چون video codec, resolution, bit rate, frame rate. و - audio codec, bit rate, sample rate, channels. را هم انجام دهید.



 فقط باید توجه داشته باشید برای کار کردن با این سایت باید عضو شوید و پس از عضویت امکان ورود و استفاده از امکانات سایت را خواهید داشت و که عضویت رایگان می باشد. پس از ورود به کنترل پنل خودتان می توانید فایلهای تصویری را آپلود کرده یا لینک آن را در قسمت or download from URL قرار داده تا از اینترنت بر روس سرور سایت آپلود شود .




 پس از آپلود فیام خود نام آن را مشاهده خواهید کرد که با کلیک بر فلش کنار نام فایل می توانید عملیات لازم را انجام دهید. تصویر زیر صفحه مدیریت فایلها را نشان می دهد.





برای خواندن ادامه مطلب کلیک کنید

طبقه بندی: وبـــــــ گردی،

تاریخ : سه شنبه 7 دی 1389 | 09:31 ب.ظ | نویسنده : Me
سایت convertfiles.com

با استفاده ازاین سایت تقریبا هرفایلی رومی توانید به فرمت دیگه ای تبدیل کنید.هرفایل صوتی حداکثر حجم فایل شما 150 مگابایت می باشد که اگر فیلمی دارید و بخواهید فرمت آن را تغییر دهید که حجمی بالاتر از این دارد می توانید از سایت  www.videotoolbox.com  استفاده کنید .


  در این سایت با استفاده از دکمه  فایل دلخواه خود را که مایل به تغییر فرمت آن هستید از کامپیوتر شخصی خود انتخاب کرده و یا اگر در اینترنت می باشد لینک آن را در قسمت or download it from بگذارید که در هر صورت نوع و فرمت فعلی فایل در i قسمتinput format نمایش  داده شده و از قسمت output format  نوع خروجی فایلتان را انتخاب کنید . و با تیک دار کردن گزینه Send a download link to my email (optional)می توانید فایل تبدیلی و جدید را در ایمیل خود داشته باشید . سپس با کلیک بر دکمه Convert عملیات آپلود فایل شما بر روی سرور سایت و تبدیل آن به فرمت خاص مد نظرتان شروع می شود.
 





 و پس از آن لینک فیل جدید به شما نشان داده می شود که می توانید آن را دانلود کنید که البته این عملیات باتوجه به سرعت اینترنت شما و حجم فایلتان متفاوت خواهد بود .

 فرمت هایی که این سایت پشتیبانی می کند :

 ARCHIVE
    
      7Z to RAR, TAR, ZIP, TGZ, TAR.GZ
       RAR to TAR, ZIP, TGZ, TAR.GZ
      TAR to RAR, ZIP, TGZ, TAR.GZ
      TGZ to TAR, RAR, ZIP
      TAR.GZ to TAR, RAR, ZIP
      ZIP to TAR, RAR, TGZ, TAR.GZ

      

برای خواندن ادامه مطلب کلیک کنید

طبقه بندی: وبـــــــ گردی،

تاریخ : سه شنبه 7 دی 1389 | 01:24 ق.ظ | نویسنده : Me
  سایت Crack my pdf.com

 آیا شما فایل( pdf (adobe acrobat دارید که نمی توانید آن را پرینت کرده و یا ویرایش و کپی کنید ؟علت آن است که فایل pdf  شما دارای پسورد و محدودیتهایی می باشد . با استفاده از این وب سایت شما می توانید در مدت چند ثانیه این پسورد و محدودیت ها را بر دارید







 ویژگی های این سایت :

1-   محدودیتهای فایل pdf را برای کپی و ویرایش و پرینت و ... بر می دارد.
2-    پشنیبانی از تمام نسخه ها ی Adob Acrobat تا نسخه 9
3-   بدون نیاز به نرم افزار خاصی چراکه همه چیز به صورت آنلاین انجام می گیرد .

این سایت تنها می تواند پسورد محافظت کننده فایل pdf یی را حذف کند که شامل رمز 40 بیتی  RC4و 128  بیتی RC4  و 128 بیتی AES می باشد

 و محدودیت های این سایت:

1 -نمی تواند کاربر و کلمه عبور را پیدا کند
2- امکان حذف سایر محافظتها مانند DRM و third part plug-in را ندارد.
3-ذخیره فرم ها و داده های محلی را در Adob acrobat reader  ممکن نیست
4- اضافه کردن نظرات ممکن نیست
5-امکان افزودن امضای دیجیتالی را ندارد.


 روش کار با این سایت :

ابتدا بر روی دکمه Browse کلیک کرده و فایل pdf خود را که می خواهید پسورد ان را حذف کنید , انتخاب کنید. سپس یر روی دکمه Unlock کلیک کنید.




 پس از انتخاب فایل , آن فایل بر روی سرور سایت آپلود می شود که مراحل آپلود در تصاویر زیر نمایش داده شده است .






 پس از آپلود و حذف محدودیت ها , لینک فایل جدید بدون محدودیت را به شما نشان می دهید که امکان دانلود و حذف آن را خواهید داشت.



طبقه بندی: وبـــــــ گردی،

تاریخ : سه شنبه 30 آذر 1389 | 08:26 ب.ظ | نویسنده : Me
سایت ocronline.com

  با استفاده از این سایت بدون اینکه نرم افزار خاصی را بر وی سیستم خود نصب کنید براحتی و آنلاین میتوانید عملیات تشخیص و شناسایی متون از فایلهای تصویری و pdf و  اسناد اسکن شده شامل چندین صفحه , عکس های دوربین دیجیتالی را انجام داده و به راحتی به متن قابل ویرایش مانند یک فایل word  تبدیل کنید.این سایت که یک ابزار رایگان برای این کار می باشد از 32 زبان پشتیبانی می کند .


 با این سایت می توانید متن موجود در فایلهای jpg  ,jpeg,bmp,tiff,gif, را به یک فایل قابل ویرایش word تبدیل کنید. . فایل تبدیلی جدید همانند عکس و تصویر شما خواهد بود با همان جداول یا ستون ها و تصاویر ولی با قابلیت ویرایش.

 این سایت که به صورت مهمان سرویس می دهد یعنی نیازی به ثبت نام در آن برای استفاده نیست. و به شما اجازه می دهد تا 15 تصویر را در هر ساعت تبدیل کنید.





 روش کار نیز آسان می باشد که با انتخاب فایل و کلیک بر دکمه upload  کار تمام است



 و بعد لینک فایل تبدیلی برای دانلود در اختیار شما قرار خواهد گرفت .
 فرمت هایی که این سایت پشتیبانی کرده و تبدیل  می کند : 

1)     BMP to DOC, TXT, RTF
2)     GIF to DOC, TXT, RTF
3)     JPG to DOC, TXT, RTF
4)     PNG to DOC, TXT, RTF
5)      TIF to DOC, TXT, RTF



طبقه بندی: وبـــــــ گردی،

ساخت وبلاگ در میهن بلاگ

شبکه اجتماعی فارسی کلوب | اخبار کامپیوتر، فناوری اطلاعات و سلامتی مجله علم و فن | ساخت وبلاگ صوتی صدالاگ | سوال و جواب و پاسخ | رسانه فروردین، تبلیغات اینترنتی، رپرتاژ، بنر، سئو