Web Analytics
spacer.png, 0 kB

מבזקים

טלפון חדש



בקרו אותנו באתר החדש

www.adms.co.il

 
spacer.png, 0 kB
סריקת מסמכים ,שירותי ocr

 

שירותי OCR

שירותי OCR

מה זה OCR ?
Optical Character Recongnition או בעברית זיהוי תווים אופטי.

כל מסמך הנסרק למחשב הינו קובץ תמונה ולא ניתן לערוך את הטקסט בתוכו.
חברת Daniel's Archive מספקת שירותי OCR המאפשרים המרת מסמכים סרוקים למסמכים ברי חיפוש ו/או מסמכים רגילים הניתנים לעריכה בכל מעבד תמלילים כגון Microsoft Word.

אמינות המסמך לאחר OCR הינו תוצאה ישירה של איכות המסמך הסרוק לכן אנו בחברת Daniel's Archive
סורקים את כל המסמכים ברזולוציה של 300dpi ובכך מאפשרים ללקוחותינו לבצע פעולות לאחר הסריקה
מבלי שידרשו לסרוק את המסמך באיכות גבוהה יותר בשנית.

מערכת ArchiNet תומכת תמיכה מלאה במסמכים אשר עברו שירותי OCR כך שניתן יהיה לאתר מסמכים
על סמך חיפוש מילה אשר נמצאת בתוך המסמך עצמו מבלי לפתוח את המסמך.

שלבי תהליך הפכית מסמך לבר חיפוש / עריכה

  • זיהוי שורות הטקסט ויישור השורה כך שהאותיות יהיו אופקיות. שלב זה פותר בעיות של דפים שסריקתם נעשתה בזווית, מה שמקשה על התוכנה לזהות את צורת האותיות בצורה נכונה.
  • ניקוי של הרקע מלכלוך. במקרה של טקסט עברי מאותר גם הניקוד ונמחק, כדי להקל על זיהוי האותיות עצמן.
  • הפרדת השורות השלמות לאותיות ומילים על פי מרווחים.
  • זיהוי הגופן שבו הודפס הטקסט, על ידי הפעלת אלגוריתם המזהה מאפיינים של גופנים שונים, ובוחר את הגופן הקרוב ביותר.
  • זיהוי האותיות הבודדות לפי המאפיניים המפרידים בין האותיות בהתאם לפונט הנבחר (זהו שלב מהיר).
  • חיפוש המילים המזוהות במילון. בכל מקרה של מילה שאיננה במילון, מבוצע נסיון להחליף אותיות באותיות קרובות מבחינת מאפיינים, עד הגעה למילה שנמצאת במילון.
  • במקרה של מקור שמכיל גם תמונות, יצירת קובץ שבו משולב הטקסט עם התמונות הסרוקות.

חזור לדף שרותים

 
  הארכיב של דניאל
Copyright© 2012
שיווק באינטרנט
Linkalon.co.il
spacer.png, 0 kB