Optik Karakter Tanıma (OCR) Nedir, Nerelerde Kullanılır?

Optik Karakter Tanıma

Optik karakter tanıma (OCR) teknolojisi, otomatikleştirilmiş veri çıkarma ve depolama yeteneklerini kullanarak zamandan, maliyetten ve diğer kaynaklardan tasarruf sağlayan verimli bir teknoloji olarak kullanıcıların karşısına çıkar. OCR teknolojisi sözleşmeleri dijital ortama aktarabilir, dijital imzayla gerçekleşmiş işlemleri PDF dosyalarına dönüştürülebilir, markaların logolarını tarayarak tespit edebilir ve kullanıcılara bunlar gibi daha birçok çeşitli kolaylıklar sağlayabilir.

Optik Karakter Tanıma Nedir?

Optik karakter tanıma (OCR)  metin tanıma teknolojisidir. Bir OCR programı; taranan belgelerden, kamera görüntülerinden ve yalnızca görüntü içeren PDF dosyalarından verileri ayıklar ve bunları metin belgelerine dönüştürür. Böylece manuel veri girişi ihtiyacını ortadan kaldırır. OCR sistemleri, fiziksel basılı belgeleri makine tarafından okunabilir metne dönüştürmek için donanım ve yazılım kombinasyonu kullanır. OCR işlemi, en çok fotokopileri ve belgeleri PDF belgelerine dönüştürmek için kullanılır, böylece kullanıcılar belgeleri düzenleyebilir, biçimlendirebilir ve arayabilirler.

Tarihi

Ray Kurzweil 1974 yılında Kurzweil Bilgisayar Ürünleri’ni kurdu. Daha sonra ise hemen hemen her yazı tipindeki metni tanımlayabilen OCR teknolojisi oluşturuldu. Kurzweil’in optik karakter tanıma teknolojisiyle amaçladığı şey görme engellilerin metinleri anlayabilmesiydi. Bu amaçta metinleri sesli bir şekilde okuyabilen bir okuma makinesi tasarladı. 1980’de Kurzweil kurduğu şirketi Xerox’a sattı.

OCR, 1990’ların başında tarihi gazeteleri dijitalleştirerek popülerlik kazandı. OCR teknolojisi oluşturulduğu zamandan bu yana birkaç iyileştirmeyle mükemmele yakın bir performansa sahip olmuştur.

OCR Türleri

Optik karakter tanımanın çeşitli kullanımları ve türleri vardır. En yaygın iki OCR yazılımı şunlardır:

1. Basit OCR Yazılımı

Basit OCR yazılımı çok çeşitli yazı tipini ve metin görüntüsünü şablon olarak saklar. Metin görüntüleri düzen eşleme algoritmalarından faydalanılarak karakter eşlenir. Eğer metin kelimesi kelimesine eşlenmiş olursa bu tanıma optik sözcük tanıma adı verilir. Ancak bunu her zaman gerçekleştirmek mümkün değildir.

2. Akıllı OCR Yazılımı

OCR yazılımı, metni insanlarla aynı şekilde okumak için akıllı karakter tanıma (ICR) teknolojisini kullanır. Bunu yapmak için makine öğrenmesi ile işbirliği yapar. Kullanılan makinelere insan davranışları konusunda kendilerini eğitebilecekleri yöntemler gösterilir. Sinir ağı adı verilen bir makine öğrenimi sistemi, metni pek çok düzeyde analiz ederek görüntüyü tekrar tekrar işler. Sonuca varmak için tüm farklı analiz düzeylerinin sonuçlarını birleştirir. Çok detaylı bir çalışma olmasına rağmen süreç hızlıdır ve saniyeler içinde sonuç alınır.

Optik Karakter Tanıma Nasıl Çalışır?

Optik karakter tanıma (OCR), bir belgenin fiziksel biçimini işlemek için bir tarayıcı görevi görür. Tüm sayfalar kopyalandıktan sonra OCR yazılımı belgeyi iki renkli veya siyah beyaz sürüme dönüştürür. Taranan görüntü, açık ve koyu alanlar için analiz edilir ve koyu alanlar, tanınması gereken karakterler olarak tanımlanırken, açık alanlar arka plan olarak tanımlanır. Bunun ardından, görüntü temizlenir ve OCR yazılımı hataları düzeltir. Bu hatalar görüntü lekeleri ya da belgenin eğik olması olabilir. Daha sonra karanlık alanlar alfabetik harfleri veya sayısal rakamları bulmak için işlenir. Bu aşamada karakter, kelime veya metinler hedeflenir. Karakterler daha sonra iki algoritmadan biri kullanılarak tanımlanır. Bu algoritmalar düzen eşleme ya da özellik ayıklama olabilir.

Düzen eşleme, OCR programında çeşitli yazı tiplerinde ve formatlarda metin örnekleri bulunduğunda kullanılır. Taranan belgede bulunan karakterleri karşılaştırmak ve tanımak için kullanılır.

Özellik ayıklama ise OCR programı taranan belgedeki karakterleri tanımak için belirli özelliklere ilişkin kurallar uyguladığında gerçekleşir. Özellikler bir karakterdeki açılı çizgilerin, çapraz çizgilerin veya eğrilerin sayısını içerir. Bir örnekle açıklamak gerekirse, büyük harf “A”, ortada yatay bir çizgi ile birleşen iki çapraz çizgi olarak saklanır.

Analizler bittiğinde ve veriler ayıklanarak eşlendiğinde, Optik Karakter Tanıma sistemi metin verilerini işlenmiş bir dosyaya dönüştürür.

OCR programı ayrıca bir belge görüntüsünün yapısını analiz etme becerisine de sahiptir. Sayfayı metin blokları, tablolar veya resimler gibi öğelere ayırır. Daha sonra, satırlar kelimelere ve ardından karakterlere ayrılır. Karakterler seçildikten sonra, program onları bir dizi desen görüntüsüyle karşılaştırır. Tüm olası eşleşmeleri işledikten sonra, tanınan metni sunar.

OCR’nin Faydaları

OCR teknolojisinin temel faydası, zahmetsiz bir şekilde metin düzenleme ve depolama oluşturarak veri giriş sürecini basitleştirmesidir. OCR, işletmelerin ve kişilerin cihazlarında dosya depolamasına olanak tanır böylece tüm belgelere sürekli erişim sağlar.

Optik karakter tanıma işletmelerin belgeleri otomatik bir şekilde entegre etmesini sağlar. El yazısıyla doldurulmuş formlar cihazlara ya da sözleşmeler otomatik olarak dijitalleştirilebilir. Hassas bilgiler içeren ve kanunen hükmü olan sözleşmelerin bir cihaza aktarılarak saklanabilmesi taraflar için ekstra bir güvence sağlar. Sözleşmeleri fiziksel olarak saklamak onları tehlikelere açık hale getirme riski taşır. Bunun yerine bir cihazda saklanması belge kayıplarını ve belgede yapılabilecek değişiklikleri engeller. Ayrıca sözleşmeye olan erişim de kolaylaşır.

Bir başka kolaylık olarak, kalabalık ve karmaşık dosyalar arasında aranılan bilgi, OCR yardımıyla çok kolay bir şekilde halledilebilir. Süreç kısaltan kolaylıklar iş yerlerinde kesinlikle verimliliği artıran teknolojiler arasındadır.

Optik karakter tanıma yapay zekâyla birleştiğinde güvenlik sistemlerinde kullanılabilir. Örneğin, trafik kurallarını ihlal eden arabalar plakalar OCR teknolojisiyle tespit edilir.

Optik Karakter Tanımanın Kullanım Alanları

1. Bankacılık

Bankacılık sektörü birçok finansal işlem için OCR kullanır. OCR sayesinde evrakların işlenme ve doğrulanması sağlanır bu da bankacılık sektörüne büyük bir zaman tasarrufu sağlar. Doğrulama aynı zamanda dolandırıcılığı önleyerek işlem güvenlik düzeyini artırır.

2. Lojistik

Lojistik şirketleri etiketleri, faturaları, makbuzları daha iyi bir şekilde takip etmek için OCR’den faydalanır. Büyük lojistik firmaları, birden fazla muhasebe sistemine fatura işlemenin çok zaman alması sebebiyle fatura işlemeyi otomatik hale getirmiştir. İşlemin otomatikleşmesi çalışan hatalarını da ortadan kaldırarak zaman tasarrufu yanında ayrıca verimliliği de artırmıştır.

3. Sağlık Sektörü

Sağlık sektöründe; tedavi, test, hastane kaydı, sigorta ödemeleri, hasta kayıtları gibi birçok dosyayı işlemek için OCR kullanılır. OCR, hem iş akışını kolaylaştırır hem de kayıtları güncel tutarak hastanelerde insan gücüne dayanan işleri azaltır.

Bir cevap yazın