GÖRÜNTÜDEN DÜZENLENEBİLİR METİNE - ÖZELLEŞTİRİLEBİLİR OCR TEKNOLOJİSİNİN GELİŞİMİ

Metin Bedir
0
GÖRÜNTÜDEN DÜZENLENEBİLİR METİNE - ÖZELLEŞTİRİLEBİLİR OCR TEKNOLOJİSİNİN GELİŞİMİ

Belgeleri hızlı bir şekilde düzenlenebilir metne dönüştürmek için en yaygın kullanılan teknolojilerden biridir. Hem bireyler hem de kuruluşlar tarafından kullanılmaktadır.


Ama seni tanıyor musun? Başlangıçta bu teknolojinin görüntüleri/belgeleri düzenlenebilir hale getirme özelliği yoktur. Bunun yerine, onlarca yıl sonra gelişmiş ve özelleştirilebilir hale geldi (metni düzenlenebilir bir biçimde sağlayarak).


Bu blog yazımda OCR'ın ilk günlerinden günümüze kadar geçirdiği evrimi anlatacağım. Böylece nasıl bu kadar gelişmiş ve özelleştirilebilir hale geldiğini bilebilirsiniz.


OCR Teknolojisi Nedir?

OCR'nin tam biçimi “ Optik Karakter Tanıma ”dır. Belirli bir görüntünün veya belgenin içerdiği metni veya verileri hızlı bir şekilde tarayan, desen eşleştirme/tanımaya dayalı bir teknolojidir. Taramayı tamamladıktan sonra herhangi bir hata yapmadan çıkarmaya başlar.


Basit bir deyişle, OCR teknolojisi, fotoğrafları metne (düzenlenebilir biçim) dönüştürme yeteneğine sahiptir. Değerli zamanlarını ve çabalarını veri çıkarma işlemlerini manuel olarak gerçekleştirmeye adayan bireylerin rolünü tamamen ortadan kaldırdı. OCR ile çıkarma birkaç saniye içinde yapılabilir.


Artık bu teknolojinin gerçekte ne olduğu hakkında kapsamlı bir fikriniz olduğunu düşünüyorum. Artık ana konumuza, OCR'nin evrimine yönelmenin zamanı geldi.


OCR Teknolojisinin İlk Günleri

OCR Teknolojisinin İlk Günleri

OCR'nin gelişimini anlamak için ilk günlerinden başlamalıyız. Yaptığım araştırmalara göre Optik karakter tanıma teknolojisinin geçmişi 1900'lü yılların başlarına kadar uzanabilmektedir.

1914 yılında (Birinci Dünya Savaşı'ndan hemen önce), tanınmış bir mucit ve fizikçi olan Emanuel Goldberg, harfleri veya karakterleri verimli bir şekilde tarayabilen/okuyabilen ve daha sonra bunları telgraf kodlarına dönüştürebilen özel bir makineyi tanıttı. Bu makineye " OCR'nin Erken Biçimi " adı veriliyor.


Altı yıl sonra 1920'de Goldberg dünyanın ilk elektronik belge erişim sistemini geliştirdi. O günlerde mikrofilmler şirket ve kuruluşlar tarafından verilerini depolamak için kullanılıyordu. Ancak mikrofilmlerden gerekli verileri hızlı bir şekilde çıkarmak hala imkansızdı.


Bu sorunu çözmek için Emanuel Goldberg halihazırda mevcut teknolojileri kullandı. Örneğin, bir film projektörü yardımıyla metnin desenlerini tanımak için bir fotoelektrik hücre kullandı. Dikkat çektikten sonra makinesi, küresel bir teknoloji kuruluşu olan IBM tarafından satın alındı.


Şirket (IBM) daha sonra makineyi (OCR) daha karmaşık hale getirmek için daha fazla çalışmaya başladı. Peki biliyor musun? OCR'nin önceki sürümü aynı anda yalnızca tek bir yazı tipiyle yazılmış metni tanıma yeteneğine sahipti.


1970'li yıllarda tıpkı Emanuel Goldberg gibi yenilenen mucit Ray Kurzweil de " Omni-font OCR "ı halkın kullanımına sundu. Bu OCR, hemen hemen her yazı tipinde basılmış metni tarama ve çıkarma özelliğine sahiptir.


Nasıl Özelleştirilebilir ve Her Zamankinden Daha Gelişmiş Hale Geldi?

Demek OCR teknolojisinin ilk günlerini anladınız. Bu bölümde Optik karakter tanıma teknolojisinin nasıl ilerlediğini anlatacağım.


2000'li yılların başından itibaren masaüstü ve mobil uygulama, yazılım ve araçlar bulut tabanlı hizmet olarak kullanılmaya başlandı. Böylece dünya çapında hem bireyler hem de işletmeler resimlerden, belgelerden, faturalardan, faturalardan, banka hesap özetlerinden vb. metinleri hızlı bir şekilde çıkarmak için araçlar ve yazılımlar kullanmaya başladı.


Yapay Zekanın çok fazla ilerleme kaydettiği son yıllarda, mevcut OCR araçları veya yazılımları aşağıdaki gibi yapay zeka teknolojileriyle yüklenmektedir:


  • Doğal lisan İşleme (NLP)
  • Makine öğrenimi (ML).


NLP, araçların giriş resminin veya belgenin içerdiği metni/verileri verimli bir şekilde taramasına olanak tanır. ML teknolojisi ise aracın veri çıkarma işlemini gerçekleştirmesine yardımcı olur. OCR araçlarının yapay zeka ile entegrasyonu bunların doğruluğunu ve çok yönlülüğünü daha da artırdı.


Buradaki çok yönlülük, yapay zeka destekli OCR'nin yalnızca metni tanıma ve çıkarma yeteneğine sahip olmadığı gerçeğini ifade ediyor. Bunun yerine, bunlar özel karakterleri, sembolleri ve matematiksel denklemleri de tarayıp çıkarabilir.


İyi olan şey, AI tabanlı OCR araçlarının çıkarma işlemini gerçekleştirmesi ve düzenlenebilir bir formatta çıktı sağlaması yalnızca birkaç saniye sürer. Aşağıdaki pratik örneği kontrol etmek için:


Pratik Gösteri:

Nasıl yapılacağını size göstermek için yapay zeka tabanlı bir OCR aracına bir resim gönderdim fotoğrafı yazıya çevirme saniyeler içinde

OCR Resim Çıktısı
Gördüğünüz gibi yapay zeka destekli OCR aracı, verilen görüntüyü kısa sürede verimli bir şekilde düzenlenebilir metne dönüştürdü. Artık OCR teknolojisinin gelişimi hakkında iyi bir fikir sahibi olacağınıza inanıyorum.

Özet:

Optik Karakter Tanıma (OCR), günümüzde metin çıkarma için en yaygın kullanılan teknolojidir. Bunu kullanan insanlar bunun yeni bir teknoloji olduğunu düşünüyor ama değil. Bunun yerine OCR'nin uzun bir geçmişi vardır. Bu blogda OCR'nin ilk günlerinden bu güne kadar geçirdiği evrimi anlattım, umarım bu makaleyi faydalı bulursunuz.


Etiketler

Yorum Gönder

0Yorumlar

Yorum yaparken:

1. Yaptığınız yorumun, mutlaka yazı ile alakalı olmasına özen gösteriniz.
2. Yorumlarınızda yazım ve dil bilgisi kurallarına uymaya çalışın lütfen.

Yorum Gönder (0)