Mistral AI, Belge Çıkarma İşlemini Kurumsal Yapay Zeka Hamlesine Dönüştüren OCR 4'ü Tanıttı

🤖 Yapay Zekâ 📰 United States 🕐 2 saat önce
Mistral AI, Belge Çıkarma İşlemini Kurumsal Yapay Zeka Hamlesine Dönüştüren OCR 4'ü Tanıttı

Mistral AI, metin tabanlı belge çıkarma işleminin ötesine geçerek, sınırlayıcı kutular, blok türü sınıflandırması ve kelime bazında güven skorları dahil olmak üzere tüm belgelerin yapılandırılmış temsillerini sunan bir belge zekası modeli olan OCR 4'ü tanıttı. Bu sürüm, Mistral'ın yaklaşık 15 ay içinde dördüncü nesil optik karakter tanıma (OCR) teknolojisi olma özelliğini taşıyor ve şirketin Avrupa yapay zeka egemenliği vizyonunun ticari olarak daha fazla önem kazandığı bir dönemde piyasaya sürüldü. Model, 10 dil grubunda 170 dili destekliyor, PDF, DOC, PPT ve OpenDocument formatlarını kabul ediyor ve hassas belgeleri ABD yargı yetkisi altındaki bulut API'lerine yönlendiremeyen düzenlenmiş sektörlerdeki kurumsal müşterileri hedefleyen tek bir kapsayıcı olarak dağıtılabiliyor. Şirket, "Mistral OCR 4, çok çeşitli belgelerden içerik çıkarır ve yapılandırır. Önceki nesiller bir sayfayı temiz metin ve tablolara dönüştürmeye odaklanırken, OCR 4 belgenin yapılandırılmış bir temsilini sunuyor" açıklamasını yaptı. Model, Mistral API, Mistral Studio'daki Document AI, Amazon SageMaker ve Microsoft Foundry aracılığıyla hemen kullanılabilir durumda ve Snowflake Parse Document desteği yakında eklenecek. Fiyatlandırma, 1000 sayfa için 4 dolardan başlıyor ve toplu API indirimiyle 1000 sayfa başına 2 dolara kadar düşüyor. OCR 4, her belgeyi bir metin duvarı yerine anlamsal bir harita olarak ele alıyor. OCR 4'teki temel mühendislik değişikliği yapısal nitelikte. On yıllardır OCR'ye hakim olan düz bir metin akışı çıktısı yerine, model her bloğun sınırlayıcı bir kutuyla yerleştirildiği, türüne göre sınıflandırıldığı (başlık, tablo, denklem, imza ve diğerleri) ve sayfa ve kelime düzeyinde güvenilirlik skorlarının verildiği katmanlı bir temsil sunuyor. Mistral, sınırlayıcı kutuların en çok talep edilen özellik olduğunu belirtti. Bunun temel nedeni, konum verisi olmadan, aşağı akış sistemlerinin çıkarılan bir gerçeği belirli bir sayfadaki kaynağına kadar izleyememesidir. Bu izlenebilirlik boşluğu, geri getirme artırılmış üretim (RAG) işlem hatları, uyumluluk iş akışları veya "bu sayı nereden geldi?" sorusunun denetlenebilir bir yanıt gerektirdiği herhangi bir uygulama oluşturan kuruluşlar için sürekli bir sürtünme noktası olmuştur. Blok sınıflandırması, ilgili bir sorunu ele alıyor. "Başlık" olarak etiketlenmiş bir paragraf, anlamsal arama için bir belgeyi hiyerarşik parçalara ayırabilir. "Tablo" olarak etiketlenmiş bir blok, bir metin özetleyicisine değil, yapılandırılmış bir veri işlem hattına yönlendirilebilir. "İmza" olarak etiketlenmiş bir blok, tetikleyici olabilir.

🧠 Editör Yapay Zekâ Analizi

Mistral AI'nin OCR 4 modelini piyasaya sürmesi, belge işleme teknolojilerinde önemli bir ilerlemeyi temsil ediyor. Geleneksel metin çıkarma yöntemlerinin ötesine geçerek, belgelerin yapılandırılmış temsillerini sunan bu yeni nesil OCR teknolojisi, özellikle hassas verilerle çalışan kurumsal müşteriler için büyük önem taşıyor. ABD yargı yetkisi dışındaki bulut API'lerine yönlendirme kısıtlamaları olan şirketler için yerinde dağıtım seçeneği sunulması, Avrupa yapay zeka egemenliği vizyonunu destekliyor. Belgeleri anlamsal haritalar olarak ele alan ve her bilginin kaynağını izlemeye olanak tanıyan bu yaklaşım, geri getirme artırılmış üretim (RAG) sistemleri ve uyumluluk süreçleri gibi alanlarda devrim yaratma potansiyeline sahip. Bu teknolojik sıçrama, yapay zeka destekli belge analizinin gelecekteki yönünü belirleyebilir ve veri yönetimi ile güvenliği konularında yeni standartlar oluşturabilir.

#openai#anthropic#health#euro#market

📌 Kaynak

Bu haber XML kaynağından derlenmiştir. Tamamı için orijinal habere gidin.

Orijinal haberi oku →
📱
News AI World — Mobil uygulama
Bu haberleri 45 dilde, anlık çeviriyle cebinde. Erken erişim için Gmail adresini bırak.
← Tüm haberlere dön