Lecteur automatique arabe OCR Gold Edition

par AramediA
Épuisé
$ 1,799.95
$ 1,399.95

Lecteur automatique 11.0
Édition OR
ROC arabe

Le lecteur automatique de Sakhr est le résultat des recherches en cours de Sakhr dans les domaines des technologies de traitement du langage naturel arabe et de reconnaissance des caractères. Le lecteur automatique de Sakhr est le pionnier des programmes OCR en langue arabe. OCR signifie Reconnaissance Optique de Caractères. Lorsqu'un document texte est numérisé, l'ordinateur reconnaît ce texte comme une image graphique. L'utilisateur ne peut pas manipuler, rechercher ou modifier le texte de l'image dans son format d'image. Un programme OCR lit ce texte numérisé, le reconnaît, puis convertit les chiffres et les caractères en morceaux de texte modifiables.


 Le lecteur automatique de Sakhr - Sakhr OCR - transforme les images numérisées en une grille de millions de points, reconnaît optiquement les caractères qui s'y trouvent et les convertit finalement en texte. La nature complexe de la langue arabe est évidente dans les cursives du texte, le chevauchement des caractères, les diverses formes de caractères, les signes diacritiques et la variété des polices arabes calligraphiques qui existent. En conséquence, ces complexités spécifiques à la langue arabe présentent des défis techniques majeurs dans l'industrie de l'OCR arabe. Le lecteur automatique, soutenu par la vaste expérience de Sakhr dans les technologies de traitement du langage naturel (NLP) arabe, relève efficacement ces défis, offrant ainsi aux utilisateurs arabes une solution OCR primée et de haute qualité.

Le package de lecture automatique de Sakhr propose d'excellentes fonctionnalités concernant l'amélioration de la précision, l'utilisation d'outils NLP, la prise en charge de PDF, tous les nouveaux formats d'image célèbres et d'autres langages de script ayant des formes similaires à l'arabe, tels que le farsi, l'ourdou, le pashto et le jawi.


PRINCIPALES CARACTÉRISTIQUES

Performances et précision

  • 800 caractères par seconde sur les ordinateurs basés sur PIII.
    § Jusqu'à 99% de précision dans la reconnaissance des livres, journaux, etc. en arabe...
    § Windows NT, 2000 et XP (arabe activé). 

Moteurs de reconnaissance

  • Prend en charge l'arabe, l'anglais, le français et 16 autres langues
    § Prend en charge d'autres langues de script : Farsi, Jawi, Pashto et Urdo (Disponible en option dans le pack de langue supplémentaire.)
    § Reconnaît les documents bilingues : Arabe/Anglais, Farsi/Anglais et Arabe/Français
    § Prend en charge les technologies OMNI et Learning pour obtenir une plus grande précision dans différentes polices 

Formats pris en charge

  • Traite tous les formats d'images (.bmp, .tiff, .pcx, etc.)
    § Enregistre le texte de sortie dans différents formats tels que .txt, .rtf et .html
    § Prend en charge les formats PDF 

Numériseurs pris en charge

  • Prend en charge les protocoles Twain, ISIS et KOFAX
    § Fonctionne avec tout type de scanners
    § Prend en charge les scanners simplex et duplex 

CARACTÉRISTIQUES UNIQUES

  • Reconnaît les signes diacritiques dans les images arabes
    § Ouvre plusieurs documents en même temps
    § Reconnaît les tableaux dans les images numérisées
    § Prend en charge les tableaux mal formés
    § Reconnaît les mots soulignés
    § Reconnaît les caractères brisés et coincés
    § Détecte automatiquement le style des polices (Regular ou Bold)
    § Utilise les règles linguistiques arabes avec reconnaissance (Intelligence Artificielle)
    § Prend en charge les cadres non rectangulaires
    § Prend en charge les documents couleur
    § Regroupe les attributs de reconnaissance dans des types prédéfinis de documents source 

Outils d'imagerie puissants

Rotation et fixation automatiques et manuelles de l'image 

AUTRES CARACTÉRISTIQUES IMPORTANTES

  • Fournit une interface de programme en arabe et en anglais.
    § Comprend un correcteur orthographique bilingue.
    § Prend en charge les modes de cadrage automatique et manuel.
    § Envoie les résultats de l'OCR par e-mail.

    Pour plus de fonctionnalités et d'informations, voir


Configuration requise

Le minimum

Recommandé

CPU

Pentium III, 700 MHz

Pentium IV, 2,0 GHz

Espace disque libre

65 Mo

400 Mo

RAM

64 Mo

128 Mo

Système opérateur

Windows 7 et 8 (32 et 64 bits)

Windows 7 et 8 (32 et 64 bits)

Le module complémentaire International Language Pack est également disponible et comprend :
Farsi, Jawi, Pashto et Ourdou