Lector Automático 11.0 Edición de Oro OCR árabe
El lector automático de Sakhr es el resultado de la investigación en curso de Sakhr en los campos del procesamiento del lenguaje natural árabe y las tecnologías de reconocimiento de caracteres. El lector automático de Sakhr es pionero en los programas OCR en idioma árabe. OCR significa reconocimiento óptico de caracteres. Cuando se escanea un documento de texto, la computadora reconoce este texto como una imagen gráfica. El usuario no puede manipular, buscar o editar el texto de la imagen en su formato de imagen. Un programa de OCR lee este texto escaneado, lo reconoce y luego convierte las cifras y los caracteres en piezas de texto editables.
El lector automático de Sakhr, Sakhr OCR, transforma las imágenes escaneadas en una cuadrícula de millones de puntos, reconoce ópticamente los caracteres que se encuentran en ellas y finalmente las convierte en texto. La naturaleza compleja del idioma árabe es evidente en las cursivas del texto, la superposición de caracteres, las diversas formas de los caracteres, los signos diacríticos y la variedad de fuentes árabes caligráficas que existen. Como resultado, estas complejidades específicas del idioma árabe presentan importantes desafíos técnicos en la industria del OCR árabe. El lector automático, respaldado por la amplia experiencia de Sakhr en tecnologías de procesamiento de lenguaje natural árabe (NLP), aborda estos desafíos de manera efectiva, proporcionando así a los usuarios de árabe una solución OCR galardonada y de alta calidad. Se ofrecen excelentes características dentro del paquete Lector automático de Sakhr con respecto a la mejora de la precisión, el empleo de herramientas NLP, el soporte de PDF, todos los nuevos formatos de imagen famosos y otros lenguajes de escritura que tienen formas similares al árabe, como farsi, urdu, pashto y Jawi.
CARACTERÍSTICAS CLAVE
Rendimiento y precisión
- 800 caracteres por segundo en equipos basados en PIII.
§ Hasta un 99% de precisión en el reconocimiento de libros árabes, periódicos, etc... § Windows NT, 2000 y XP (habilitado para árabe).
Motores de reconocimiento
- Admite árabe, inglés, francés y otros 16 idiomas
§ Admite otros lenguajes de escritura: Farsi, Jawi, Pashto y Urdo (disponible opcionalmente en el paquete de idioma adicional). § Reconoce documentos bilingües: árabe/inglés, farsi/inglés y árabe/francés § Admite tecnologías OMNI y de aprendizaje para obtener una mayor precisión en diferentes fuentes
Formatos compatibles
- Se ocupa de todos los formatos de imagen (.bmp, .tiff, .pcx, etc.)
§ Guarda el texto de salida en diferentes formatos, como .txt, .rtf y .html § Admite formatos PDF
Escáneres compatibles
- Soporta protocolos Twain, ISIS y KOFAX
§ Funciona con cualquier tipo de escáneres § Admite escáneres simplex y dúplex
CARACTERÍSTICAS UNICAS
- Reconoce los signos diacríticos en imágenes árabes
§ Abre varios documentos al mismo tiempo § Reconoce tablas en imágenes escaneadas § Soporta tablas mal formadas § Reconoce palabras subrayadas § Reconoce caracteres rotos y pegados § Detecta automáticamente el estilo de las fuentes (Regular o Negrita) § Utiliza reglas lingüísticas árabes con reconocimiento (Inteligencia Artificial) § Admite marcos no rectangulares § Admite documentos a color § Agrupa atributos de reconocimiento en tipos predefinidos de documentos fuente
Potentes herramientas de imagen
Rotación y fijación automática y manual de imágenes.
OTRAS CARACTERÍSTICAS IMPORTANTES
- Proporciona una interfaz de programa tanto en árabe como en inglés.
§ Incluye corrector ortográfico bilingüe. § Admite los modos de encuadre automático y manual. § Envía los resultados de OCR por correo electrónico.
Para obtener más características e información, consulte
Requisitos del sistema |
Mínimo |
Recomendado |
UPC |
Pentium III, 700 MHz |
Pentium IV, 2,0 GHz |
Espacio libre en disco |
65 MB |
400 MB |
RAM |
64 MB |
128 MB |
Sistema operativo |
Windows 7 y 8 (32 y 64 bits) |
Windows 7 y 8 (32 y 64 bits) |
|