Función de reconocimiento óptico de caracteres (OCR) de ABBYY FineReader for ScanSnap

Esta sección le explica acerca de la función OCR de ABBYY FineReader for ScanSnap.

Visión general de ABBYY FineReader for ScanSnap

ABBYY FineReader for ScanSnap es una aplicación usada exclusivamente con el ScanSnap. Este programa sólo puede realizar el reconocimiento de texto de los archivos PDF que fueron creados usando el ScanSnap. No puede reconocer el texto de archivos PDF creados usando Adobe Acrobat u otras aplicaciones.

Características de la función OCR

La función OCR tiene las siguientes características. Antes de realizar el reconocimiento de texto, verifique si los documentos son apropiados o no para el reconocimiento de texto mediante la consulta de las siguientes pautas:

Aplicación Apropiado para el reconocimiento de texto No apropiado para el reconocimiento de texto
ABBYY Scan to Word Documentos con diseños simples que contienen una o dos columnas
Apropiado para el reconocimiento de texto (archivo de Word)
Documentos con diseños complejos que contienen una mezcla de diagramas, tablas y textos (tal como folletos, revistas y periódicos)
No apropiado para el reconocimiento de texto (archivo de Word)
ABBYY Scan to Excel(R) Documentos con tablas sencillas en las que cada borde está conectado al marco exterior.
Apropiado para el reconocimiento de texto (archivo de Excel)
Documentos que contienen lo siguiente:
  • Tablas sin bordes con líneas sólidas
  • Tablas con complicados formatos de celdas
  • Tablas complejas que contienen subtablas
  • Diagramas
  • Gráficos
  • Fotos
  • Documentos que contienen texto en vertical
No apropiado para el reconocimiento de texto (archivo de Excel)
ABBYY Scan to PowerPoint(R) Documentos que contienen texto y diagramas/tablas simples con un fondo blanco o de color monocromo claro
Apropiado para el reconocimiento de texto (documento de PowerPoint(R))
  • Documentos con diseños de página complejos, que contienen caracteres, diagramas e ilustraciones
  • Documentos con caracteres en fotos o fondo con dibujos
  • Documentos con caracteres de colores claros sobre un fondo de color oscuro
No apropiado para el reconocimiento de texto (documento de PowerPoint(R))

Parámetros que no se pueden reproducir igual que en el documento original

Es posible que los siguientes parámetros no sean reproducidos tal como están en el documento original. Se recomienda verificar el resultado del reconocimiento de texto en Word, Excel o PowerPoint y, si es necesario, editar el dato.

  • Fuente y tamaño del carácter
  • Carácter y espacio de la línea
  • Caracteres en subrayado, negrita y cursiva
  • Superíndice/subíndice

Documentos que no pueden ser reconocidos correctamente

Es posible que los siguientes tipos de documentos no puedan ser reconocidos correctamente. Tal vez pueda obtener un mejor resultado en el reconocimiento de texto, cambiando el modo de color o mejorando la resolución.

  • Documentos que contienen caracteres escritos a mano
  • Documentos con caracteres pequeños (menores que el tamaño de fuente 10)
  • Documentos inclinados
  • Documentos escritos en un idioma diferente al idioma especificado
  • Documentos con caracteres en un fondo de color no uniforme
    Ejemplo: caracteres sombreados
  • Documentos con muchos caracteres decorados
    Ejemplo: caracteres decorados (en relieve/perfilados)
  • Documentos con caracteres cuyo fondo tenga patrones o dibujos
    Ejemplo: caracteres con ilustraciones y diagramas superpuestos
  • Documentos con muchos caracteres en contacto con subrayados o bordes
  • Documentos de diseño complicado y documentos con una gran cantidad de ruido en imagen

    (El reconocimiento de texto de estos documentos podría tomarle más tiempo.)

Otros puntos a tener en cuenta

  • Cuando convierte un documento que es más largo que el tamaño máximo permitido por Word, se usará el máximo tamaño de papel disponible para Word.
  • Al convertir los documentos a archivos de Excel, si el resultado de reconocimiento excede 65.536 líneas, no se podrán guardar más resultados.
  • Al convertir los documentos a archivos de Excel, no se reproducirá la información de diseño de todo el documento, diagramas y altura/anchura de los gráficos y tablas. Solo se reproducen las tablas y los caracteres.
  • Un documento PowerPoint convertido no tendrá el color y los patrones del fondo original.
  • Los documentos que estén en dirección errónea o en orientación horizontal no podrán ser reconocidos correctamente. Utilice Girar una imagen digitalizada a su orientación correcta, o coloque los documentos en la orientación correcta.
  • Si la reducción de fugas de tinta está habilitado, el nivel de reconocimiento podría ser menor. En dicho caso, deshabilítelo realizando el siguiente procedimiento:

    Haga clic con el botón derecho en el icono de ScanSnap Manager Comunicándose en el área de notificaciones que se encuentra en el extremo derecho de la barra de tareas y, en el menú de clic derecho, haga clic en [Configuración del botón Scan] → pestaña [Digitalizando] → botón [Opción] para mostrar la ventana [Opción del modo de digitalización]. Después, desactive la casilla [Opción del modo de digitalización] (en SV600, la casilla [Reducir fugas de tinta] se encuentra en la ficha [Calidad de imagen] en la ventana [Opción del modo de digitalización]).