¿Has usado Opait Text Filters para Windows? Comparte tu experiencia y ayuda a otros usuarios.


Descripción del desarrollador

Extraer texto de documentos formateados y marcados para indexación, agregación o minería de datos.
Muchas aplicaciones que manejan datos no estructurados requieren acceso al contenido textual de documentos formateados o marcados. Las organizaciones que archivan documentos a menudo requieren acceso al contenido textual para hacer que los documentos sean buscables y permitir la agregación de contenido, informes y minería de los archivos documentales. Las aplicaciones de búsqueda y recuperación también necesitan extraer y tokenizar texto de varios formatos de archivo.

Un mecanismo estándar para acceder y extraer texto de documentos es proporcionado por la interfaz de complemento IFilter utilizada en los motores de búsqueda de Microsoft. Hay algunas implementaciones de IFilter desarrolladas por Microsoft y otros proveedores que cubren una variedad de formatos de archivo. El estándar o la fiabilidad y la calidad de extracción de texto varían entre múltiples desarrolladores de IFilter.

Opait Text Filters es un pequeño programa utilitario con una interfaz simple para IFilters que ya están instalados en el ordenador anfitrión, así como algunos filtros de extracción de texto personalizados que trabajan directamente con formatos de archivo y mejoran las implementaciones predeterminadas de IFilter.

La interfaz para extraer texto es proporcionada por una pequeña biblioteca de clases llamada Opait.Filters, que está incluida y se puede utilizar para integrar filtros de texto en aplicaciones .NET.



Explorar más


Download.com
Tu valoración para Opait Text Filters