Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

Capítulo III. Estado del arte de la Minería Textual

En este capítulo se discuten los fundamentos de la minería de textos, las etapas que se siguen en la transformación, las estrategias por aplicarse dependientes del tipo de representación requerida, los usos más comentados, así como las áreas de conocimiento donde mayormente se aplica. Se presenta además, el estado del arte que guarda la minería textual en cuanto a proyectos de tratamiento de textos sobre hechos noticiosos y se comentan brevemente los resultados que se alcanzaron.

3.1 La Minería Textual

Conforme a Marín et. Al [23], la minería textual es una herramienta para analizar elementos de texto con el fin de identificar, deducir y ampliar conocimiento a partir de cualquier organización de documentos (documentos electrónicos, bases de datos, etc.), puede entender semánticamente el contenido de uno o más documentos y crea una catálogo de los temas tratados. En la práctica, se podría considerar una extension del tipo de web mining de contenidos. Su objetivo es también la categorización de texto, el procesamiento en lenguaje natural, la extracción y recuperación de información o el aprendizaje automático.

Es una herramienta para analizar elementos de texto con el fin de identificar, deducir y ampliar conocimiento a partir de cualquier organización de documentos (documentos electrónicos, bases de datos, etc.), puede entender semánticamente el contenido de uno o más documentos y crea una catálogo de los temas tratados. En la práctica, se podría considerar una extensión del tipo de web mining de contenidos. Su objetivo es también la categorización de texto, el procesamiento en lenguaje natural, la extracción y recuperación de información o el aprendizaje automático.

Los mismos autores refieren que: “No se debe confundir text mining con la recuperación de información (retrieval information) según la definición “clasica” heredada de los SGD (Sistemas de gestión documental): estos parten de la recuperación de documentos como respuesta a una petición basada en palabras clave y términos de indización dentro de una ecuación de búsqueda, en vocabulario controlado o en texto completo. El término text mining no dispone, en cambio, de ese punto de partida, sino que se refiere a un proceso en que se examina una colección de documentos para descubrir información que no está individualmente en ningún ítem sino que está representada en un determinado segmento de conocimiento producto de una cadena de implicaciones causales”

3.1.1 Etapas

Según Montes [24], la minería textual se define como el proceso de descubrimiento de patrones interesantes y nuevos conocimientos en una colección de textos. Este proceso consiste de dos etapas principales: una etapa de preprocesamiento y una etapa de descubrimiento (Tan [25]). En la primera etapa, los textos se transforman a algún tipo de representación estructurada o semi-estructurada que facilite su posterior análisis, mientras que en la segunda etapa las representaciones intermedias se analizan con el objetivo de descubrir en ellas algunos patrones interesantes o nuevos conocimientos.

Figura 3.1 Minería textual. Proceso de descubrimiento de patrones.

Dependiendo del tipo de métodos usados en la etapa de pre-procesamiento es el tipo de representación del contenido de los textos construida; y dependiendo de esta representación, es el tipo de patrones descubiertos.


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios