Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

1.2 Descripción del problema

La minería de texto es el área de investigación más reciente del procesamiento de textos. Su proceso principal consiste de: preprocesamiento y descubrimiento. En la primera etapa, los textos se transforman a algún tipo de representación estructurada o semiestructurada que facilite su posterior análisis, mientras que en la segunda etapa las representaciones intermedias se analizan con el objetivo de descubrir en ellas algunos patrones interesantes.

En este trabajo se propone un método de representación formal del contenido de las noticias y un mecanismo para, a partir de ella, responder a preguntas que generalmente se hacen los ejecutivos con respecto a las empresas competidoras.

1.3 Objetivos de la tesis

1.3.1 Objetivo general

Diseñar un nuevo método de minería de texto, apto para representar el contenido de noticias empresariales, que permita trasladar los descubrimientos del nivel temático a un nivel de mayor detalle y conduzca a responder preguntas propias de la inteligencia competitiva.

1.3.2 Objetivos específicos

1. Documentar las ideas principales sobre la inteligencia empresarial y competitiva, la comunicación social y la publicación de noticias empresariales y sobre todo, el estado del arte que guarda la tecnología de información que se pretende aplicar: La minería textual

2. Revisar el estado del arte que guardan las distintas propuestas de tratamiento automático de textos en dominios generales y específicos.

3. Analizar la naturaleza de las noticias empresariales publicadas en la Web, sus componentes, sus estructuras usadas, sus elementos básicos; todo ello para fundamentar una mejor propuesta

4. Plantear los criterios a seguir en la definición del tipo de texto a procesar, el sector industrial a analizar, las empresas más representativas del mismo, los elementos a tratar de la noticia y el esquema de tratamiento.

5. Diseñar un método para la extracción de elementos básicos a partir de las noticias, que permita un registro estructurado de los hallazgos para una posterior explotación.

6. Diseñar un mecanismo que permita responder a preguntas genéricas desde los acontecimientos publicados por las diversas empresas del sector elegido.

7. Diseñar el sistema computacional para la administración de la función de inteligencia competitiva y la diseminación de dicha inteligencia, al equipo humano responsable de la toma de decisiones estratégicas.


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios