Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

2.5.2 Minería WEB

De acuerdo con Vicente [21], la minería de web se refiere al proceso de descubrir la información o conocimiento potencialmente útil y previamente desconocido a partir de datos web. En la Red, en cuanto a información, no hay estándares, no es estructurada y es hetereogénea. Crece y cambia muy rápidamente, y esto hace necesario disponer de un mejor descubrimiento de recursos y de la extracción de conocimiento. Se pueden descubrir elementos de información interesantes que aportan información y conocimiento valiosos. La minería de web combina comunicación, objetivos y técnicas de diferentes áreas.

Hace notar que se utilizan técnicas de minería de datos para descubrir automáticamente los documentos y servicios del web y extraer información de ellos. La minería de web se descompone en las siguientes tareas:

Descubrimiento de recursos: localización de documentos relevantes o no de la red. Ésta es la función de los índices buscadores (que extraen contenido basándose en palabras, zonas del documento, idioma) y de los índices temáticos (que clasifican los documentos). Extracción de información: extracción de determinada información a partir de un documento, independientemente de su formato (HTML, XML, texto, ps, PDF, LaTeX, FAQ, etc.).

Generalización: descubrimiento de patrones generales a partir de sitios web individuales (agrupamiento de documentos o clustering, asociaciones entre documentos).

Análisis, validación e interpretación de los patrones

Taxonomía de la minería de web.

Minería de contenidos. Consiste en diversos tipos de datos, tales como texto, imágenes, audio, vídeo, metadatos e hiperenlaces. La búsqueda reciente en la minería de múltiples tipos de datos se llama minería de datos multimedia.

Minería de estructura. Intenta descubrir el modelo subyacente de las estructuras de los enlaces del web. El modelo se basa en la topología de los hiperenlaces con o sin la descripción de los enlaces.

Minería de uso. Intenta dar sentido a los datos y comportamientos generados en las sesiones de navegación del web.

Mientras que la minería de contenidos y estructura utiliza los datos reales o primarios del web, la minería de uso mina los datos secundarios derivados de las interacciones del usuario con el web.

Técnicas usadas


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios