Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

5.10 MANEJO DE RESULTADOS

5.10.1 NORMALIZACIÓN DE LOS RESULTADOS

Debido a que el contenido de algunos elementos básicos (Verbos y Referentes de objeto), se puede considerar atómico y repetible, es necesario normalizarlos en base a los siguientes criterios.

Verbos.

Como se ha mencionado previamente, el verbo se trabaja en infinitivo y las locuciones verbales se sustituyen con sinónimos, tal como se documenta en el anexo G.

Ejemplo.

El verbo: presentará

Resulta en: presentar

La locución verbal: dar a conocer

Resulta en: informar

Referentes de objeto.

Aun cuando el referente hasta este momento ha conservado el artículo que le precede. Se procede a la eliminación de cualquier término que no aparezca en el anexo de objetos y se deja el término en singular.

Ejemplo.

El referente: la Celebración Eucarística

resulta en: celebración

Calificativos de objeto.

Los adjetivos se normalizan mediante su lematización. El lema de los adjetivos (calificativos y ordinales) es siempre la forma masculina singular o la forma singular si es un adjetivo de una sola terminación.

Ej.

El adjetivo: nuevas

Resulta en: nuevo

5.10.2 REGISTRO DE LAS NOTICIAS

Una vez normalizados los elementos básicos obtenidos, se procede al registro de los siguientes atributos, tal y como se muestra en la figura 5.11:

Empresa = La entidad que publica la noticia

Fecha = La fecha de la publicación

Noticia = Consecutivo de noticia por empresa y fecha

Agente = El descriptivo de quien realizó la acción

Verbo = La actividad realizada por el agente

Objeto Referente = El tipo de objeto usado

Objeto Determinativo = La descripción amplia del objeto

Paciente = El descriptivo de quien recibe el efecto de la acción

Para un mayor abundamiento, en el anexo J, se plasman los resultados de procesar un total de 130 noticias del 1 de marzo de 2006, para las empresas antes citadas.

Figura 5.11. Registro de los resultados

Sin embargo y como puede observarse, algunos de ellos tales como Empresa, Verbo y Referente de Objeto, por su naturaleza, presentan duplicidad en su contenido, por lo cual pueden ser referenciados mediante claves en otros archivos, tal y como se aprecia en la figura 5.12 y cuyo mayor detalle se puede encontrar en el anexo K, donde aparecen las sustituciones realizadas.

Figura 5.12. Registro de los resultados con sustitución

Adicionalmente, a partir del análisis de los resultados se observa que los componentes del contexto, solamente sirven para expresar más ampliamente la noticia, pero no representan elementos sustanciales para la función de inteligencia propuesta, por lo cual se toma la decisión de no incluirlos en el registro de la base de datos.

Para el registro de cada noticia, se realicen las siguientes comandos:

/* Se incrementa la clave de noticia por empresa */

Noticia = Noticia + 1

/* La fecha es del día en que se publicó la noticia */

insert into NOTICIAS values (:ClaveEmp, :Fecha, :Noticia, :Agente, :ClaveVerbo, :ClaveObjRef, :ObjDet, :ObjCal, :Paciente)


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios
 
Todo en eumed.net:

Congresos Internacionales


¿Qué son?
 ¿Cómo funcionan?

 

15 al 29 de
julio
X Congreso EUMEDNET sobre
Turismo y Desarrollo




Aún está a tiempo de inscribirse en el congreso como participante-espectador.


Próximos congresos

 

06 al 20 de
octubre
I Congreso EUMEDNET sobre
Políticas públicas ante la crisis de las commodities

10 al 25 de
noviembre
I Congreso EUMEDNET sobre
Migración y Desarrollo

12 al 30 de
diciembre
I Congreso EUMEDNET sobre
Economía y Cambio Climático

 

 

 

 

Encuentros de economia internacionales a traves de internet


Este sitio web está mantenido por el grupo de investigación eumednet con el apoyo de Servicios Académicos Internacionales S.C.

Volver a la página principal de eumednet