Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

5.6 TRATAMIENTO MANUAL DE UNA MUESTRA DE TITULARES DE NOTICIAS

A partir de la propuesta anterior, se efectuó un análisis manual de las noticias publicadas el día 17 de noviembre de 2005, en los portales de las empresas escogidas para la muestra. Se realizó este ejercicio, para detectar algunos puntos representativos en las noticias publicadas y delinear un patrón que siente las bases para la construcción del algoritmo computacional.

Este primer procesamiento se aplicó solamente a los titulares para determinar el grado de efectividad de la solución automatizada y se encontró que:

- Los eventos notificados, en algunas ocasiones, corresponden a las acciones (verbos), pero en otras, a los objetos

- Solamente aquellos titulares con un evento claramente definido, fueron tratados

- Por su naturaleza, el lugar y fecha no aparecen en las noticias empresariales, pero la fecha corresponde al día que se visitó al sitio y éste, al lugar

- En su gran mayoría, el actor de manera implícita, es la empresa que publica las notas

- De manera similar, el paciente generalmente no se indica, pero atañe a la comunidad a la que sirve

- Gran parte de los titulares aceptados, contiene el referente y determinativo del objeto, más no así, la calificación y determinativo correspondiente.

Conforme se fueron procesando los titulares, se detectó que varios no indicaban acción ni objeto, razón para no considerarlos y determinar que para esos casos, se requiere un análisis más amplio sobre el encabezado ó primer párrafo de la nota. En raras ocasiones, algunas noticias manejan solamente el título y el mismo no se pudo procesar, indicativo de una incorrecta redacción.

Una vista parcial de los resultados del tratamiento del lead, aparece en la tabla 4.

Con los datos recabados de esta revisión manual, se puede determinar que, para conocer lo que en términos generales hace la universidad, es aplicable el procedimiento propuesto y a partir de ahora, se está en camino de automatizarlo.

Adicionalmente, los objetos y verbos detectados serán la base de los conjuntos de términos especiales por utilizarse más adelante, los cuales son consagrados en los anexos B y C, respectivamente.


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios