3.2.4.2.1 Componentes principales del algoritmo MSR

Los cuatro componentes primarios del algoritmo MSR son:

• El descubrimiento de patrones
• La construcción del diccionario adaptativo
• La sincronización del diccionario
• La reducción de datos Las secciones siguientes describen cada uno de estos componentes en más detalle.

3.2.4.2.2 El descubrimiento de patrones

El algoritmo de descubrimiento de patrones es uno de los diferenciadores clave de esta tecnología. La velocidad y la granularidad con los cuales el algoritmo de descubrimiento del patrón busca nuevos patrones es crítico a las altas tasas de reducción de datos proporcionadas por MSR y a las altas velocidades de la red en la que esta tecnología pueda funcionar.

Mientras que cada nuevo símbolo de entrada es procesado por el motor de MSR, primero se comprueba para determinar si es o no parte de un patrón preexistente el cual se ha aprendido y se ha agregado ya al diccionario.

Si el símbolo no es parte de un patrón preexistente del diccionario, el algoritmo del descubrimiento del patrón de MSR busca un buffer que consiste en símbolos previamente procesados para determinar si el símbolo actual es parte de un nuevo patrón que ha ocurrido anterior en este buffer pero que aún no ha sido agregado al diccionario. Para maximizar la cantidad de datos de entrada que se puedan almacenar en este buffer histórico "mirar - atrás", el buffer así mismo se codifica en un formato altamente condensado. Por lo tanto, el tamaño físico de este buffer puede ser de 10 a 100 Mbytes, que alternadamente pueden representar 100 a 1000 Mbytes de los datos originales sin codificar.

El tamaño de este buffer histórico es determinado solamente por la cantidad de memoria física disponible en el dispositivo. La velocidad del algoritmo no es afectada por el tamaño del buffer. La capacidad del MSR de buscar este buffer grande a altas velocidades es por lo tanto una fortaleza clave del algoritmo y la fuente de las altas tasas de reducción de datos que alcanza.

Los patrones descubiertos en este buffer se comprueban para considerar si pasan un umbral significante, en que casos son agregados al diccionario por el módulo de construcción del diccionario.

Descargar en PDF

3.2.4.2.1 Componentes principales del algoritmo MSR