3.2.4 Algoritmo de optimización por Reducción de Secuencia Molecular (MSR: Reduction Sequence Molecular)

3.2.4.1 Introducción al algoritmo MSR

Este algoritmo esta patentado por un proveedor de soluciones emergentes en el mercado, y se basa en técnicas desarrolladas originalmente para analizar secuencias del genoma. El enlace clave entre ambos campos altamente dispares: el establecimiento de una red y el genoma, es que ambos campos están referidos fundamental al proceso de secuencias largas o a cadenas de datos. En el caso del genoma, los datos se basan en las moléculas biológicas del DNA que son representadas computacionalmente como una secuencia de caracteres derivados de un alfabeto de cuatro letras, A, C, G, y T. En el caso del establecimiento de una red, los datos se basan en secuencias de bytes que forman un alfabeto de 256 letras.

El genoma de un organismo consiste en un sistema sumamente complejo de las instrucciones para la construcción y el funcionamiento de ese organismo. La clave científica y el desafío médico en este campo es que estas instrucciones están escritas en un lenguaje que todavía no se entiende. El primer pasó para decodificar y descifrar un lenguaje desconocido es generalmente la identificación de todos los patrones repetidos que ocurren en diversos ejemplos del lenguaje. Por ejemplo, si intentamos descifrar el lenguaje español, podemos examinar este papel y encontrar que las palabras "son", "y" y "rojo" son repetidas múltiples veces.

Una vez que se han encontrado estos patrones, las dependencias entre ellas se analizan para entender la gramática y la construcción de la lengua. Por ejemplo, la frase "la red" aparece a menudo en este trabajo, pero la frase "es" nunca aparece. De este modo, los científicos en el campo de la biología molecular computacional están aplicando varias técnicas avanzadas de comparación y aprendiendo de la computadora técnicas para continuamente incrementar su comprensión del lenguaje genoma.

Como el análisis de la secuencia del DNA, la Reducción de Secuencia Molecular se basa en descifrar y entender el origen del lenguaje del tráfico en la red. MSR entonces utiliza este conocimiento del lenguaje de la red para "traducir" los datos originales en una representación más eficiente. Un segundo dispositivo MSR en el otro extremo de la red entonces traduce de regreso el tráfico codificado para generar una copia idéntica del tráfico original. Los algoritmos avanzados del lenguaje de análisis de MSR detectan los patrones repetidos en el tráfico y construyen un vocabulario dinámico de los patrones claves transmitidos a través de la red. En el mismo tiempo, MSR aprende las dependencias entre estos patrones para construir una base de conocimientos completa de cómo estos patrones básicos pueden ser arreglados para construir otros patrones más grandes y más complejos. Esta base de conocimientos es continuamente actualizada con más patrones y dependencias que están aprendiendo del tráfico de la red. En el mismo tiempo, patrones más viejos que son poco frecuentes y no contribuyen a la reducción de datos se envejecen fuera y se substituyen por los nuevos y por más patrones relevantes. De este modo, la base de conocimiento de MSR se mantiene sincronizada continuamente con el lenguaje dinámico y las características de tráfico de la red.

Las capacidades únicas de aprender-lenguaje de MSR, permiten que esta tecnología sea aplicada a todos los tipos de tráfico de la red y con muy baja latencia por paquete. La base de conocimientos dinámico creado por MSR permite la detección y la reducción de patrones de cualquier tamaño que son separados por un número pequeño o grande de bytes y paquetes. Por lo tanto, ambos patrones textuales pequeños que se pueden repetir dentro de distancias cortas así como patrones binarios más largos que se puedan separar por centenares de kilobytes o de megabytes de tráfico se pueden detectar y reducir por esta tecnología. La estructura única de la base de conocimientos del MSR también proporciona muy alta escalabilidad y permite que esta tecnología funcione en tiempo real a muy alta velocidad.

En contraste con MSR, las tecnologías tradicionales de compresión se basan en buscar y sustituir patrones dentro de un buffer histórico fijo.

Este buffer fijo pone límites en la distancia máxima entre los patrones (es decir, sólo los patrones que son menos de 2 kilobytes y que a parte serán comprimidos) así como la escalabilidad y la velocidad de funcionamiento de estos esquemas tradicionales. Mientras que se aumenta el tamaño del buffer de búsqueda para identificar más patrones repetidos, el poder de procesamiento y latencia también aumentan dramáticamente. Por lo tanto las técnicas tradicionales de compresión han hecho frente a una compensación difícil entre la latencia y las tarifas de reducción. El resultado es que mientras la compresión está extensamente disponible en routers, esta compensación evita que la mayoría de las empresas utilicen esta característica a través de sus enlaces WAN.

La mayoría de las redes no pueden afrontar la latencia adicional (a menudo 30 milisegundos o más) para alcanzar niveles de reducción del destino. Por comparación, MSR agrega típicamente menos de 2 milisegundos de latencia mientras que alcanza mucho más tasa de reducción.

Empleando totalmente un nuevo acercamiento para aprender dinámicamente y almacenar inteligentemente la base de conocimientos de patrones repetidos, el MSR supera estas limitaciones para proveer significativamente de mayores patrones de detección y reducción con escalabilidad virtualmente ilimitada.

Descargar en PDF

3.2.4 Algoritmo de optimización por Reducción de Secuencia Molecular (MSR: Reduction Sequence Molecular)