Cómo administrar el crecimiento desmesurado de información

A nivel mundial, la información crece exponencialmente año a año. En 2010 se rompió la barrera del zettabyte, y durante el 2011 alcanzó 1,8 zettabytes, o 1,8 trillones de gigabytes. Aunque en buena medida la generación de contenidos está en manos de usuarios, las empresas también son responsables de 80% de la información del universo digital en algún momento.

En las organizaciones se puede encontrar que su fuente de información no solamente son las bases de datos o los repositorios de archivos, sino una gran cantidad de fuentes no convencionales que generan aún más datos. Esta información puede clasificarse en estructurada y no estructurada. Ambas crecen en gran medida, pero los datos no estructurados, son los que mayor crecimiento tienen debido a esas nuevas fuentes no convencionales como las redes sociales, los motores de búsqueda, la generación de videos y archivos de audio, entre otros. Hoy en día casi todas las personas cuentan con un equipo digital, ya sea computador, tableta ó teléfonos inteligentes, a través de los cuales generan mas datos, por lo que hay un crecimiento explosivo de la información, siendo este fenómeno conocido como “Big Data”.

Esta situación de crecimiento desmesurado de la información ha llevado a las empresas a analizar si es realmente rentable y viable mantener infraestructuras independientes de almacenamiento para diferentes tipos de datos, de manera que manejen su administración a través de herramientas de gestión avanzadas, o la posibilidad de unificar en una misma infraestructura los distintos tipos de información lográndose que se gestionen como si fuera una sola, siendo esto lo que hemos desarrollado en EMC y que denominamos Almacenamiento Unificado; que una misma infraestructura se encuentre en capacidad de administrar múltiples clases de almacenamiento de una empresa, de acuerdo al tipo de datos que esté manejando.

El almacenamiento unificado brinda la posibilidad de que una sola tecnología esté en capacidad de brindar diferentes tipos de servicio para distintos tipos de datos estructurados y no estructurados. Esta funcionalidad la brinda el conjunto de sistemas de almacenamiento unificado: EMC® VNX®. Estas soluciones de almacenamiento consolidan un sólido grupo de arreglos de almacenamiento unificado que escala de sistemas de nivel de entrada a sistemas de clase de datacenter. Un ejemplo es el sistema VNXe (de nivel de entrada), que fue especialmente diseñado para pequeñas y medianas empresas, soluciones de almacenamiento al nivel de departamento empresarial y sucursales y oficinas remotas, y combina simplicidad con eficiencia, disponibilidad y rendimiento avanzados.

Por otro lado, es interesante observar que la información que más crece es la no estructurada, prácticamente el 80% de la información almacenada en el mundo es información no estructurada; y vemos que del 100% de esa información no estructurada el 90% se denomina información fría, que se consulta de vez en cuando, y que va perdiendo relevancia con el tiempo. Existen empresas que por la naturaleza de sus negocios, deben tener siempre disponible este tipo de información no estructurada, a pesar de no consultarla con frecuencia; es por ello que se generan las interrogantes de cuál es el sitio correcto y la tecnología apropiada para almacenar este tipo de datos que dejaron de ser relevantes pero que deben estar disponibles, a un costo razonable. El desafío real ha sido encontrar la manera de analizar y capitalizar mejor toda esta información.

El aprovechamiento exitoso de los grandes volúmenes de datos depende de la implementación de una base de almacenamiento escalable y altamente flexible en el data center principal. En EMC se han diseñado soluciones y productos NAS de escalamiento horizontal que brindan el rendimiento, la escalabilidad y la simplicidad necesarios para soportar grandes volúmenes de cargas de trabajo de datos y permitir un análisis en tiempo real de su comportamiento. EMC Isilon ha establecido el estándar para NAS de escalamiento horizontal, además de proporcionar una arquitectura de almacenamiento diseñada específicamente para satisfacer las exigencias del gran volumen de datos. Ahora las organizaciones empresariales pueden crear una plataforma end-to-end completa para grandes volúmenes de datos escalable por etapas desde las aplicaciones empresariales a gran escala hasta los flujos de trabajo verticales más exigente.

EMC también ha desarrollado tecnologías que jerarquizan automáticamente la información, colocándola en el lugar más costo-efectivo posible. A través del software  FAST (Fully Automated Storage Tiering), como herramienta opcional en los avanzados sistemas EMC VNX, se optimiza el rendimiento de los sistemas de manera automática, además de crear un nuevo ambiente operativo que puede incrementar en una gran medida el rendimiento del sistema. Un sistema que permita múltiples clases de almacenamiento que permitan combinarse entre ellas, puede lograr que los datos más utilizados estén localizados en una capa de almacenamiento superior de mayor rendimiento, mientras que los datos de propósito general se almacenan en una segunda capa de discos de propósito general y los datos históricos o que dejan de ser relevantes se almacenan en una tercera capa de discos de bajo rendimiento y alta capacidad. Cada una de ellas tiene una relación de costo-beneficio diferente. La capa superior se trabaja con discos de estado sólido que son muy rápidos para lograr un rendimiento muy alto, la segunda capa se trabaja con discos SAS que son de propósito general, y la tercera capa con discos de alto volumen de tipoe NearLine-SAS.

Otro punto importante, es el desarrollo de estrategias de prevención que permitan que los datos estén continuamente disponibles a pesar de que ocurra una falla. En EMC  hemos desarrollado soluciones  de Alta disponibilidad y “disaster recovery” para lograr que estos sistemas de almacenamiento de muy alto nivel permitan que los datos esten siempre disponibles a costos accesibles. Lo ideal es definir estrategias de prevención ante estos casos, y no esperar buscar soluciones luego que ocurren los incidentes.

Contar con soluciones de Almacenamiento Unificado de EMC le permitirán a las organizaciones consolidar sus servicios, dentro de una estructura más eficiente, con menos tareas de administración, logrando una mejor relación costo-eficiencia en el uso de sus recursos y alcanzando una mayor disponibilidad de la información para atender mejor a sus mercados.