Archivo de la etiqueta: flash

Almacenamiento en el evento “CPD de Siguiente Generación” (2)

Continuando con la entrada anterior, G. Chillón cerró la sesión de la mañana hablando sobre las grandes ventajas que la tecnología flash aporta a las bases de datos Oracle.

Señaló que la mejora en la tecnología de discos es mucho más lenta que en el tema del procesamiento. Los mejores discos trabajan a 15.000 rpm desde hace unos ocho años y ahora un moderno procesador es unas 260 veces más rápido que un disco.  Eso provoca importantes esperas lo que redunda en que las aplicaciones no sacan todo el potencial de los modernos procesadores.

El almacenamiento flash aporta baja latencia, da más caudal y disminuye el consumo y el espacio de forma significativa con respecto a los discos. Componer discos de estado sólido con esta tecnología mejora algo el tema, pero cuando realmente se saca partido es cuando se construye una capa intermedia entre la memoria DRAM y el disco rápido.

Pero para que esta capa funcione bien, el software ha de conocer su existencia y saber aprovecharla. La versión de Oracle DB 11gR2 dispone de un módulo Smart Flash Cache que optimiza al máximo estas posibilidades, por lo que el binomio de ambas han producido productos tan extraordinarios como el Exadata o el record mundial de Tpm-C.

Cuando el caudal de IOPS es crítico hay instalaciones que acuden a fragmentar la base de datos en gran número de discos. El ejemplo adjunto muestra cómo conseguir la misma cifra de IOPS con estas dos estrategias y habla por sí solo.

Para los que no puedan implantar por ahora la revisión Oracle DB 11gR2, la buena noticia es que gestionando por configuración que los índices se ubiquen en la memoria flash, se pueden conseguir mejorar dos veces el rendimiento.

Abrió la sesión de tarde Helena Blanco que se centró en el resurgimiento de la tecnología de cintas de la mano de soluciones de archivo a largo plazo y como última línea de defensa de los datos ante catástrofes.

Centrándonos en el primer tema, que tiene especialísimo interés en sanidad,  nos encontramos con la problemática de tener que almacenar datos por muchos años, que posiblemente se acceda a ellos muy poco pero que tienen que estar disponibles por temas de regulaciones o investigación. Y en ese tiempo las tecnologías irán cambiando y habrá que hacer migraciones. Y claro, eso lleva a temas como la conveniencia de tener esos datos en un disco dando vueltas y gastando energía a lo tonto o cómo traspasar centenas de TB de un medio a otro sin impacto en el servicio.

La propuesta de Oracle se basa en una solución con dos productos de software trabajando sobre una arquitectura jerarquizada con el nivel más bajo basado en cintas. Quick File Systems (QFS) soluciona el interfaz con las aplicaciones y cumple el estándar Posix. Storage Archive Manager (SAM) es un sistema automatizador de la jerarquía de datos, con larga experiencia en el mercado.

En la figura adjunta se presenta una arquitectura de archivo jerarquizada en alta disponibilidad. En otra lámina se esquematizan los cuatro procesos básicos que tiene el SAM.  SAM está gobernado por políticas que define el administrador y trabaja trasparente al usuario y a las aplicaciones.

Un ejemplo de cómo podría ser la operación sería que de salida un fichero se archiva en los tres niveles del CPD principal y en cinta en el de respaldo. Al cabo de un mes, si no se ha señalado lo contrario,  se elimina del primer nivel del  CPD principal, liberando espacio en el disco más rápido y más caro. Y al cabo de seis meses se podría liberar también del nivel intermedio. Si en algún momento se accediese a datos que no están en el nivel 1, estos se podrían recopiar a dicho nivel y reiniciar el ciclo. Y quizás al cabo de siete años se procedería internamente a un reciclado de soporte físico, sin interrupciones de servicio.

El ahorro de costes directos e indirectos en consumo de energía, espacio y gestión que supone el tener un alto porcentaje de almacenmiento en cinta hace que una solución jerarquizada sea una alternativa muy a tener en cuenta en los entornos sanitarios.

Cerró la jornada M.A. Borrega que trató sobre la protección del dato, que no solo es una necesidad para minimizar riesgos del negocio sino que en muchos casos es objeto de regulación específica.  Hay muchos sistemas de protección del dato, pero lo más importante es comprender que no todos los datos son igual de sensibles y hay que considerar las necesidades en lo que se llama Tiempo de Recuperación (RTO) y Punto de Recuperación (RPO).

En cuanto al nivel de backup y recuperación para las bases de datos  Oracle DB dispone de la eficiente herramienta RMAN integrada en el producto y sin coste adicional para copias de respaldo a disco. Oracle Secure Backup es una herramienta que añade a RMAN la gestión del dispositvo de cintas y supone una eficiente solución para el respaldo tradicional de las bases de datos corporativas. En la lámina adunta se presenta una sofisticada solución de backup con respaldo remoto.

En cuanto a la replicación de bases de datos, Oracle en la versión Enterprise incluye Oracle Data Guard 11g que permite replicaciones síncronas y asíncronas. Es independiente del almacenamiento y en el CPD remoto sólo se puede leer, lo que, entre otras muchas ventajas,  aisla de corrupciones de disco. El producto estrella es Oracle Golden Gate que permite replicaciones entre diferentes gestores de bases de datos, trabajar en activo-activo y, entre otras prestaciones destacadas, facilita los mantenimientos y las migraciones.

Por último, se presentaron soluciones de respaldo para Exadata según las necesidades, bien directamente vía Infiniband con RMAN y un sistema ZFS Storage Appliance, a cinta con Secure Backup o mixta, como aparece en la figura.

Open Storage incorporará almacenamiento en estado sólido

Esta entrada es mi versión libre del blog de Jonathan Schwartz, CEO de Sun Microsystems, a quien recomiendo acceder para leer la versión original. La razón de hacer este post es compartir con los lectores en español los importantes anuncios que siguen al lanzamiento del Open Storage, por la capital importancia que tiene el almacenamiento y archivo en sectores tan consumidores de datos como la sanidad y la nueva educación.

Según la visión tradicional de los responsables de los centros de procesos de datos, sólo hay dos tipos de dispositivos de almacenamiento: los que han fallado y los que lo van a hacer. Y es que todos los discos fallan y los más baratos lo hacen antes.

Si el tiempo típico de fallos son cinco años, a nivel personal uno se puede manejar con copias de seguridad ocasionales. Pero si nos vamos a los servidores corporativos con cantidades de discos desde 100 a 100.000, los fallos son diarios. No lo dudemos, los discos fallan.

Y cuando fallan, entra el tema de la potencial pérdida de datos. Y no es lo mismo perder una cita (que ya es grave) que perder historiales y sufrir encima una gran multa por incumplimiento de la ley. En el caso de los datos clínicos de los pacientes, la custodia de datos ha de ser, simplemente, perfecta.

Esta es la razón por la que Sun inventó, hace ya varios años, una plataforma de almacenamiento llamada ZFS. ZFS parte de un importante axioma: un sistema fiable se tiene que construir sobre componentes no fiables. ZFS utiliza ciclos sobrantes de computación para realizar constantes chequeos de integridad, evitando corrupciones ocultas. Con ZFS los usuarios pueden usar los discos y sistemas más sencillos con una excepcional integridad de datos, proporcionando una importante reducción de costes y complejidad.

Pero hay una nueva opción en escena, conocida por todos ya que la usamos en teléfonos móviles, PDA, cámaras, etc: las memorias flash. Las memorias flash son muy rápidas leyendo y escribiendo, como las memorias DRAM de los ordenadores. Su precio está entre medias de las memorias DRAM y los discos. Pero, a diferencia de otras tecnologías, las flash no necesitan alimentación para conservar los datos. Y con el incesante incremento del coste de la energía, mantener 10.000 discos rotando a muchas rpm puede costar tanto como el mismo precio de los dispositivos. El coste energético ha pasado a ser un factor dominante en las decisiones de hardware de gran escala. En este contexto, las flash llegan para hacer un cambio perturbador.

Históricamente ha habido dos grandes barreras para el uso de las flash a nivel empresarial. La primera es el coste. El precio por Gigabyte de un flash es mayor que el del correspondiente en disco. Pero entre el descenso de precios de las flash y el encarecimiento del coste de la electricidad, el coste por gigabyte disponible en una flash está bajando rápidamente. Aunque el coste de un gigabyte en disco físico es menor que el de una flash, el tiempo de acceso para lectura o grabación de este gigabyte desde una flash es, al menos, de un orden de magnitud menor, por lo que el coste por gigabyte servido es excepcionalmente bajo.

Pero incorporar simplemente una flash como un nivel de almacenamiento más no aporta gran valor, ya que añade nuevos costes y complejidad. El paradigma que cambia el panorama es cuando la flash es completamente transparente para el usuario y el operador al mismo tiempo, sin conmutaciones ni costes operacionales. Y esto es lo que hacemos con ZFS. ZFS incorporará la flash en la jerarquía de memoria de los sistemas en explotación, usando la cache del microprocesador para las tareas más sensibles al rendimiento, DRAM para las siguientes, luego flash, luego disco y, por último, cinta magnética.

ZFS permitirá a la flash unirse a la DRAM y a los discos convencionales para formar una plataforma híbrida para conseguir los mejores precios, rendimiento y eficiencia energética. Simplemente, nuestros servidores y almacenamiento irán enórmemente rápidos, sin necesidades de hacer una actualización del microprocesador. Añadir una flash será como añadir memoria DRAM, que, una vez instalada, no es necesaria nueva administración, simplemente hay más capacidad.

Esta es una de las razones para estar emocionado: el coste por gigabye servido ( el coste operacional total del almacenamiento) cae en picado al incorporar la flash en la mezcla, en especial para aplicaciones intensivas en datos (como MySQL, Postgres, Oracle o SQL Server). Partiendo de un adecuado diseño, las flash tienen el potencial de ofrecer mejoras de varios órdenes de magnitud en coste y prestaciones y, con la inminente llegada de la plataforma de base del virtualizador Sun XVM, se pueden exportar estos beneficios a otros sistemas operativos instalados sobre xVM, es decir, instalando sobre xVM una instancia de Windows, éste se puede beneficiar de las mejoras de ZFS+ flash.

La segunda barrera tiene que ver con el deterioro por escrituras de las flash. Aunque se puede leer un flash infinitas veces sin problema, grabar en una flash varios cientos de miles de veces puede degradarla. Para una cámara no es problema, ya que es casi imposible hacer 500.000 fotos, pero en una solución empresarial ¿qué hacer?.

ZFS trata a la flash como a cualquier otro dispositivo de almacenamiento -recordemos que todos fallan- y gestiona la integridad de los datos sea cual sea la causa del problema. Cada vez mas sofisticados algoritmos de gestión del nivel de deterioro permiten maximizar la vida útil de las flash. El resumen es que con ZFS al timón, el deterioro de las flash no es un problema, aunque tanto las flash como los discos tienen límites.

Estas son las premisas que fundamentan la estrategia de Sun de Open Storage. Estamos integrando ZFS, memorias flash y algunas otras innovaciones excepcionales en hardware/silicio para ofrecer sistemas de almacenamiento y servidores de altas prestaciones, bajo consumo y uso general, acelerando cualquier software que se ejecute sobre nuestros sistemas Sparc o x86. En concreto, los usuarios de MySQL lo verán como un turboacelerador. Y por una fracción del coste de una solución NAS convencional. Nuestros primeros sistemas con flash estarán en el mercado hacia final de este año.

En línea con nuestra estrategia, ZFS y todo el software involucrado será gratis sin soporte comercial en el tradicional modelo Open Source (OpenSolaris, ZFS, MySQL y Postgress se pueden conseguir en este enlace) y hay versión también para Mac OSX.

Nuestros ingresos vendrán de aquellas empresas que quieran un soporte profesional de Sun para despliegues de misión crítica. En el lado del hardware, estamos impulsando una estrategia de prueba antes de la compra, por la que los clientes o nuestros socios de negocio pueden solicitar uno de nuestros sistemas para probar sin compromiso durante 60 días. Si le convence, lo compra. Si no, nos hacemos cargo de él.

Si lo anterior no lo hace obvio, es interesante dejar constancia de que la visión de Sun es que, dado que los precios de la energía continúan subiendo y los de las flash cayendo en picado, la combinación de flash, ZFS e la innovación real de sistemas en base a ello tendrán un impacto en las economías de los centros de datos mayor que la virtualización.