Archivo

Posts Tagged ‘san’

Almacenamiento masivo profesional (I): RAID, PATA, SATA, SCSI y SAS

24 junio, 2010 1 comentario

Todos sabemos que los ordenadores no son más que un motón de tornillos, circuitos impresos, chips y dispositivos que no sirven absolutamente para nada si no son dirigidos por una serie de instrucciones que les digan lo que tienen que hacer en cada momento. Son ese conjunto de instrucciones, los programas, quienes realmente hacen que el ordenador cobre vida. Un programa es el responsable de que nuestro ordenador arranque, un programa es el que carga nuestro sistema operativo en memoria, son un conjunto de programas (que conforman el sistema operativo) los que nos permiten hacer uso de ese conjunto chips y dispositivos físicos (el hardware) y son los programas de usuario los que nos permiten, apoyándose sobre el sistema operativo, realizar nuestro trabajo diario con el ordenador: escribir documentos, enviar y recibir correos, navegar…

Sin embargo, para que el ordenador pueda utilizar esos programas, estos tienen que almacenarse en un soporte desde el cuál puedan leerse y cargarse en la memoria del sistema, condición indispensable para su uso. Por ejemplo, el programa encargado de hacer que nuestro ordenador arranque, llamado BIOS (Basic Input-Output System), se almacena en un chip de sólo lectura localizado en la placa base del ordenador (a este software también se le conoce con el nombre de firmware), el programa encargado de cargar el sistema operativo se almacena en una zona especial del disco duro llamada MBR (Master Boot Record), el sistema operativo y el resto de aplicaciones pueden encontrarse en cualquiera de los dispositivos de almacenamiento existentes actualmente (disco duro, CDROMs, DVDs, memorias USB o dispositivos SSD).

Capas de Software

En este, y en sucesivos posts, haremos un recorrido por las principales estrategias de almacenamiento de datos en los discos duros y veremos como el uso de estos dispositivos se escala, y sus estrategias de almacenamiento se reutilizan, para proporcionar sistemas de almacenamiento en red con una orientación más profesional, capaces de proporcionar mayor capacidad de almacenamiento, fiabilidad y disponibilidad.

Partamos de una situación que todos conocemos, un ordenador con un disco duro instalado localmente, es decir, dentro del propio equipo. Esta es la configuración normal en un entorno doméstico. También es habitual que estos discos duros sean discos PATA (Parallel Advanced Technology Attachment), ya obsoletos, o SATA (Serial Advanced Technology Attachment).

Suele ser normal referirse o clasificar a los discos duros según la interface (ATA, SATA, SCSI…) utilizada para su conexión. Así, se suele hablar de un disco duro ATA (también conocido como PATA), un disco duro SCSI, etcétera.

Si nos vamos a un ámbito más profesional, los discos duros locales SATA son descartados a favor de discos más rápidos (con velocidades de giro de 10 o 15 krpm), con menor latencia y con una mayor tasa de transferencia de datos, como los discos duros SCSI (Small Computers System Interface) o SAS (Serial Attached SCSI), lo que nos garantiza un acceso más rápido a los datos almacenados. Hoy en día también podemos encontrarnos con equipos que montan dispostivos SSD (Solid State Drive) en lugar de los tradicionales discos duros SCSI o SAS.

Pero… ¿qué ocurre si se nos rompe nuestro único disco duro?, pues, por lo general, nos cogemos un rebote de cuidado al comprobar que, si no tenemos un backup o copia de seguridad de nuestros datos en otro medio, nos hemos quedado sin ellos para siempre (a no ser que estemos dispuestos a gastarnos unos cientos de euros en contratar los servicios de una empresa de recuperación de datos).

Para evitar este problema aparece una solución tan sencilla como lógica: en vez de tener un sólo disco duro, tenemos dos, y todo lo que escriba en uno lo copio en el otro, de manera que siempre tendré una imagen especular de los datos del primer disco en el segundo. Esta solución se conoce técnicamente como RAID de nivel 1 o RAID 1 y es, normalmente, el propio hardware el que se encargada de realizar esta tarea de manera totalmente transparente para nosotros.

RAID (Redundant Array of Independent/Inexpensive Disks) lo que nos ofrece es una serie de estrategias de almacenamiento encaminadas a proporcionarnos lo que estamos buscando en relación con nuestras necesidades de almacenamiento:

  • Mayor integridad.
  • Mayor tolerancia a fallos.
  • Mayor rendimiento (throughput).
  • Mayor capacidad.

Como hemos visto, para poner en marcha RAID 1 necesitamos dos discos (de igual capacidad) y a cambio disponemos de tolerancia a fallos (si uno de los discos muere, tendremos toda nuestra información disponible en el otro y nuestro sistema seguirá funcionando sin problemas), sin embargo, esta estrategia no nos proporciona mayor capacidad de almacenamiento por el echo de disponer de un disco más.

RAID 1

Si lo que buscamos es incrementar el rendimiento y no nos importa la tolerancia a fallos, podemos hacer uso de RAID 0. En este caso, la información que queremos almacenar se reparte entre el número discos que forman el array, por lo que las operaciones de lectura y escritura se agilizan al realizarse en paralelo, sin embargo, si uno de los discos sufre un fallo, perderemos toda nuestra información. Además, la capacidad total se verá limitada por la capacidad del disco duro más pequeño si los discos que componen el conjunto son de diferente capacidad.

RAID 0

Uno de los más usados a nivel profesional junto con RAID 1 es RAID 5. RAID 5 requiere al menos tres unidades de disco para ser implementado y es preciso que fallen dos discos para tener una pérdida completa de datos. En este caso, la información se distribuye a nivel de bloque entre los discos, junto con cierta información adicional de paridad utilizada para garantizar la integridad de los datos.

RAID 5

RAID 5 ofrece la mejor relación rendimiento-coste. Gracias a la combinación del fraccionamiento de datos y a la paridad como método para recuperar los datos en caso de fallo, constituye una solución ideal para los entornos de servidores, además de permitir la utilización de hasta el 80% de la capacidad del conjunto de discos.

Existen más niveles RAID que podéis consultar en el siguiente artículo de la Wikipedia, sin embargo, estos suelen ser los más habituales. Os recomiendo que echéis también un vistazo a los vídeos explicativos sobre RAID que podéis encontrar en YouTube, más abajo tenéis los enlaces disponibles, sin duda, son muy didácticos.

En este post sobre almacenamiento masivo local hemos conocido los principales interfaces o tipos de discos duros existentes y el principal segmento de mercado al que se dirige cada uno de ellos (doméstico o profesional). También hemos aprendido como RAID puede ayudarnos a incrementar la capacidad de almacenamiento, a mejorar el rendimiento, a minimizar o evitar la pérdida de información o a garantizar la integridad de nuestros datos. Nos hemos centrado en almacenamiento interno, dejando de lado otras soluciones de almacenamiento externo, como son los discos duros eSATA u otros medios de almacenamiento (como las memorias USB, CDROMs o DVDs) con capacidad limitada.

En el próximo artículo, entraremos de lleno en las soluciones profesionales de almacenamiento conocidas como NAS (Network Attached Storage) y SAN (Storage Area Network), que se apoyan en arrays masivos de discos con tecnología RAID y en redes de datos para proporcionar almacenamiento centralizado a los usuarios garantizando la disponibilidad e integridad de la información.

Enlace recomendados:

Artículos relacionados:

Almacenamiento masivo profesional (II): DAS (Direct Attached Storage) >>

Categorías: Almacenamiento Etiquetas: , , , , , , , ,