La evolución de Microsoft Azure ha sido constante y dinámica, tiene todo lo que necesitas y si no lo tiene, muy seguramente en el siguiente “release” lo verás en alguna parte.

Este artículo (el primero de muchos en su estilo), abordará que hay actualmente en Microsoft Azure cuando necesitamos trabajar con bases de datos.

Lo que sigue, son una serie de preguntas que irán discriminando entre una y otra opción hasta reflexionar que se adapta mejor a nuestras necesidades.

¿Bases de Datos Relacionales ó NoSQL?

Solo como referencia diremos que las bases de datos relacionales son aquellas que tienen la característica principal de almacenar información mediante estructuras construidas por filas y columnas “tablas”, la información se distingue y relaciona por medio de identificadores numéricos irrepetibles para cada registro.

Las bases de datos relacionales dominaron el mercado por décadas completas, y si bien su uso todavía está vigente, ya vivimos en un mundo lleno de aplicaciones y plataformas donde los datos proliferan considerablemente, así que un esquema convencional como las bases de datos relacionales no encaja del todo como solución en cuestiones de rendimiento y agilidad para lectura-escritura en tiempo real.

Otra cara del cubo son las bases de datos NoSQL (No Relacionales), aquellas donde los datos no tienen un tipo en específico ni esquema obligatorio, los formatos de almacenamiento se dan como:

  • Documentos (formato JSON, menos verboso que XML).
  • Clave Valor.
  • Grafos.
  • Columnar.

Identificado lo anterior ¿Qué tiene Microsoft Azure para nosotros?

 

Azure SQL Database

Es el servicio de bases de datos relacionales de Microsoft Azure, SI es administrado. Nos limitamos a conectarnos para realizar transacciones de escritura y lectura.

Microsoft SQL Server

El motor de bases de datos por excelencia de Microsoft, NO es administrado. Se tiene instalada una versión de Microsoft SQL Server en una máquina virtual y a partir de ahí se configura todo.

Azure for MySQL

Es el servicio de bases de datos relacionales de Microsoft Azure para MySQL, SI es administrado. Nos limitamos a conectarnos para realizar transacciones de escritura y lectura.

Azure for MariaDB

Es el servicio de bases de datos relacionales de Microsoft Azure para MariaDB, SI es administrado. Nos limitamos a conectarnos para realizar transacciones de escritura y lectura.

Azure for PostgreDB

Es el servicio de bases de datos relacionales de Microsoft Azure para PostgreDB, SI es administrado. Nos limitamos a conectarnos para realizar transacciones de escritura y lectura.

Demostración de trabajo con MySQL y PostgreDB

Demostración de trabajo con Table Storage

Table Storage en esencia se maneja desde código, a continuación expondré el código C# para realizar múltiples operaciones con Table Storage en un proyecto ASP.Net MVC (código completo clic aquí).

Para deslizar hacia abajo presiona el ícono “<>”.

Demostración de trabajo con SQL Database

Demostración de trabajo con MariaDB

¿Bases de Datos Administradas ó No Administradas?

Esta palabra la usamos en la pregunta anterior y está fuertemente asociada al paradigma de computo en la nube, vamos ahora marcando la distinción:

  • Servicio SI administrado: Es aquel qué no necesita intervención nuestra para su mantenimiento, es decir: actualizaciones de software/hardware y aspectos de seguridad. Nos limitamos a consumirlo conectándonos a él por medio de clientes o APIS mediante código, esquema PaaS.
  • Servicio NO administrado: Es aquel qué si necesita intervención nuestra para su mantenimiento, típicamente se abre un espacio de máquina virtual en la infraestructura de nuestro proveedor de nube Microsoft Azure y ahí mismo se instala, configura y se le da mantenimiento a nuestros servidores como si de un servidor físico se tratara puesto que se trata de un esquema IaaS.

Identificado lo anterior ¿Qué tiene Microsoft Azure para nosotros?

Hay que poner más atención en esta división, donde las bases de datos “No son administradas”, la mención de Microsoft SQL Server va por que existen máquinas virtuales especialmente pre-configuradas con la más reciente versión del servidor, pero obviamente se podría tomar otra máquina virtual con nada de base y a partir de ahí descargar, instalar y configurar el servidor de nuestra preferencia tanto de los ya mencionados como algún otro, ese servidor virtual tendrá que abrir sus puertos y exponerse públicamente para conectarnos correctamente.

Demostración de trabajo con Microsoft SQL Server

¿Bases de Datos Distribuidas ó No Distribuidas?

Las bases de datos distribuidas son aquellas que se constituyen de múltiples bases de datos lógicamente relacionadas, pero física y hasta geográficamente separadas.

¿Recuerdas cómo surgió Facebook? Esa red social que empezó en un ambiente universitario y que prácticamente ahora su alcance es mundial. Vamos arrojando unas preguntas reflexivas que nos ayudarán a determinar si algo como Facebook requiere una base de datos distribuida:

  • ¿Cuántas conexiones de usuario existirán por segundo?
  • ¿Cuántas operaciones de lectura/escritura existirán por segundo?
  • ¿Desde qué zonas geográficas existirán solicitudes HTTP?
  • ¿Qué tan crítica es la información como para tenerla disponible siempre?

Identificado lo anterior ¿Qué tiene Microsoft Azure para nosotros?

Voy a destacar que Azure Cosmos DB se basa en un multimodelo de datos NoSQL, por lo que está en nosotros decidir si lo que guardaremos en ella será: documento, clave-valor, columnar o grafo.

¿Bases de Datos de Baja Latencia ó Basadas en Disco?

Redis es una base de datos muy “especial” y hago énfasis en ella puesto que la manera en la que mantiene la información es muy singular. Desde que nos enseñaron principios de computación sabemos que la memoria RAM es más rápida de lo que podría ser la memoria de disco duro. Dicho lo anterior podemos inferir que si nuestra base de datos está en memoria RAM, las operaciones de lectura-escritura serán más rápidas que si se realizaran a disco duro ¿cierto? bien pues eso es Redis.

Identificado lo anterior ¿Qué tiene Microsoft Azure para nosotros?

Demostración de trabajo con Azure Redis Cache

Redis Cache en esencia se maneja desde código, a continuación expondré el código C# para realizar múltiples operaciones con Redis Cache en un proyecto consola (código completo clic aquí).

Para deslizar hacia abajo presiona el ícono “<>”.

¿Múltiples orígenes de datos ó aislados?

El escenario más conveniente para tratar información, hablando en términos de dificultad y rapidez sería que todo venga de una sola base de datos, un único origen, sin embargo, en la vida real la naturaleza de los proyectos nos presenta situaciones diferentes.

Microsoft Azure nos provee de SQL Data Warehouse, un servicio que actúa como repositorio para unificar todos los datos que recogen los diversos sistemas de información. Hace énfasis en la captura de datos de diversas fuentes para fines analíticos.

Identificado lo anterior ¿Qué tiene Microsoft Azure para nosotros?

Como podemos ver, la oferta es amplia y se ajusta a muchos escenarios. Dependerá de la arquitectura de nuestras aplicaciones cual será la mas conveniente. Es importante destacar que por estar hablando de computo en la nube, las bases de datos se pueden escalar tanto vertical como horizontalmente, generando nuevas instancias de máquinas virtuales o incrementando en recursos físicos para un mejor rendimiento.

¿Y acaso existe algo para Big Data?

Big Data… es un tema que da para mucho más, responderemos a esta pregunta diciendo “SI” y se llama HDInsight. Un servicio dedicado a procesar información estructurada y no estructurada de manera masiva, pero de eso hablaremos con mayor profundidad en otra ocasión 🙂


Sígueme en Twitter @vmorenoz

¿Te gustó este artículo? Únete a Facebook en MicrosoftLand

Deja un comentario