Las Métricas de Oro para monitorizar tu web
Por Ricardo Cruz, 17 de Diciembre de 2018. Publicado en Monitorizar. 5 minutos de lectura.Si todo lo que se puede medir, se puede mejorar, tiene sentido aprender los puntos más importantes que deberías estar monitorizando para mejorar, de manera constante, tu sitio web.
Las Métricas de Oro son las cuatro señales críticas que te van a ayudar, en primer lugar, a darte cuenta de si tu web está sufriendo algún problema en tiempo real. En segundo lugar, van a servirte para comprobar si cualquier cambio que hagas mejora, empeora, o simplemente no tiene efecto en cuanto al rendimiento.
Son igual de útiles para Administradores de Sistemas que para Desarrolladores Web, y se suelen reflejar en una gráfica temporal, permitiéndote comparar, por ejemplo, una franja determinada de tiempo, con el mismo periodo de la semana anterior.
Latencia
Es el tiempo de respuesta de una transacción, o dicho de otra manera, es el tiempo que tarda tu servidor en generar la página que verá tu visitante en su navegador.
En esta métrica, no se incluye el tiempo que tardan en viajar los datos por el cable, por lo que las congestiones de red no influirán en las estadísticas. Sin embargo, si tu código llama a una API externa durante este proceso, sí que se reflejará en esta gráfica.
La latencia se puede medir a nivel general, como el tiempo de respuesta medio, o se puede dividir por cada tipo de petición. El primer caso es útil para detectar problemas en tiempo real, mientras que el segundo te permitirá detectar qué secciones de tu web son las más lentas, para poder priorizar las mejoras más necesarias.
Ya sea mediante Software Open Source, como mediante servicios de pago, puedes conseguir detalles de la zona concreta del código donde tu servidor está empleando más tiempo procesando las peticiones.
Puedes configurar alertas para que se te notifique cuando la latencia aumente de forma continuada por encima de un límite concreto.
Tráfico
Es la cantidad de peticiones que recibe tu servidor en un periodo de tiempo concreto.
Esta métrica te ayuda a detectar incrementos repentinos de peticiones a tu sitio web, ya sea por una campaña de marketing, el llamado Efecto Slashdot (o Reddit), o momentos desagradables, como los temidos Ataques de Denegación de Servicio.
Detectar estos picos de tráfico a tiempo te permitirán tomar medidas para soportar la carga que supone, ya sea desactivando características lentas de tu sitio, como lanzando más instancias de contenedores de Docker de tu aplicación. Es importante que planifiques y practiques estas situaciones.
Gracias a la métrica de tráfico, además, podrás detectar errores de conectividad a tu sitio. Una mala configuración de un registro DNS, por ejemplo, puede provocar que tus usuarios no puedan acceder a tu web. Darte cuenta lo antes posible es crucial. En estos casos verías una caída repentina en esta gráfica.
Es este último motivo por el que debes configurar alertas tanto si el tráfico sobrepasa un límite, como si de repente dejas de recibir visitas durante una cantidad de tiempo razonable.
Tasa de errores
Es la cantidad de errores que hay en el código de tu página web en un periodo de tiempo.
En esta métrica podrás ver, en tiempo real, o comparándola con periodos de tiempo anteriores, si estás mejorando o empeorando tu sitio con cada nueva versión.
Hay dos tipos de casos en los que verás incrementos en esta gráfica. En primer lugar están los errores del propio código, que son estables con cada versión, pero también se puede disparar la tasa de errores por problemas puntuales en tus servidores o en llamadas a API de terceros.
Si nunca has plasmado los errores de tu sitio en una gráfica, puedes encontrarte con una tasa de errores elevada al empezar. Para corregir este problema, tendrás que agrupar estos errores por categorías, registrarlo en una lista de tareas (o tickets de soporte), determinar cuál es el error más frecuente y corregirlo. Repite este proceso una y otra vez hasta eliminarlos todos.
Tu objetivo debería ser tener una tasa de errores del 0% siempre. Tomarse como aceptable que un sitio web falle normalmente es, simplemente, negligente.
Aunque las alertas para esta métrica suelan configurarse para recibir, al menos, una notificación si la tasa de errores sobrepasa un porcentaje en un periodo de tiempo determinado, los errores hay que revisarlos de forma periódica, junto al primer café de la mañana.
Saturación de los servidores
Es el nivel de uso de CPU, RAM y disco duro de los servidores que procesan las peticiones a tu página web.
Entre otras, esta métrica sirve principalmente para medir la escalabilidad de tu sitio. Junto con el resto de gráficas y datos podrás ver, de una manera sencilla, si necesitarás añadir más servidores para un incremento de visitantes.
En servidores de bases de datos, también te permitirá monitorizar el uso que éstos hacen de la memoria, añadiendo más si fuera necesario antes de que sea demasiado tarde.
Es una gráfica que tiene más relación con mantenimientos preventivos, que para resolver problemas concretos a tiempo real. Sin embargo, es importante configurar también alertas que te notifiquen si el uso de CPU se dispara, o el cantidad de RAM disponible cae, durante un periodo de tiempo determinado.
Conclusión
Por separado, estas métricas aportan una información muy útil para que tu sitio web siempre esté online y responda rápido. Además de guiarte para mejorar tanto la infraestructura, como el código.
Juntándolas todas en una misma pantalla, además, te ayudarán a comprender cuánta carga de tráfico soportan tus servidores, o la relación que hay entre los aumentos de latencia y cantidad de visitantes.
En definitiva, si te fueras a una isla desierta con un único panel de monitorización disponible en el Universo, estas cuatro métricas serían las que te gustaría tener a tu lado.