Calculadora de percentiles de tiempo de respuesta de API | De P50 a P99 al instante
Pega una lista de tiempos de respuesta de tu API o servidor web y obtén los percentiles P50, P90, P95 y P99 junto con la media, la mediana, la desviación típica, el mínimo, el máximo y un histograma de distribución. Saca a la luz la latencia de cola que una media simple esconde, todo dentro del navegador.
💡 Sobre esta herramienta
Si describes la velocidad de tu servicio como "una media de 80 ms", ocultas sin querer las peticiones lentas que sufre una pequeña parte de los usuarios. Nueve respuestas rápidas de cada diez no significan nada para el usuario atrapado esperando la décima, y esa petición lenta suele ser la que dispara las incidencias y los incumplimientos de SLA.
Un percentil indica qué proporción de tus datos queda en un valor o por debajo de él. Un P95 de 320 ms significa que el 95% de las peticiones respondieron en 320 ms o menos. Quienes trabajan en backend y SRE se apoyan en P95 y P99 en lugar de la media justamente porque los percentiles altos reflejan mucho mejor la experiencia percibida.
Pega una columna de tiempos exportada de tus registros y la herramienta calcula los cuatro percentiles principales además de la media, la mediana, la desviación típica, el mínimo, el máximo y la cantidad. El histograma muestra la forma de la distribución de un vistazo, para distinguir un grupo compacto de una cola larga y pesada.
🧐 Preguntas frecuentes
¿En qué formato debo introducir los valores? Uno por línea, o separados por comas o espacios. Los caracteres no numéricos y las líneas en blanco se ignoran de forma automática, así que pegar directamente desde una columna de registro funciona sin problemas.
¿Los valores tienen que estar en milisegundos? El cálculo se hace con los números que pegues, así que también sirven segundos o microsegundos. La etiqueta que se muestra es fija ("ms"), de modo que mantén tus unidades coherentes al interpretar el resultado.
¿Cómo se calculan los percentiles? La herramienta ordena tus datos y usa interpolación lineal entre los rangos más cercanos. Cuando la posición del percentil cae entre dos puntos, los combina de forma proporcional en lugar de redondear a una sola muestra.
¿Por qué la media y la mediana (P50) están tan separadas? En una distribución de cola larga, un puñado de valores muy grandes empuja la media hacia arriba mientras la mediana apenas se mueve. Cuanto mayor sea la diferencia, más sesgados están tus datos hacia los valores lentos.
¿Por qué no aparece el histograma? Una distribución necesita al menos dos puntos de datos para formar intervalos. Pega varios valores juntos en lugar de un solo número y el gráfico se dibujará.
📚 Por qué P99 recibe tanta atención
En un servicio con mucho tráfico, un solo usuario suele lanzar decenas de llamadas a la API en una misma sesión. Aunque P99 solo signifique "lento una vez de cada cien", una pantalla que encadena veinte llamadas tiene una probabilidad mucho mayor de toparse con al menos una petición lenta cada vez que se carga. Ese efecto acumulativo es exactamente por lo que la latencia de cola, y no la media, determina lo rápido que se siente un producto.
Por eso los equipos de operaciones vigilan percentiles altos como P95 y P99 en lugar de la media. Leídos junto a la desviación típica y el histograma, los percentiles permiten separar lo "uniformemente lento" de lo "normalmente rápido pero con picos ocasionales", que es buena parte del trabajo a la hora de cazar un cuello de botella.