__wf_reserved_heredar

Herramienta predictiva de escalado automático de Kubernetes basada en IA

__wf_reserved_heredar
Obtenga un acceso gratuito
Obtenga una consulta técnica personalizada de 20 minutos sobre cómo su infraestructura puede beneficiarse del acceso gratuito e ilimitado a PredictKube.
Compatible con:
__wf_reserved_heredar
__wf_reserved_heredar
__wf_reserved_heredar
__wf_reserved_heredar

Introduzca los datos para 1 semana o más y obtenga un escalado automático proactivo en Kubernetes hasta 6 horas horizonte basado en la predicción de la IA

__wf_reserved_heredar

Aproveche al máximo el escalador automático de Kubernetes basado en inteligencia artificial

__wf_reserved_heredar
Inicio del saque inicial
Nuestro modelo de IA puede empezar a trabajar con los datos de tráfico durante dos semanas para ofrecerte una predicción fiable de los nodos de escalado automático de Kubernetes.
__wf_reserved_heredar
Escalado proactivo
Con PredictKube, puedes completar el escalado automático en Kubernetes antes de que aumente la carga, gracias a las previsiones realizadas por nuestro modelo de IA incorporado en la herramienta de escalado automático de clústeres.
__wf_reserved_heredar
Automatización de escalado
La herramienta de escalado automático predictivo de Kubernetes optimiza la cantidad de nodos activos de forma preventiva y, cuando el tráfico aumenta, todos los nodos están listos.
__wf_reserved_heredar
Caso práctico de PreditKube x Google Cloud: Cómo pronosticamos con precisión el 90% de los picos de tráfico de PancakeSwap, redujimos los costos en un 30% y redujimos el tiempo máximo de respuesta en 62,5 veces.
Lea el caso

Problemas que resuelve PredictKube

__wf_reserved_heredar

Sobreaprovisionamiento y altas facturas de nube

Paga de más para cubrir cualquier necesidad de tráfico que pueda tener para evitar pérdidas de tráfico. Eso es ineficiente.
__wf_reserved_heredar

Tiempo de inactividad y alta latencia

La infraestructura se sobrecarga y los usuarios no pueden conectarse a su producto o servicio. Pierdes tráfico.
__wf_reserved_heredar

Crecimiento problemático del proyecto

Haga que su infraestructura sea transparente y visible para usted, adminístrela de manera eficiente y evite errores.
Potencie la infraestructura de su K8 con un escalador automático de inteligencia artificial innovador y resuelva los desafíos de infraestructura durante una llamada gratuita con los ingenieros de Dysnix
__wf_reserved_heredar
Daniel Yavorovych
Cofundador y director de tecnología de Dysnix

It’s easy to start using Kubernetes cluster autoscaler right now

Install PredictKube and solve the overprovisioning problem. Get your smartest Kubernetes cluster autoscaler in a few steps:
1.Normal state
helm repo add kedacore https://kedacore.github.io/charts
2.Update Helm Repo
helm repo update
3.Install keda Helm chart
kubectl create namespace keda
helm install kedakedacore/keda --namespace keda
4.Create PredictKube Credentials secret
API_KEY="<change-me>"
kubectl create secret generic predictkube-secrets --from-literal=apiKey=${API_KEY}
5.Get API Key
To make our AI model access your data and make a prediction based on it, please use the API key we'll send to your e-mail.
Number of nodes:
Thank you
We will contact you as soon as possible
Oops! Something went wrong while submitting the form.
6.Configure Predict Autoscaling
tee scaleobject.yaml << EOF
apiVersion: keda.sh/v1alpha1
kind: TriggerAuthentication
metadata:
 name: keda-trigger-auth-predictkube-secret
spec:
 secretTargetRef:
 - parameter: apiKey
   name: predictkube-secrets
   key: apiKey
---
apiVersion: keda.sh/v1alpha1
kind: ScaledObject
metadata:
 name: example-app-scaler
spec:
 scaleTargetRef:
   name: example-app
 pollingInterval:
60
 cooldownPeriod:
300
 minReplicaCount:
3
 maxReplicaCount:
50
 triggers:
 -
type: predictkube
   metadata:
     predictHorizon:
"2h"
     
historyTimeWindow: "7d"  # We recommend using a minimum of a 7-14 day time window as historical data
     prometheusAddress: http://kube-prometheus-stack-prometheus.monitoring:9090
     query: sum(irate(http_requests_total{pod=~"example-app-.*"}[2m]))
     queryStep: "2m" # Note: query step duration for range prometheus queries
     threshold: '2000' # Value to start scaling for
   authenticationRef:
     name: keda-trigger-auth-predictkube-secret
EOF

Debajo del capó: herramientas en el interior

__wf_reserved_heredar
__wf_reserved_heredar
__wf_reserved_heredar
__wf_reserved_heredar
__wf_reserved_heredar
PredictKube es reconocido oficialmente como escalador de KEDA
Ver el artículo de KEDA

Preguntas frecuentes: Todo lo que necesita saber sobre el escalado automático de Kubernetes y nuestro escalador automático

__wf_reserved_heredar

¿Qué es el escalado automático de Kubernetes?

El escalado automático de Kubernetes ajusta automáticamente los recursos de tus aplicaciones en función de la demanda.

Imagina un sitio de comercio electrónico como Amazon. Durante las horas punta, experimentan un aumento en el tráfico. Con el escalado automático, Kubernetes puede utilizar automáticamente más recursos (por ejemplo, módulos adicionales) para gestionar el aumento de la carga, del mismo modo que Amazon amplía sus servidores. Esto garantiza una experiencia de usuario fluida, evita el aumento de la latencia y minimiza los retrasos y los errores.

Por el contrario, durante los períodos más lentos, el escalado automático puede reducir los recursos para reducir los costos. Sin embargo, no todos los proyectos necesitan escalarse automáticamente; aun así, el escalado manual funciona bien para muchas empresas con un patrón simple de carga de tráfico.

__wf_reserved_heredar

¿Cuáles son los tipos de escalado automático disponibles en Kubernetes?

Kubernetes admite tres tipos principales de escalado automático:

  • Escalador automático de módulos horizontales (HPA): agrega o elimina módulos en función de métricas como el uso de la CPU o la memoria. (p. ej., escalar automáticamente los servidores web durante un pico de tráfico)
  • Escalador automático de módulos verticales (VPA): ajusta las solicitudes de recursos y los límites de los módulos individuales. (p. ej., asignar más CPU de forma dinámica a un módulo de procesamiento de datos)
  • Escalador automático de clústeres: agrega o elimina nodos enteros del clúster en función de las demandas generales de recursos. (por ejemplo, poner en funcionamiento más servidores durante la temporada alta para una empresa minorista)

En Dysnix hemos desarrollado otro tipo: el escalador automático predictivo para k8s, un producto basado en inteligencia artificial llamado PredictKube, que escala los recursos por adelantado y funciona en función de los datos históricos y de métricas empresariales.

__wf_reserved_heredar

¿Cómo funciona el escalado automático de los módulos horizontales (HPA)?

Con HPA, puedes asegurarte de que tus servidores de juegos, por ejemplo, sigan el ritmo de las fluctuaciones del número de jugadores. HPA amplía automáticamente tus servidores añadiendo módulos cuando hay más jugadores (por ejemplo, durante el lanzamiento de un juego nuevo), lo que garantiza una experiencia fluida. Sin embargo, puede ser susceptible de sobredimensionarse si se configura con métricas demasiado agresivas, lo que supone un desperdicio de recursos. Además, es posible que el HPA no reaccione con la suficiente rapidez ante los picos repentinos, lo que provoca un retraso temporal hasta que aparezcan nuevos módulos.

Por estas razones, es crucial configurar cuidadosamente las métricas de HPA y considerarlas como parte de una estrategia integral de escalado automático.

__wf_reserved_heredar

¿Qué métricas se pueden usar con HPA?

HPA puede usar varios tipos de métricas, entre ellas:

Indicadores de recursos

  • Uso de la CPU: mide la cantidad de potencia de procesamiento que consumen los pods.
  • Uso de memoria: registra la cantidad de memoria que utilizan los pods.

Métricas personalizadas

Puede definir métricas personalizadas específicas de la aplicación que proporcionen una imagen más detallada del estado de su carga de trabajo.

  • Longitud de la cola de solicitudes: supervisa el número de solicitudes que esperan a que su aplicación las procese.
  • Nivel de concurrencia: realiza un seguimiento del número de solicitudes simultáneas que gestiona tu aplicación.

Indicadores externos

Si tu aplicación interactúa con servicios externos, puedes usar las métricas de esos servicios para activar eventos de escalado.

  • Conexiones a la base de datos: se escala en función del número de conexiones a la base de datos.
  • Llamadas a la API externa: ajusta los pods en función del volumen de llamadas a una API externa.
__wf_reserved_heredar

¿Cómo funciona el escalado automático (VPA) de Vertical Pod?

Vertical Pod Autoscaler (VPA) es como tener un presupuesto que se ajusta automáticamente para los recursos de la nube.

Imagina que tu equipo de marketing ejecuta campañas publicitarias. Con HPA (Horizontal Pod Autoscaler), solo tienes que añadir más servidores (por ejemplo, alquilar más espacios publicitarios) si el tráfico aumenta. El VPA es más preciso. Supervisa el uso de los recursos de cada campaña (como la inversión publicitaria) y asigna más recursos (presupuesto) a las campañas de alto rendimiento, al tiempo que reduce el número de campañas menos eficaces.

Esto optimiza sus gastos y garantiza que cada campaña reciba los recursos que necesita para tener éxito, sin un desbordamiento innecesario.

__wf_reserved_heredar

¿Qué es el escalado automático de clústeres?

Cluster Autoscaler actúa como un administrador de recursos dinámico, lo que garantiza que tu clúster de Kubernetes tenga la cantidad adecuada de fuerza (nodos) para gestionar las cargas de trabajo fluctuantes de forma rentable. He aquí un ejemplo:

Una empresa ejecuta una aplicación de aprendizaje automático en Kubernetes. Durante la fase de entrenamiento, la aplicación requiere muchos recursos de CPU y memoria. Cluster Autoscaler detecta automáticamente este aumento de la demanda y amplía el clúster añadiendo nuevos nodos. Esto garantiza que el proceso de formación finalice rápidamente sin cuellos de botella en los recursos.

Una vez finalizada la capacitación, la aplicación pasa a una fase de predicción en la que el uso de los recursos se reduce significativamente. Cluster Autoscaler lo reconoce y reduce el tamaño del clúster eliminando los nodos innecesarios. Esto permite a la empresa ahorrar dinero en los costos de nube asociados con los recursos no utilizados.

__wf_reserved_heredar

¿Qué es el escalado automático predictivo de Kubernetes?

Kubernetes en sí no tiene un escalado automático predictivo incorporado, pero se puede lograr mediante herramientas e integraciones externas. PredictKube es reconocida como una de las herramientas de escalado automático predictivo más eficientes disponibles en el mercado actual. Así es como funciona, explicado en un ejemplo simplificado:

Imagine un sitio web de noticias que experimenta un aumento de tráfico cada día de elecciones. Una herramienta predictiva de escalado automático como PredictKube analizaría los datos del día de las elecciones pasadas y escalaría los recursos del sitio web de acuerdo con el volumen estimado del próximo aumento de tráfico. Por lo tanto, garantiza un rendimiento fluido durante el evento, evitando retrasos o bloqueos.

Este enfoque proactivo ayuda a gestionar los picos de tráfico de manera eficiente y evita posibles cuellos de botella. Sin embargo, requiere una configuración adicional y la integración con herramientas externas como KEDA (escalado automático basado en eventos de Kubernetes) o motores de predicción especializados. Pero en Dysnix podemos encargarnos de ello por ti. Póngase en contacto con nosotros para obtener más información.

__wf_reserved_heredar

¿En qué se diferencia el escalado automático predictivo del escalado automático tradicional en Kubernetes?

El escalado automático tradicional en Kubernetes, como Horizontal Pod Autoscaler (HPA), es reactivo. HPA monitorea las métricas de los recursos, como el uso de la CPU o la memoria, y escala los pods (instancias de aplicaciones) hacia arriba o hacia abajo en función de umbrales predefinidos. Esto garantiza que la aplicación tenga suficientes recursos para funcionar sin problemas, pero no anticipa las necesidades futuras. Por lo tanto, es posible que llegue un momento en el que sus recursos aún no hayan llegado, pero la necesidad es extrema aquí y ahora.

El escalado automático predictivo, por otro lado, es proactivo. Aprovecha el aprendizaje automático o los modelos estadísticos para analizar datos históricos, como los patrones de tráfico o las tendencias estacionales. Al identificar estos patrones, puede predecir las futuras demandas de recursos y tomar medidas antes de que se produzca un aumento repentino.

Copied to Clipboard
Paste it wherever you like