Calculadora de Buckets para Entrenamiento de IA|Optimiza tus datasets para Stable Diffusion y SDXL
Esta herramienta online analiza tu lista de resoluciones de imagen y las clasifica automáticamente en los "buckets" (grupos de resolución) óptimos para el entrenamiento de modelos de IA como Stable Diffusion (1.5) y SDXL. Ideal para desarrolladores y artistas de IA que entrenan modelos LoRA o DreamBooth y necesitan optimizar la configuración de su dataset.
💡 Resumen de la herramienta
- Soporte para presets de SD 1.5 y SDXL: Cambia fácilmente entre las configuraciones de bucket estándar para Stable Diffusion 1.5 (base 512px) y SDXL (base 1024px).
- Cálculo automático: Simplemente pega una lista de resoluciones (una por línea, separadas por coma, 'x' o espacio) y la herramienta calculará la distribución instantáneamente.
- Visualización de la distribución: Comprende de un vistazo cómo se distribuyen tus imágenes en los diferentes buckets de relación de aspecto a través de un gráfico de barras claro.
- Resultados listos para copiar: Obtén un resumen en formato de texto con el recuento de imágenes y el porcentaje por cada bucket, listo para pegar en tus notas o documentación.
- Procesamiento en el navegador: Todos los cálculos se realizan localmente en tu navegador. Tu lista de resoluciones no se envía a ningún servidor, garantizando la privacidad de tus datos.
🧐 Preguntas frecuentes
Q. ¿Por qué es necesario el "bucketing" en el entrenamiento de IA?
A. En el entrenamiento de modelos de difusión, las imágenes se redimensionan a resoluciones predefinidas ("buckets") en lugar de a un único tamaño cuadrado. Esto permite entrenar con diversas relaciones de aspecto, minimizando la distorsión y el recorte de las imágenes originales. Esta herramienta te ayuda a visualizar cómo se distribuye tu dataset en estos buckets, permitiéndote ajustar tus parámetros de entrenamiento para evitar un sesgo hacia ciertas relaciones de aspecto y mejorar la calidad del modelo final.
Q. ¿En qué formato debo introducir las resoluciones?
A. La herramienta acepta una resolución por línea en varios formatos comunes. Puedes usar ancho,alto, ancho x alto o ancho alto (separado por espacios). Por ejemplo, tanto "1920,1080" como "800x600" son entradas válidas.
📚 Conocimiento sobre el bucketing en el entrenamiento de IA
El proceso de asignar una imagen a su bucket más cercano no se basa en la simple diferencia de su relación de aspecto, sino en la "diferencia logarítmica". El cálculo Math.abs(Math.log(ar1) - Math.log(ar2)) se utiliza para encontrar el bucket cuya relación de aspecto (ar2) es perceptualmente más cercana a la de la imagen original (ar1).
Este método es superior porque trata las diferencias de manera simétrica. Por ejemplo, la "distancia" perceptual entre una relación de 2:1 y 1:1 es la misma que entre 1:1 y 1:2. Un cálculo de diferencia simple no capturaría esta simetría. El uso de logaritmos asegura una clasificación más precisa, especialmente en datasets con una mezcla de imágenes muy apaisadas y muy verticales, lo que resulta en un entrenamiento más estable y efectivo.