Generador de Imágenes Flux 1 – Modelo de Código Abierto de Black Forest Labs

Flux 1 is a state of art text-to-image generator open source model - Read our review, access guide and comparison with others image generators

Black Forest Labs, fundado por un equipo de distinguidos investigadores e ingenieros de IA detrás del innovador proyecto de Stable Diffusion, ha captado rápidamente la atención en el mundo de la IA. Su reciente aumento de popularidad proviene de un video viral de IA que mostró el sorprendente realismo alcanzable al combinar las imágenes de Flux 1 con las capacidades de animación de Runway ML.

Aprovechando esta ola de éxito, Black Forest Labs aseguró una asociación de alto perfil, potenciando las características de generación de imágenes del recién lanzado chatbot Grok 2 de Elon Musk en X. Sin embargo, esta colaboración ha generado controversia debido a la falta de salvaguardas en Grok 2, lo que lleva a preocupaciones sobre la posibilidad de generar y difundir contenido engañoso o dañino (disponible ahora también en forma visual).

No obstante, Black Forest Labs cuenta con el respaldo de una exitosa ronda de financiamiento semilla de $31 millones liderada por Andreessen Horowitz, con notable participación de inversionistas ángeles e inversiones de seguimiento de General Catalyst y MätchVC. El laboratorio está en posición de tener un impacto significativo. Con un consejo asesor que cuenta con veteranos de la industria como Michael Ovitz y pioneros de la IA como el Prof. Matthias Bethge, se posiciona firmemente como una startup destinada a impulsar la innovación y accesibilidad en el campo de la IA generativa.

Revisión y Comparación:

  • Calidad y Diversidad de Imagen Inigualables: Los modelos de Flux 1 generan imágenes con una calidad visual excepcional, detalle y adherencia a los indicios. Consistentemente superan a modelos populares como Gemini, DALL·E 3 (HD) y SD3-Ultra en calidad visual, capacidad de respuesta a indicios, diversidad de resultados, variabilidad de relación de aspecto y tipografía.
  • Accesibilidad de Código Abierto: Flux 1 ofrece un modelo de código abierto (Flux.1 [schnell]) bajo una licencia Apache 2.0, lo que permite a la comunidad de IA personalizar y desarrollar sus capacidades. Este compromiso con la accesibilidad y la transparencia está alineado con la creencia central de Black Forest Labs en fomentar la innovación y la colaboración.
  • Eficiencia a Escala: Los modelos Flux 1 están basados en una arquitectura híbrida de bloques transformadores de difusión multimodal y paralela, escalados hasta 12 mil millones de parámetros. Aprovechan la coincidencia de flujo para mejorar la eficiencia de entrenamiento y generación, incorporando embeddings posicionales rotativos y capas de atención paralela para un rendimiento mejorado.
  • Velocidad: El modelo Flux.1 [schnell] está diseñado específicamente para la velocidad, superando incluso a los modelos no destilados potentes como Midjourney v6.0 y DALL-E 3 (HD) en la categoría de modelos de pocos pasos.
  • Menos restricciones: Flux.1 permite generar imágenes que Dall E 3 y Gemini se negaron a crear, como la que se muestra a continuación. Además, puedes generar contenido NSFW con él, pero no hay ejemplos que se vayan a añadir en este artículo.
Crear una selfie hiperrealista de Kim Jong Un y Donald Trump, tomada por una cámara de iPhone 14. Están viajando en un avión privado y sentados en asientos de cuero blanco. ambos fumando puros

Familia de Modelos Flux.1:

Flux 1 ofrece tres variantes, cada una dirigida a diferentes necesidades:

  1. Flux.1 [pro]: El modelo insignia, ofrece un rendimiento de última generación con calidad de imagen excepcional, detalle y diversidad, perfecto para aplicaciones profesionales. Acceda a él a través de su API, Replicate o fal.ai. También ofrecen soluciones empresariales dedicadas.
  2. Flux.1 [dev]: Un modelo destilado de forma guiada y con pesos abiertos para aplicaciones no comerciales. Ofrece calidad similar al modelo profesional pero es más eficiente. Disponible en HuggingFace, Replicate y Fal.ai.
  3. Flux.1 [schnell]: El modelo más rápido, diseñado para desarrollo local y uso personal. Está disponible abiertamente bajo una licencia Apache2.0, con pesos en Hugging Face y código de inferencia en GitHub y los Difusores de HuggingFace.

Guía de Acceso para Principiantes:

  1. GoEnhance AI, Replicate o Fal.ai: Para principiantes, estas plataformas ofrecen interfaces fáciles de usar para experimentar con los modelos Flux.1.
  2. Hugging Face: Acceda a los modelos «dev» y «schnell» de código abierto y a los recursos de la comunidad en Hugging Face.
  3. Instalación Local: Si está cómodo con configuraciones técnicas, puede instalar y ejecutar el modelo «schnell» localmente utilizando el código proporcionado en GitHub o los Difusores de HuggingFace.

Entrenamiento y Licenciamiento:

Los modelos Flux 1 están entrenados con un enorme conjunto de datos de imágenes y texto. Los detalles específicos del entrenamiento no son completamente públicos, pero los modelos utilizan técnicas innovadoras como el emparejamiento de flujo, embeddings de posición rotatorios y atención paralela.  

  • Flux.1 [pro] y [dev]: Los detalles de licencia para uso comercial y no comercial se pueden encontrar en su sitio web o contactándolos directamente.
  • Flux.1 [schnell]: Disponible bajo la permisiva licencia de código abierto Apache 2.0.

Comparación de generación de imágenes frente a frente

Una imagen hiperrealista tomada con una cámara DSLR de una calle concurrida en el centro de Londres

FLUX 1
Gemini
Dall E 3

Bar futurista cyberpunk donde los alienígenas están bebiendo – luces de neón, en mal estado 

Flux 1
Gemini
Dall E 3

Conclusión

Flux 1 representa un gran paso adelante en la generación de imágenes de IA de código abierto, impulsado por la experiencia y visión de Black Forest Labs. Con su compromiso con la calidad, eficiencia y accesibilidad, Flux 1 está preparado para empoderar tanto a creadores como a investigadores. A medida que Black Forest Labs continúa empujando los límites de la IA generativa, podemos anticipar innovaciones aún más impresionantes en el futuro.

Business, Mentorship, and AI
Alexi Carmichael Business, Mentorship, and AI Verificado por Experto
Alexi Carmichael is a tech writer with a special interest in AI's burgeoning role in enhancing the efficiency of American SMEs. With her know-how and experiences, she has since taken on the role of mentor for fellow entrepreneurs striving for digital optimization and transformation. With Tech Pilot, she shares her insights on navigating the complexities of AI and how to leverage its capabilities for business success.