En 2009, Fei-Fei Le presentó ImageNet como una base de datos con 1000 clases, cada una con 1000 imágenes, en la CVPR. Se creó la base de datos para proporcionar a la comunidad de Visión por Computadora un estándar de datos. En 2010, se lanzó la competición ILSVRC, utilizando ImageNet para evaluar modelos y algoritmos. En 2012, una red neuronal, AlexNet, ganó por primera vez esta competición, marcando un hito en la IA. Desde entonces, ha habido notables avances, con ejemplos como ChatGPT y modelos generativos de imágenes como sus máximos exponentes.
En esta ponencia se comentarán las tecnologías y conceptos que han resultado en el modelo de Stable Diffusion que es capaz de generar imágenes a partir de texto y vamos a explorar tanto sus capacidades como sus limitaciones.
