Programa del Curso

Introducción al Aprendizaje Multimodal

  • Visión general de la IA multimodal
  • Desafíos en el procesamiento multimodal de datos
  • Beneficios de los LLM multimodales

Descripción de los modelos de lenguaje de gran tamaño

  • Arquitectura de LLMs de última generación
  • Formación de LLM con datos multimodales
  • Casos prácticos: Aplicaciones exitosas de LLM multimodal

Procesamiento de datos multimodales

  • Técnicas de preprocesamiento de datos para texto, imagen y audio
  • Extracción de características y aprendizaje de representaciones
  • Integración de datos multimodales en LLM

Desarrollo de aplicaciones LLM multimodales

  • Diseño de interfaces de usuario para la interacción multimodal
  • LLMs en asistentes virtuales y chatbots
  • Creación de experiencias inmersivas con LLM

Evaluación y optimización de sistemas multimodales

  • Métricas de rendimiento para LLM multimodales
  • Estrategias de optimización para una mayor precisión y eficiencia
  • Abordar el sesgo y la equidad en los sistemas multimodales

Laboratorio práctico: Creación de un proyecto de LLM multimodal

  • Configuración de un conjunto de datos multimodal
  • Implementación de un LLM multimodal para un caso de uso específico
  • Probar y perfeccionar el sistema

Resumen y próximos pasos

Requerimientos

  • Comprensión del aprendizaje automático y las redes neuronales
  • Experiencia con Python programación
  • Familiaridad con el preprocesamiento de datos para varios tipos de datos (texto, imagen, audio)

Audiencia

  • Científicos de datos
  • Ingenieros de aprendizaje automático
  • Desarrolladores de software
  • Investigadores centrados en la IA y el procesamiento del lenguaje natural
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas