🛸 Azure Cognitive Service Vision : Next Stage.

Florence

No, no quiero hablaros de esta monumental ciudad Italiana sino del Proyecto Florence del equipo de Microsoft ya que sustenta lo que para mi es uno de los servicios mas disruptivos de la actualidad si lo combinamos nos NLP y Azure Open AI : Azure Cognitive Service Vision.


¿Por cierto que os parece la versión de Florencia en versión Star Wars?

Puntuación: 1 de 5.

Project Florence es una iniciativa de Microsoft AI Cognitive Services que busca avanzar en las tecnologías de visión por computadora y desarrollar un marco de reconocimiento visual de próxima generación. Aunque el sistema visual es el sentido en el que más confiamos, con un estimado del 80%-85% de nuestra percepción y actividades mediadas a través de él, desarrollar una inteligencia visual en computadoras es un desafío. Desde 2012, el aprendizaje profundo ha impulsado avances significativos en el reconocimiento visual.

Sin embargo, aún existe una brecha entre el estado actual de la tecnología y el rendimiento deseado en aplicaciones reales. A diferencia de la detección de rostros, que es altamente precisa, la detección de objetos genéricos aún tiene margen de mejora.

El desafío es aún mayor en el ámbito de los videos. Con la demanda de aplicaciones reales y los avances en investigación, Project Florence busca desarrollar modelos universales para una amplia gama de categorías visuales, con el objetivo de mejorar los productos de visión de Microsoft.

El modelo base Florence proporciona funcionalidades vanguardistas de Computer Vision y supone un paso importante para ofrecer una funcionalidad de reconocimiento visual que va cambiar lo proyectos relacionados con la visión asistida por AI.

Este modelo mejora Vision Image Analysis, ofreciendo subtítulos de imágenes avanzados y la capacidad de personalización con pocos datos. Esta técnica permite hacer predicciones con un número reducido de imágenes, emulando cómo los humanos aprenden a reconocer objetos con pocas muestras.

Aunque tradicionalmente se necesitan grandes conjuntos de datos para entrenar modelos de visión, Florence ha reducido esta necesidad, permitiendo el entrenamiento con tan solo cuatro imágenes. Estas mejoras facilitan a los desarrolladores la creación de aplicaciones robustas de Computer Vision, integrando análisis de imágenes y vídeos con interacciones de lenguaje natural.

¿Por que os hablo sobre esto?

Computer Vision, una rama esencial de la inteligencia artificial, busca emular la percepción visual humana analizando datos visuales como imágenes y vídeos mediante algoritmos avanzados. Azure Computer Vision nos ofrece un servicio integrado con las últimas tecnologías de visión artificial. Con el apoyo del modelo base Florence de Microsoft, este servicio ha mejorado notablemente el análisis de imágenes y ha introducido funcionalidades de personalización innovadoras.

Entender en que se basa Computer Vision nos ayuda a sacar el máximo de productividad de esta potente herramienta.

¿Qué podemos hacer con Computer Vision?

Azure Computer Vision Image Analysis 4.0, potenciado por el modelo base Florence de Microsoft, permite extraer y analizar elementos visuales de imágenes, identificando más de 10,000 conceptos y objetos. Utiliza algoritmos avanzados para interpretar información visual, como detectar personas en una imagen, clasificar contenido y describir imágenes con frases completas en inglés.

Aquí tenéis todo lo que podemos hacer:

  • Descripción y subtitulado de imágenes
  • Uso de consultas de lenguaje natural para buscar fotos
  • Generación de etiquetas basadas en el contenido de una imagen
  • Detección de objetos en imágenes
  • Lectura de texto a partir de imágenes mediante el reconocimiento óptico de caracteres (OCR).
  • Creación de imágenes en miniatura mediante Smart Cropping
  • Detección de personas que aparecen en las imágenes
  • Eliminación del fondo

¿Qué es Vision Studio?

Por ultimo quería hablaros de Vision Studio. Es una herramienta de Azure Computer Vision que permite explorar y crear funcionalidades de análisis de imágenes.

Es fácil de usar y ofrece diversas experiencias de demostración desde el navegador web. Es ideal para desarrolladores ,no desarrolladores o cualquier persona con interés y que deseen comprender y trabajar con todo lo que ofrece la visión artificial con Computer Vision de Microsoft.

Cada vez pienso mas que la limitación mas común va a ser definir que queremos hacer . Por que capacidades cada vez son mas y mejores en AI.

Podeis probarlo aqu : https://portal.vision.cognitive.azure.com/


Próximo tutorial en mi canal

Recordad esto por que ayuda mucho

✅ Suscríbete al canal ( anima y da ese empujón a todo esto).

✅ Pulsa «like» si te ha gustado.

✅ Si no quieres perderte nada, ya sabes, pulsa la campana.

✅ En los comentarios déjame cualquier idea, duda, corrección o aportación. Todo será bien bienvenido.

Deja un comentario