Roberto Montejano Casmar
Roberto Montejano KAM & BDM Casmar Electrónica

Inteligencia artificial: aplicaciones en soluciones basadas en vídeo

Sistemas de detección automática de incidentes o de reconocimiento de matrículas, reconocimiento facial, protección perimetral… Como se pone de manifiesto en el presente artículo, la inteligencia artificial cada vez tiene más aplicaciones en el ámbito de la seguridad.

Reconocimiento facial

La disponibilidad de enormes cantidades de datos (big data), sobre todo en imagen, vídeo y texto, proporciona la “materia prima” para entrenar modelos complejos de redes neuronales, más conocidos como modelos de aprendizaje profundo o deep learning. Desde Casmar hablamos de inteligencia artificial.

Los grandes avances tecnológicos nos han permitido disponer de grandes capacidades de computación a precios asequibles. El desarrollo de las diferentes opciones para implementar el aprendizaje automático a nivel hardware por los diferentes fabricantes, apostando por enfoques distintos sobre cómo construir la arquitectura más adecuada para cada aplicación de inteligencia artificial –como, por ejemplo, GPU, TPU, NPU o FPGA–, con sus consecuentes ventajas e inconvenientes, ha propiciado la disponibilidad de poderosas herramientas para desarrollar soluciones para entrenar modelos complejos de redes neuronales.

La aplicación de esta tecnología al procesado de vídeo ha repercutido directamente en la creación de potentes algoritmos basados en redes neuronales artificiales capaces de procesar ingentes cantidades de datos proporcionados por las imágenes, así como entrenar modelos con billones de parámetros. Podemos afirmar que la inteligencia artificial está aportando avances inimaginables hace tan solo pocos años en aplicaciones donde el vídeo está presente.

Sistemas DAI

El deep learning en sistemas DAI (Detección Automática de Incidentes) nos proporciona una solución fiable para la detección de incidentes y anomalías en el tráfico, no solo en las típicas aplicaciones en túneles, sino también en carreteras e intersecciones.

Los sistemas DAI que trabajan con deep learning están basados en un peculiar y realista método matemático de seguimiento de objetos en movimiento 3D, reduciendo drásticamente las falsas alarmas y simplificando al máximo la calibración de los algoritmos de tráfico deseados.

Con el uso de la inteligencia artificial y el aprendizaje profundo, las falsas alarmas se reducen aún más. De hecho, el software es capaz de identificar los tipos de objeto que se mueven por la escena, reduciendo los problemas típicos de un sistema DAI estándar como las oclusiones que dificultan el proceso de análisis.

Además, los problemas causados por baja iluminación y malas condiciones climatológicas, donde usualmente se usan cámaras térmicas para mantener los rangos de detección, pueden ser drásticamente reducidos, permitiendo incluso el uso de cámaras CCTV en rango visible en exteriores, todo ello sin pérdida en el rendimiento en la capacidad de análisis. Asimismo, tendremos mucha más flexibilidad en la ubicación de la cámara gracias a la capacidad del software de distinguir objetos, incluso si están muy cerca uno del otro.

Podemos asegurar que, si las condiciones ambientales no son suficientes para ejecutar el análisis de tráfico adecuadamente sin el uso de otras tecnologías como la térmica, el software basado en deep learning es la opción perfecta para mantener altos rendimientos con el uso de cámaras estándar en rango visible.

Sistemas OCR

El uso de redes neuronales y de visión artificial es una potentísima herramienta en los sistemas de reconocimiento óptico de caracteres. Eleva la fiabilidad de lectura hasta un 98%, incluso a muy altas velocidades en modo Free Flow.

Estos sistemas de reconocimiento automático de matrículas nos proporcionan detección y reconocimiento de las placas de vehículos y ciclomotores, con una tolerancia a la perspectiva inalcanzable por los sistemas OCR (Optical Character Recognition) clásicos. Permiten leer hasta ocho matrículas en una sola imagen.

Los sistemas OCR basados en redes neuronales artificiales permiten implementar analíticas de tráfico con una elevada tasa de fiabilidad como:

  • Lectura de matrículas: tolerante a perspectiva, alta y baja velocidad. Incluso embarcada en vehículos policiales.
  • Cálculo de velocidad (3D).
  • Paneles indicadores de velocidad, foto stop, giro indebido y estudios estadísticos de velocidad.
  • Detección de maniobras prohibidas.
  • Clasificación de vehículos (3D): marca y color.

Los sistemas de reconocimiento de contenedores son una aplicación directa en el sector logístico gracias a la identificación en movimiento de estos, ya sea en puertos, aeropuertos, trasporte ferroviario o plataformas logísticas de cualquier tipo. Usando el ID para el seguimiento y control de mercancías en la cadena de transporte, vinculando, por ejemplo, la matrícula del vehículo al ID del contenedor.

El ‘deep learning’ o aprendizaje profundo ha supuesto una revolución tecnológica, ahora aplicada en los sistemas de videoanálisis

Un OCR cuya tasa de fiabilidad es tan alta nos sitúa en un contexto que permite su aplicación en mercados cuya aplicación es obvia y donde la lectura de caracteres aporta beneficios, tanto en la fiabilidad y automatización de los procesos como en la minimización de los tiempos de espera.

Otra aplicación típica es la lectura de placas de mercancías peligrosas, que permite tener la información puntual y precisa sobre el tipo de mercancía transportada y vinculada al vehículo que la traslada, ya sea para su registro y control o para actuar adecuadamente ante un accidente. Se trata de una aplicación típica en túneles, poblaciones, aeropuertos y zonas sensibles.

Reconocimiento facial

La precisión y la fiabilidad es el talón de Aquiles de cualquier sistema de reconocimiento facial. Y es aquí donde el deep learning viene a marcar la diferencia y a permitir dar un paso evolutivo sin precedentes. La extracción de las características visuales ya no se define manualmente, como antes, ahora es aprendida de forma óptima por la red neuronal durante el entrenamiento. No es necesario decirle al algoritmo dónde están los puntos interesantes (puntos fiduciales o de referencia: contorno de los ojos y boca, fosas nasales, etc.), ni cómo extraer la información, ya que aprende por sí mismo.

Las GPU son ideales para entrenar redes neuronales y, concretamente, en su aplicación al sistema de reconocimiento facial, acelerando un proceso que de otro modo podría tardar un año o más en sólo semanas o días. Esto se debe a que las GPU realizan muchos cálculos a la vez o en paralelo. Y una vez que un sistema es entrenado con las GPU, los científicos y los investigadores pueden poner ese aprendizaje a trabajar. Ese trabajo implica tareas que antes se consideraban imposibles.

Podemos ofrecer soluciones para aplicaciones de videovigilancia, control de accesos y marketing:

  • Reconocimiento facial en tiempo real sobre varias cámaras IP simultáneamente. Incluso análisis de multitudes en movimiento. Indicado para aeropuertos, estaciones de tren, centros comerciales, estadios deportivos o áreas urbanas.
  • Análisis forense, permitiendo la búsqueda intensiva de sujetos en grabaciones de vídeo, para localización de sospechosos o clasificación automática.
  • Selección dinámica de publicidad o segmentación de clientes, basada en el análisis de características como su edad, sexo, expresión facial o presencia de gafas.
  • Control de acceso por reconocimiento facial. Los usuarios se registran a partir de fotos, grabaciones de vídeo o mediante captura automática.

Protección perimetral

Los sistemas de protección perimetral basados en análisis de vídeo han disfrutado de una constante evolución propiciada por su directa aplicación en seguridad y por los beneficios que aporta: detección fiable, supervisión, fácil despliegue y verificación de un simple vistazo. Por tanto, una vez más, el deep learning ha supuesto una revolución tecnológica, ahora aplicada en los sistemas de videoanálisis.

El análisis de vídeo utiliza algoritmos matemáticos que extraen la información útil de las imágenes de las cámaras de seguridad, llevados a cabo con la creación de algoritmos que utilizan tecnologías de aprendizaje automático e inteligencia artificial para adaptarse a los cambios en la escena. De este modo, los algoritmos logran una seguridad más precisa y eficaz con las tasas más bajas de falsas alarmas del mercado y una detección.

Se pueden conseguir detecciones utilizando cámaras de CCTV en rango visible de hasta 120 metros; pero cuando es necesario y el escenario lo permite, podemos aumentar la distancia de detección, en cualquier condición ambiental, usando algoritmos específicos para cámaras térmicas en distancias de hasta 505 metros.

La integración con los softwares de central receptora de alarma viene a ofrecer una solución redonda, madura y ampliamente utilizada gracias al reconocimiento que el mercado profiere a esta tecnología.

central de monitoreo pantallas