Aprendizaje profundo en el mapeo para la conducción autónoma

Bienvenido, les saluda Miguel y aquí les traigo un artículo.

Las aplicaciones del aprendizaje profundo se han explorado en varios componentes a lo largo de la pila de conducción autónoma, por ejemplo, en percepción, predicción y planificación. El aprendizaje profundo también se puede utilizar en cartografía, un componente crítico para la conducción autónoma de alto nivel.

Tener mapas precisos es esencial para el éxito de la conducción autónoma para el enrutamiento, la localización y para facilitar la percepción. Se pueden obtener mapas con diversos grados de información suscribiéndose al servicio de mapas disponible comercialmente. Sin embargo, en áreas donde los mapas no están disponibles, los vehículos autónomos deben confiar en su propia capacidad de construcción de mapas para garantizar la funcionalidad y seguridad de la conducción autónoma.

Mapeo sin conexión vs mapeo en línea

En un escenario de mapeo fuera de línea, los datos de los sensores se agregan en una ubicación centralizada. Los datos pueden ser imágenes de satélite o datos recopilados por sensores integrados, como cámaras o lidars. Podría ser desde múltiples pasadas del mismo vehículo a través de la misma ubicación o de fuentes múltiples a una flota de automóviles. Se crea una representación del mapa fuera de línea, y se requieren anotadores humanos para anotar estructuras semánticas en el mapa y revisar los resultados finales. El servicio de mapas tradicional funciona de esta manera fuera de línea, luego los mapas comentados y seleccionados se sirven a los vehículos en la carretera.

Una interfaz de usuario de ejemplo para la anotación de mapas HD (fuente)

El mapeo en línea ocurre a bordo del vehículo y, por lo tanto, no pueden permitirse tener al humano en el circuito. Los ejemplos típicos son los sistemas SLAM para localización y mapeo simultáneos. Recientemente, SLAM semántico el enfoque en la geometría y los significados semánticos de las marcas de la superficie en la carretera se exploran como una solución ligera para la cartografía. Adicionalmente, Mapeo semántico monocular en línea (monoSOM) es un tema de tendencia en el que se utiliza una red neuronal para fusionar secuencias temporales de imágenes monoculares de varias cámaras en un mapa semántico a vista de pájaro. Estos temas están más allá del alcance de esta publicación y se revisarán en otra parte.

POST RELACIONADO: 3 consejos para proyectos de aprendizaje automático por primera vez

Mapas SD vs Mapas HD

Dependiendo de la resolución de entrada, existen aproximadamente dos tipos de aplicaciones de aprendizaje profundo en mapeo. La primera línea de trabajo se centra en el descubrimiento de la topología de mapas, como la red de carreteras, y no suelen contener información sobre el nivel de los carriles. Solo requieren una imagen de resolución relativamente baja con aproximadamente precisión al nivel del medidor. El otro tipo de aplicación se centra en extraer información a nivel de carril, como líneas de carril, flechas en la superficie de la carretera y otras marcas semánticas. Esto requiere una imagen de mayor resolución con precisión centimétrica. En consecuencia, estos dos tipos de mapas se denominarán libremente mapas SD y mapas HD durante el resto de esta publicación.

Aplicación de aprendizaje profundo en el mapa SD (izquierda, DeepRoadMapper) y mapa HD (derecha, DAGMapper)

Esta publicación se centra en la generación sin conexión de mapas HD. Tenga en cuenta que algunos de los métodos también se pueden aplicar a la cartografía en línea, y se dedica una breve sesión de revisión a algunos trabajos relacionados con la cartografía SD.

Mapeo compatible con anotadores

En el mapeo fuera de línea, es asequible y esencial tener un revisor humano para revisar los resultados del aprendizaje profundo. Por lo tanto, no solo importa la precisión general, sino también la presentación de los resultados en el sentido de que los resultados deberían ser fáciles de modificar por un anotador humano.

Como la mayoría de los planificadores de movimiento solo pueden manejar gráficos de carril que están estructurados y representan la topología correcta, la salida del algoritmo de mapeo suele ser un representación estructurada (polilíneas para líneas de carril, etc.). Afortunadamente, esta representación se presta a una modificación eficaz del anotador humano.

POST RELACIONADO: Cree hermosos diagramas de arquitectura con Python

Disfruta del artículo.