Si lo prefieres, puedes leer el artículo completo en PDF aquí: Cómo Integrar Imágenes y Nubes de Puntos 3D: Estándares y Buenas Prácticas Geoespaciales
Por Francisco Navarrete Mandly
1. Captura de nubes de puntos e imágenes
La captura de datos tridimensionales mediante escáneres láser 3D puede realizarse con equipos estáticos o móviles basados en tecnología SLAM (Simultaneous Localization and Mapping).
🔷 Los escáneres estáticos ejecutan barridos rotacionales desde una posición fija, generando nubes de puntos de alta densidad y precisión.
🔷 Los escáneres móviles o tipo SLAM permiten adquirir datos en movimiento, integrando sensores de posicionamiento y algoritmos de mapeo en tiempo real para obtener nubes de puntos de forma ágil.
Además de las coordenadas tridimensionales, los escáneres también registran la intensidad de la señal devuelta por cada punto, lo que aporta información sobre las propiedades reflectivas de la superficie escaneada.
Para complementar esta información puramente geométrica y radiométrica, muchos escáneres integran además sistemas de captura de imagen que añaden contexto visual al levantamiento.
🔷 Cámaras convencionales (RGB): Capturan imágenes similares a las de una cámara digital estándar.
🔷 Cámaras panorámicas o esféricas: Emplean lentes gran angular u ojo de pez, o bien varios sensores distribuidos alrededor del equipo, para cubrir un campo de visión más amplio.
🔷 Cámaras multiespectrales: Registran bandas más allá del espectro visible, como el infrarrojo cercano o el ultravioleta, lo que resulta útil en estudios de vegetación, conservación del patrimonio o inspección de materiales.
2. Imágenes generadas por el software de postproceso
Además de procesar las observaciones del LiDAR, el software de postproceso ejecuta un flujo fotogramétrico completo que integra las imágenes capturadas por las cámaras del escáner con los datos procedentes de los sensores de posicionamiento y orientación (GNSS e IMU, entre otros).
En este proceso se estiman de forma conjunta la posición tridimensional y la orientación de cada imagen, resolviendo los parámetros extrínsecos (orientación externa) y, salvo que la cámara cuente con una calibración previa, también los parámetros intrínsecos mediante autocalibración. Si la cámara ya ha sido calibrada con anterioridad, estos parámetros internos pueden fijarse y el cálculo se limita a las orientaciones externas.
Cuando el equipo incorpora varias cámaras, el software procede al cosido y la fusión de las distintas tomas en una proyección común, empleando las imágenes corregidas de distorsión. De esta forma se garantiza la continuidad en color y geometría y se logra que las imágenes queden perfectamente alineadas con las nubes de puntos para su posterior uso en panorámicas, ortofotos u otras representaciones.(Crombez et al., 2015; Sharma et al., 2024)
Los tipos de imágenes más habituales que genera el software son:
🔷 Perspectivas (pinhole o proyección central): Representan la geometría clásica de una cámara con lente central, análoga a una fotografía convencional.
🔷 Esféricas: Permiten explorar la escena en 360° mediante una proyección esférica continua, ideal para visualizaciones inmersivas.
🔷 Cilíndricas: Desarrollan la escena sobre una superficie cilíndrica, especialmente útiles para la documentación panorámica de túneles, corredores o fachadas de gran longitud.
Nuevos métodos de visualización, como Gaussian Splatting, permiten representar de forma continua y realista la nube de puntos, generando superficies suaves y con iluminación fotográfica.
3. Ubicación de imágenes en el espacio
La posición de la cámara puede expresarse en coordenadas de un sistema local o bien en un sistema global si el equipo incorpora receptores GNSS o se han utilizado puntos de control topográficos.
La orientación de la cámara suele definirse mediante los ángulos roll, pitch y yaw:
🔷 Roll: giro alrededor del eje longitudinal de la cámara (rotación lateral).
🔷 Pitch: giro alrededor del eje transversal (inclinación hacia arriba o abajo).
🔷 Yaw: giro alrededor del eje vertical (orientación hacia la izquierda o derecha).
Aunque intuitivos, estos ángulos presentan limitaciones: no basta con indicar sus valores, sino que también es necesario especificar el criterio de signos y el orden de aplicación de los giros, lo que corresponde a la definición de una matriz de Euler. Sin esta información, diferentes programas pueden interpretar de forma distinta los mismos datos, generando incoherencias en la orientación de las imágenes.(Kim & Kim, 2023)
Una alternativa más robusta para representar la orientación es la basada en cuaterniones, que constituyen una extensión de los números complejos a cuatro componentes (qx, qy, qz, qw). Su uso evita problemas asociados a las rotaciones con ángulos de Euler, como la ambigüedad de signos o el fenómeno de gimbal lock. Además, los cuaterniones permiten interpolar orientaciones de forma más estable y son ampliamente utilizados en aplicaciones de realidad virtual, robótica y gráficos 3D.
Más allá de la precisión en la posición y orientación, es esencial que exista coherencia espacial entre las nubes de puntos y las imágenes, de forma que ambas coincidan exactamente en el mismo sistema de referencia. Solo así será posible utilizarlas en un visor integrado para medir y dibujar con precisión sobre los datos combinados. Esta coherencia es especialmente crítica cuando los datos se integran en entornos GIS o flujos de trabajo BIM.
4. Formatos de archivo estándar para posicionar y orientar imágenes
Existen diversos formatos no propietarios que permiten almacenar imágenes junto con sus parámetros de posición y orientación. Sin embargo, no todos resultan adecuados para el caso de imágenes asociadas a escáneres 3D.
Metadatos EXIF
El formato Exchangeable Image File permite almacenar en los propios ficheros de imagen datos complementarios como fecha de captura, cámara utilizada, parámetros de exposición e incluso información de geolocalización mediante coordenadas GPS y orientación de la cámara.
No obstante, estos metadatos presentan limitaciones importantes(Acharya R et al., 2023):
🔷 Están pensados principalmente para fotografías convencionales y dispositivos móviles.
🔷 La posición se expresa de forma aproximada mediante coordenadas GPS, sin la precisión necesaria para aplicaciones topográficas.
🔷 La orientación se describe con campos básicos (rumbo, inclinación), que no son suficientes para representar de forma rigurosa la pose de una cámara en 3D.
🔷 No pueden reflejar adecuadamente la posición y orientación de imágenes oblicuas ni integrarse de manera consistente con las nubes de puntos.
Ficheros World
Los ficheros world (.jgw, .pgw, .tfw, etc.) son archivos de texto asociados a una imagen ráster que permiten definir su ubicación en un sistema de coordenadas, mediante parámetros de traslación, resolución y rotación.
Si bien son muy utilizados en sistemas GIS para georreferenciar ortofotos o imágenes aéreas en planta, no son aptos para georreferenciar imágenes de escáner. Esto se debe a que:
🔷 Su estructura solo permite definir una transformación afín en 2D.
🔷 No incluyen información de orientación en tres dimensiones.
🔷 No están diseñados para imágenes oblicuas ni para escenas capturadas en 360°.
Archivos de texto con parámetros de cámara
Una alternativa muy extendida en fotogrametría es el uso de archivos de texto, que enumeran para cada imagen su posición y orientación, expresada como ángulos de rotación o cuaterniones. Estos archivos suelen tener un formato flexible y no estandarizado.
No obstante, los criterios de interpretación pueden variar según la aplicación:
🔷 Las unidades pueden expresarse en metros, centímetros o incluso píxeles.
🔷 Los ángulos pueden estar en grados o radianes, y el sistema de referencia puede cambiar.
🔷 El orden de los giros y los signos de los ángulos no siempre se documentan claramente.
Por ello, aunque estos archivos contienen toda la información necesaria para alinear imágenes y nubes de puntos, su falta de estandarización complica la interoperabilidad entre diferentes aplicaciones.
E57
El estándar ASTM E57 está específicamente diseñado para el intercambio de datos de escaneo láser 3D y constituye la opción más completa para almacenar de forma conjunta nubes de puntos e imágenes (Huber, 2011). Su estructura permite integrar en un único archivo no solo la geometría del escaneado, sino también las imágenes asociadas a cada estación y todos los parámetros necesarios para situarlas correctamente en el espacio.
El E57 admite distintos tipos de imágenes, desde capturas perspectivas (pinhole o proyección central) hasta panorámicas esféricas o cilíndricas, y define de manera explícita los datos para su posición y orientación.
Al tratarse de un formato abierto y bien documentado, facilita la interoperabilidad entre diferentes fabricantes y aplicaciones, reduciendo el riesgo de pérdida de información y asegurando que las imágenes puedan visualizarse alineadas con las nubes de puntos. La librería de código abierto libE57 es un recurso clave, ya que simplifica enormemente el trabajo de los programadores a la hora de implementar compatibilidad con este formato en sus aplicaciones, evitando tener que desarrollar desde cero la lectura y escritura de archivos E57.
Aunque el E57 es una de las mejores opciones para integrar nubes de puntos e imágenes en un único archivo, también presenta algunas limitaciones:
🔷 Los archivos pueden alcanzar tamaños muy elevados cuando se incorporan numerosas imágenes de alta resolución, lo que ralentiza la lectura, escritura y transferencia.
🔷 E57 no está diseñado para imágenes multiespectrales, como las que incluyen varias bandas del espectro (infrarrojo, ultravioleta, etc.).
🔷 Tampoco contempla de forma detallada distorsiones de orden alto ni configuraciones específicas de ciertos modelos de cámara.
🔷 Carece de soporte nativo para secuencias temporales o vídeo, por lo que, en aplicaciones que requieren este tipo de datos, se necesitan ficheros complementarios o extensiones propietarias.
Estas limitaciones no restan valor al E57 como estándar de referencia, pero conviene tenerlas presentes en proyectos de gran volumen de imágenes o con requisitos fotogramétricos avanzados.
5. Conclusiones
Por sus prestaciones y su carácter abierto, actualmente el formato E57 se consolida como la mejor práctica para el intercambio profesional de datos de escaneo láser acompañados de imágenes georreferenciadas.
Se recomienda que los fabricantes de escáneres 3D exporten de forma nativa tanto las nubes de puntos como las imágenes en este formato, asegurando que cada fotografía incluya de manera correcta sus parámetros de posición y orientación. Esta estrategia incrementa la interoperabilidad entre plataformas, mejora la precisión geométrica y optimiza la eficiencia de los flujos de trabajo en proyectos de ingeniería, arquitectura y construcción.
Asimismo, es conveniente seguir de cerca la evolución del estándar IFC, cuya versión 5 prevé avances orientados a la integración de entornos BIM y GIS. Esta convergencia permitirá probablemente que los modelos de información de edificios e infraestructuras se relacionen de forma más directa con los datos geoespaciales y con las nubes de puntos e imágenes capturadas en campo, reforzando la continuidad de la información a lo largo de todo el ciclo de vida del proyecto.
Finalmente, la adopción del E57 no debe limitarse a los fabricantes de hardware: es igualmente crucial que los desarrolladores de software implementen una compatibilidad completa y rigurosa, de modo que la interoperabilidad se garantice también a nivel de aplicaciones y se potencie un ecosistema abierto en todo el sector geoespacial.
Bibliografía
🔗 Acharya R, S., J, S., S, S., S Aithal, V., & G S, H. (2023). GEO-LOCATING AN IMAGE USING EXIF DATA. International Journal of Engineering Applied Sciences and Technology, 8(1). https://doi.org/10.33564/ijeast.2023.v08i01.007
🔗 Crombez, N., Caron, G., & Mouaddib, E. (2015). 3D point cloud model colorization by dense registration of digital images. International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences - ISPRS Archives, 40(5W4). https://doi.org/10.5194/isprsarchives-XL-5-W4-123-2015
🔗 Huber, D. (2011). The ASTM E57 file format for 3D imaging data exchange. Three-Dimensional Imaging, Interaction, and Measurement, 7864. https://doi.org/10.1117/12.876555
🔗 Kim, S., & Kim, M. (2023). Rotation Representations and Their Conversions. IEEE Access, 11. https://doi.org/10.1109/ACCESS.2023.3237864
🔗 Sharma, S. K., Jain, K., & Shukla, A. K. (2024). 3D point cloud reconstruction using panoramic images. Applied Geomatics, 16(3), 575–592. https://doi.org/10.1007/s12518-024-00563-w