banner
Centro de Noticias
Amplia experiencia y herramientas de próxima generación

Datos ambientales hiperlocales con una plataforma móvil en entornos urbanos.

May 22, 2023

Datos científicos volumen 10, número de artículo: 524 (2023) Citar este artículo

77 Accesos

Detalles de métricas

Los datos ambientales con una alta resolución espacio-temporal son vitales para informar las acciones destinadas a abordar los desafíos de la sostenibilidad urbana. Sin embargo, el acceso a fuentes de datos ambientales hiperlocales es limitado debido a la falta de infraestructura de monitoreo, calidad consistente de los datos y disponibilidad de datos para el público. Este documento informa datos ambientales (PM, NO2, temperatura y humedad relativa) recopilados de 2020 a 2022 y calibrados en cuatro implementaciones en tres ciudades globales. Cada campaña de recopilación de datos se centró en un problema ambiental urbano específico relacionado con la calidad del aire, como la diversidad de árboles, las disparidades de exposición de las comunidades y el uso excesivo de combustibles fósiles. En primer lugar, presentamos el diseño de la plataforma móvil y su implementación en Boston (EE. UU.), Nueva York (EE. UU.) y Beirut (Líbano). En segundo lugar, presentamos el proceso de limpieza y validación de datos de calidad del aire. Por último, explicamos el formato de los datos y cómo los conjuntos de datos ambientales hiperlocales se pueden utilizar de forma independiente y con otros datos para ayudar en la toma de decisiones basada en evidencia. Nuestros conjuntos de datos móviles de detección ambiental incluyen ciudades de diferentes escalas, con el objetivo de abordar la escasez de datos en las regiones en desarrollo y apoyar la formulación de políticas ambientales basadas en evidencia.

Mediciones)

Partículas, contaminantes gaseosos.

Tipo(s) de tecnología

Plataforma de detección ambiental de bajo costo (City Scanner)

Característica de la muestra: entorno

Ciudad

Característica de la muestra: ubicación

Global

La rápida urbanización ha planteado nuevos desafíos de sostenibilidad a planificadores, ingenieros, científicos y ciudadanos en una era de cambio climático. Los datos ambientales hiperlocales son deseables para que académicos y profesionales identifiquen puntos críticos de exposición, comprendan la distribución espacial de la contaminación del aire urbano y respalden la mitigación del cambio climático basada en evidencia. Sin embargo, la adquisición de datos hiperlocales sigue siendo un desafío tanto en las regiones desarrolladas como en las en desarrollo. Entre todos los datos ambientales urbanos, los datos sobre la contaminación del aire son uno de los más difíciles de monitorear debido a su alta variabilidad espacial y temporal. En las ciudades, las fuentes de emisión de contaminación del aire son diversas y la dispersión de las emisiones es muy volátil1. En los últimos años, el monitoreo móvil ha jugado un papel cada vez más importante como complemento a los métodos de monitoreo tradicionales, como el monitoreo estacionario y la teledetección satelital2,3,4. Proporciona una alternativa altamente escalable para operar en diversos entornos urbanos mientras genera datos de alta resolución.

Las técnicas móviles de medición de la calidad del aire están documentadas en un cuerpo de literatura en rápida expansión. Los más notables incluyen una serie de estudios realizados en colaboración con coches de Google Street View en Houston, el Área de la Bahía de San Francisco, Ámsterdam, Copenhague y Londres (https://www.google.com/earth/outreach/special-projects /calidad del aire). En las ciudades se llevaban monitores de aire de referencia y de investigación, midiendo repetidamente la mayoría de los segmentos de las calles en períodos de meses a años. Sus datos sin procesar se publicaron parcialmente a través de una base de datos en línea de terceros y una API (https://explore.openaq.org). Si bien la cobertura espacial y temporal fue extensa, las campañas de monitoreo del aire de Google se centraron en áreas urbanas pobladas con buena densidad de muestreo de imágenes de calles. Los instrumentos de monitoreo móviles y los laboratorios operados por académicos son otra fuente importante de datos sobre la calidad del aire. No obstante, los resultados finales de dicha implementación suelen ser artículos e informes científicos, normalmente sin publicar el conjunto de datos completo5,6,7,8. Aunque algunos artículos adjuntan archivos de datos sin procesar, hay menos coherencia en la calidad de los datos de un proyecto a otro, dada la diferencia en el alcance del estudio, la instrumentación, el personal, los métodos de muestreo y la validación de los datos. Otro importante conjunto de datos sobre la calidad del aire se obtiene con la adopción más amplia de tecnología de detección del aire de bajo costo, ciencia ciudadana y campañas de monitoreo colaborativas9. Además, la falta de un canal unificado y de código abierto para indexar y recuperar datos de estudios individuales ha creado un obstáculo sustancial para que los no académicos accedan y hagan un mayor uso de estos datos fuera de las publicaciones científicas.

Nuestro trabajo tiene como objetivo mitigar la brecha en la disponibilidad de datos ambientales hiperlocales tanto en regiones desarrolladas como en desarrollo con tres ventajas reproducibles y de bajo costo con instrumentación, métodos de muestreo y procedimientos de validación de datos consistentes10. Primero presentamos la plataforma móvil que utilizamos en implementaciones del mundo real en ciudades globales y cómo sus configuraciones personalizadas pueden servir mejor a estas aplicaciones. Además, presentamos datos de detección ambiental validados, centrándonos en datos de monitoreo del aire calibrados, de varias implementaciones de monitoreo móvil en diversos contextos urbanos desde Medio Oriente hasta América del Norte, tanto en regiones desarrolladas como en desarrollo. Por último, demostramos casos de uso típicos de datos de contaminación del aire por sí mismos y otras fuentes de datos en la ciudad de Nueva York, incluida la inferencia de puntos críticos de emisiones y predicciones de la calidad del aire. Nuestros resultados concuerdan bien con los mapas regulatorios vigentes de predicción de la calidad del aire, lo que demuestra la validez de nuestra metodología de recopilación y calibración de datos. Este documento es oportuno para que los profesionales e investigadores ambientales reflexionen sobre los enfoques tradicionales de recopilación y publicación de datos sobre la calidad del aire, proporcionando un buen ejemplo para prácticas futuras.

Los conjuntos de datos de calidad del aire en este estudio se recopilaron utilizando nuestra plataforma de detección móvil City Scanner (CS) de diseño y fabricación propia11,12. Su objetivo es permitir tareas de detección ambiental a gran escala utilizando flotas urbanas existentes, como taxis, autobuses y vehículos de servicios municipales, como nodos de detección. Presentamos el diseño de nuestro sensor, que se basa en tres conceptos resumidos en la Fig. 1: diseño de bajo costo, unidades de detección modulares y capacidades de Internet de las cosas (IoT). Nuestro diseño de bajo costo sigue la definición de sensor de aire de bajo costo de la Agencia de Protección Ambiental de EE. UU. (EPA), que establece un límite de costo superior de $2,500 (https://www.epa.gov/air-sensor-toolbox /guía-de-sensores-de-aire-cómo-utilizar-sensores-de-aire). Las unidades de detección modulares de CS permiten a los usuarios personalizar fácilmente sus capacidades de detección o una variedad de aplicaciones de detección ambiental. CS está habilitado para IoT, donde los datos recopilados sobre la calidad del aire y el estado del dispositivo se pueden transmitir instantáneamente a la nube para su almacenamiento y análisis a través de una red celular. Como se muestra en la Fig. 1, las combinaciones de cada dos conceptos de diseño cumplen tres funciones principales: a) monitorear el estado de los sensores individuales y el acceso remoto e instantáneo a los datos, b) versatilidad en entornos urbanos complejos que equilibran el consumo de energía, el costo y los requisitos de datos del dispositivo. yc) una visión para la detección de enjambres, en la que una flota de CS opera en coordinación para alcanzar el escaneo de la ciudad en tiempo real. Sólo se necesitan unos pocos sensores para detectar un gran espacio urbano13.

El límite de diseño de City Scanner (interior) y el límite de función (exterior).

Específicamente, cada CS tiene dos compartimentos principales: los compartimentos de control y detección. El compartimento de control alberga la placa base, el sistema de almacenamiento local y comunicación de datos, y el sistema de gestión del rendimiento térmico y energético. El compartimento de detección es más relevante para la recopilación de datos y se detalla en esta sección. La Figura 2 ilustra la configuración básica de la iteración actual de CS, denominada "Whiteburn II", centrándose en el compartimento de detección en la vista frontal.

Configuración básica del Whiteburn II.

En la configuración estándar del compartimiento de detección, se adopta un contador de partículas óptico Alphasense OPC-N3 de bajo costo para medir la concentración de partículas (PM). Cuenta el número de partículas emitiendo un rayo láser a través del flujo de aire que se aspira, de modo que al contar los pulsos de luz dispersados ​​por las partículas en el flujo de aire, OPC puede inferir el número de partículas de diferentes tamaños. Esta técnica ha sido ampliamente adoptada en proyectos académicos y de ciencia ciudadana14,15. Se pueden alojar dos sensores de gas simultáneamente en el compartimento de detección. En las implementaciones de sensores reportadas en este estudio, utilizamos sensores de gas electroquímicos de Alphasense para CO, NO2 y SO2. El material de la superficie de un sensor de gas electroquímico reacciona con el contaminante gaseoso objetivo, lo que da como resultado una corriente eléctrica que pasa desde el electrodo de trabajo al de referencia. La corriente se mide y es proporcional a la concentración del contaminante objetivo. CS tiene una plataforma básica con un OPC y capacidad de detección de hasta dos contaminantes gaseosos. La plataforma también está equipada con capacidades básicas de detección ambiental, incluida la detección de temperatura del aire ambiente y humedad relativa. Los sensores meteorológicos están montados en el zócalo mikroBUSTM, que consta de un par de conectores hembra de 1 × 8. La distribución de pines consta de tres grupos de pines de comunicaciones (SPI, UART e I2C), seis pines adicionales (PWM, interrupción, entrada analógica, reinicio y selección de chip) y dos grupos de alimentación (+3,3 y 5 V). La Tabla 1 documenta una lista de sensores ambientales que se utilizan actualmente, que pueden sustituirse fácilmente siempre que los protocolos de comunicación de datos se ajusten.

Utilizamos la versión de la plataforma CS "Whiteburn II" para la recopilación de datos de alta resolución espacio-temporal, que está diseñada como una plataforma de detección ambiental plug-and-play. Después de una carga completa, cada CS se montó en el techo de un vehículo, cuya información de flota se presenta en la Tabla 2. El CS debe colocarse con la entrada de aire del OPC orientada hacia los lados y el compartimiento de detección orientado hacia la dirección de conducción. Esta orientación minimiza la influencia de la velocidad del vehículo en la entrada de aire del OPC, al tiempo que expone los sensores pasivos de gas de muestreo tanto como sea posible al aire ambiente. Adoptamos un método de recopilación de datos oportunista, donde la recopilación de datos de CS no es el objetivo principal de la conducción. Indica que no tenemos rutas prescritas para que sigan los vehículos. Para evitar sesgos espaciales y temporales en el muestreo (algunos lugares y algunas franjas horarias están sobremuestreados), cada campaña de recogida de datos se ha realizado en un período suficientemente largo, de al menos dos meses. El período y el área de muestreo también dependen del alcance del estudio de cada implementación. En general, los protocolos de diseño e implementación de nuestra plataforma son simples de aplicar y fáciles de usar, y tienen como objetivo hacer que la detección ambiental esté disponible para una población más grande y tantas comunidades como sea posible.

Dos despliegues en la ciudad de Nueva York tienen como objetivo el distrito del Bronx, con 2 millones de residentes, en su mayoría minorías étnicas y raciales. El Bronx está desproporcionadamente expuesto a peligros en la calidad del aire, al igual que muchos otros vecindarios vulnerables que están sobrecargados de problemas ambientales16. La región está cubierta por cuatro estaciones de referencia operadas por el Departamento de Conservación Ambiental del Estado de Nueva York, de las cuales sólo dos miden contaminantes gaseosos además de PM. El Departamento de Salud de la Ciudad de Nueva York diseñó la Encuesta del Aire Comunitario de la Ciudad de Nueva York (NYCCAS) con una red de monitoreo del aire más fina de sensores de alta calidad pero sin grado de referencia desde 2008 (https://www.nyc.gov/site/doh/ data/data-sets/air-quality-nyc-community-air-survey). NYCCAS administra quince sitios de monitoreo en el Bronx, recolectando concentraciones de PM2.5, carbono negro, NO y NO2 cada hora una vez por temporada. Nuestras implementaciones en el Bronx trabajaron en conjunto con estas autoridades locales para complementar la red existente, brindando más detalles sobre la variabilidad espacial y temporal de la calidad del aire. Además, las mediciones móviles de la calidad del aire son útiles para cuantificar las disparidades en la exposición a la contaminación del aire con una alta resolución espacio-temporal, lo que recomienda planes de mitigación de la contaminación del aire equitativos y justos.

En la implementación de Boston, recopilamos datos hiperlocales sobre la calidad del aire en un vecindario al norte del aeropuerto internacional Logan de Boston. Montamos unidades de CS en un laboratorio ambiental móvil de grado de investigación, que mide las concentraciones de partículas y NOx en tiempo real, cuya validez ha sido probada en publicaciones anteriores17,18. Comparamos los datos recopilados por CS con datos de laboratorios móviles de alta calidad, lo que demuestra la transferibilidad y solidez de nuestro enfoque de muestreo móvil de la calidad del aire.

El despliegue final presentado en este estudio se llevó a cabo en Beirut, la capital del Líbano. El país se enfrenta a un grave colapso económico y ha estado sufriendo la contaminación del aire provocada por los generadores diésel, ya que su red eléctrica centralizada funciona sólo unas pocas horas al día. Actualmente, no existe una infraestructura de monitoreo de la calidad del aire regulada por el gobierno. Hasta donde sabemos, nuestros colaboradores de la Universidad Americana de Beirut administran el único sitio de monitoreo del aire con nivel de investigación, que mide las partículas y la contaminación gaseosa. La extremadamente escasa red de monitoreo del aire no puede proporcionar mucha información útil para abordar el problema del deterioro de la calidad del aire local. En este caso, nuestro despliegue tiene como objetivo abordar la brecha de datos sobre la calidad del aire local en un entorno urbano con escasez de datos y recursos. En total, nuestras implementaciones de CS demostraron la precisión, validez, durabilidad y versatilidad en una variedad de entornos urbanos no controlados que sirven para diversos fines, incluida la gestión de la calidad del aire, la mitigación del cambio climático, la participación ciudadana y la difusión de conocimientos.

Los sensores de bajo costo son propensos a tener problemas de estabilidad y calidad de los datos. Por ejemplo, el OPC de bajo costo no puede distinguir las partículas de las gotas de agua. Por tanto, no funciona bien en ambientes de alta humedad (85%)19,20. Por lo tanto, es necesario realizar la colocación y calibración del sensor para garantizar mediciones precisas y sólidas. Aquí definimos la colocación como el proceso de implementar sensores de bajo costo al lado de monitores de referencia y la calibración como el ajuste de las lecturas sin procesar de los sensores utilizando datos de colocación y modelos matemáticos. Los conjuntos de datos de calidad del aire publicados en este estudio se limpiaron, calibraron y validaron bajo un marco estandarizado que hace referencia a los protocolos de prueba de rendimiento de sensores de aire de la EPA de EE. UU. publicados en 202110,21,22. La EPA de EE. UU. es una agencia federal que regula y gestiona asuntos de protección ambiental. También brindan referencias, pautas y regulaciones consideradas "el estándar de oro" para el monitoreo de la calidad del aire, principalmente en los EE. UU. y muchos otros países. En la Fig. 3 se presenta un diagrama de flujo general de nuestro proceso de posprocesamiento y validación.

Protocolos de postprocesamiento y validación de datos.

Inmediatamente antes o después de implementaciones móviles de más de tres meses, realizamos la colocación estacionaria durante al menos tres semanas, ya que las estaciones de referencia generalmente informan mediciones cada hora, de modo que podemos obtener alrededor de quinientos puntos de datos coincidentes para el desarrollo del modelo de calibración. Sugerimos utilizar datos de colocación con mayor resolución temporal, idealmente por minuto, para modelar el entrenamiento, la validación y las pruebas, dado que las lecturas de CS son cada cinco segundos. Los modelos son modelos estadísticos desarrollados utilizando factores meteorológicos y lecturas de CS como variables explicativas y lecturas del monitor de referencia como variable objetivo. Es decir, “calibrar” los dispositivos CS hacia la referencia. Empíricamente, utilizamos principalmente cuatro factores meteorológicos de una estación meteorológica central para todas las unidades CS que circulan en una ciudad, incluida la temperatura del aire, la humedad, la presión del aire y el punto de rocío. Para cada unidad CS, desarrollamos un modelo de calibración específico de la unidad para tener en cuenta la variabilidad entre sensores de sensores de bajo costo, donde cada sensor responde a la misma concentración de contaminantes del aire ligeramente diferente de los demás. Adoptamos dos tipos de modelos de calibración basados ​​en árboles, a saber, bosque aleatorio y árbol de aumento de gradiente, que tienen una velocidad de entrenamiento más rápida y una mejor interpretabilidad. Específicamente, la segunda implementación en Nueva York empleó el modelo de calibración de árbol de aumento de gradiente, ya que hay más datos de colocación (27 000 lecturas de nivel minuto por unidad CS en comparación con un promedio de 2000 en otras implementaciones). Las otras implementaciones se calibraron con un modelo de bosque aleatorio, que proporciona mayor precisión y mejor generalización con menos datos de colocación. La capacitación del modelo se realizó en Python utilizando las bibliotecas scikit learn23 y LightGBM24 y en nuestra publicación reciente se puede encontrar información detallada sobre el ajuste de hiperparámetros10.

El rendimiento de los modelos de calibración se evalúa con validación cruzada k-veces23 y dos métricas estadísticas, la r y la raíz del error cuadrático medio (RMSE), como se muestra en las Ecs. 1, 2. r es el coeficiente de correlación de Pearson entre las lecturas de CS calibradas y las lecturas de referencia. RMSE mide la diferencia absoluta entre estas dos lecturas. En los conjuntos de datos de entrenamiento y prueba, las lecturas de CS para contaminantes del aire y factores meteorológicos, incluida la temperatura, la humedad, el punto de rocío y la presión del aire, se utilizaron como factores explicativos, mientras que las lecturas del monitor de referencia se trataron como el factor objetivo. Otros factores meteorológicos que se encuentran comúnmente en las estaciones meteorológicas locales, incluida la velocidad del viento, la dirección del viento y la temperatura de sensación, también se probaron en los modelos, pero se eliminaron debido a su insignificancia estadística.

Dónde:

yi y \({\widehat{y}}_{i}\) son características objetivo observadas y predichas en el conjunto de datos de prueba;

\(\mathop{y}\limits^{-}\) y \(\overline{\widehat{y}}\) son valores medios de las características objetivo observadas y predichas en el conjunto de datos de prueba;

n es el tamaño del conjunto de datos de prueba.

Luego, los modelos de calibración se aplicaron a datos de calidad del aire móvil limpio para producir los conjuntos de datos que presentamos en este documento. Nuestro proceso de limpieza de datos es sencillo y sigue el principio de preservar tantos puntos de datos como sea posible. Primero, todos los sensores están funcionando y arrojan resultados numéricos. CS está diseñado para emitir señales de "No aplicable (NA)" cuando los sensores funcionan con anomalías, como batería baja o sobrecalentamiento. En segundo lugar, se excluyen las lecturas en condiciones de alta humedad (>90 % o lluvia), dado que se sabe que el contador de partículas de bajo costo que utilizamos tiene respuestas sesgadas en esta condición19,25. Por último, eliminamos registros con lecturas fuera de los rangos razonables (<1 ug/m3 o >1000 ug/m3 para PM2.5, <200 mv o >900 mv para electroseñal de NO2). Los rangos razonables están determinados por el conocimiento a priori del entorno y de los propios sensores26,27. En total, alrededor del 15% de los datos sin procesar se excluyen de la limpieza de datos.

El desempeño de los modelos de calibración de PM2.5 para todas las ciudades se presenta en la Tabla 3. Vale la pena señalar que el modelo de calibración tiene un desempeño deficiente en el conjunto de datos de Beirut, lo cual se debe a los recursos limitados de monitoreo del aire de Beirut. Idealmente, la CS debería calibrarse con instrumentos de calidad de referencia antes de su implementación, cuya compra y mantenimiento a menudo requieren una buena cantidad de aportes financieros por parte de gobiernos y agencias. Sin embargo, Beirut actualmente no tiene recursos suficientes para operar una estación de monitoreo de la calidad del aire de referencia debido al colapso económico ni instrumentos de aire independientes de calidad de referencia a los que podamos acceder. Alternativamente, utilizamos un sensor de PM de grado de investigación para la colocación y calibración, a saber, un monitor de masa de atenuación beta ambiental portátil Met One E-BAM proporcionado por nuestros colaboradores locales. Si bien el monitor es de alta calidad, no puede cumplir con los estándares de los monitores de referencia. Revela que una inversión pública limitada para el monitoreo y la regulación de la calidad del aire puede, a su vez, generar mayores lagunas en la regulación del aire y en la investigación en las regiones menos desarrolladas. Nuestro diseño de la plataforma CS y la publicación de nuestros datos de monitoreo del aire tienen como objetivo reducir estas brechas. Aún así, existen ciertas limitaciones en nuestro enfoque.

Los registros de datos de todos los dispositivos para el mismo indicador ambiental (por ejemplo, PM1, PM2.5, PM10 y NO2) en cada implementación se agrupan en el mismo conjunto de datos. Después de la limpieza y calibración de datos, hay 118.765 (piloto 1 de Nueva York), 515.917 (piloto 2 de Nueva York), 123.192 (Boston) y 56.628 (Beirut) registros de datos de intervalo de 5 segundos. Cada archivo de datos incorpora cinco categorías de campos: ID de sensor únicos, marca de tiempo, coordenadas GPS, clima y concentraciones calibradas, como se demuestra en la Tabla 4. La cantidad de campos para cada implementación está determinada por la cantidad de contaminantes que hemos medido y calibrado. Mapeamos las distribuciones espaciales de las concentraciones de PM2,5 en las cuatro implementaciones de la Fig. 4. Los conjuntos de datos están disponibles bajo la licencia Creative Commons Attribution en Zenodo28.

Distribuciones espaciales de concentraciones de PM2,5 en (a) Piloto 1 de Nueva York, (b) Piloto 2 de Nueva York, (c) Boston y (d) Beirut.

Los datos hiperlocales sobre la calidad del aire brindan oportunidades únicas para la toma de decisiones ambientales y climáticas basadas en datos. Aunque cubre un área grande con alta resolución espacial, el monitoreo móvil está sujeto a una mayor incertidumbre que el monitoreo estacionario, ya que el sensor solo captura una instantánea de una ubicación determinada. Por lo tanto, es fundamental realizar mediciones repetitivas en el mismo lugar. Se sugiere agregar al menos cuatro mediciones aleatorias en días diferentes para generar un valor promedio de contaminación del aire en un determinado lugar en la misma temporada7. En la práctica, una determinada ubicación se puede definir como segmentos de calles o celdas de cuadrícula de diferentes tamaños. Dada la diferente duración e intensidad de la recopilación de datos en nuestras implementaciones, el tamaño de la cuadrícula con el que agregamos nuestras observaciones varía de 100 por 100 ma 300 por 300 m. Como regla general, al menos 500 cuadrículas deberían cubrir al menos un tercio de la superficie terrestre de una ciudad con más de diez observaciones de al menos cuatro días diferentes en la misma temporada para generar una superficie sólida de calidad del aire. Esto asegura una buena representación espacial de una ciudad con niveles representativos de contaminación del aire. Aquí presentamos un par de aplicaciones potenciales de nuestros conjuntos de datos sobre la calidad del aire, con especial atención en el conjunto de datos de la ciudad de Nueva York y su aplicación en el mapeo de la contaminación del aire.

Primero, analizamos los datos de mediciones móviles calibradas en el Bronx, Nueva York. Agregamos los datos en celdas de cuadrícula de 100 por 100 m. Todas las celdas de la Fig. 5 contienen al menos diez observaciones de 4 días diferentes. Este mapa es útil para identificar puntos críticos de emisiones y contaminación del aire, donde observamos que las carreteras y áreas industriales en la esquina inferior derecha sufren concentraciones de PM2,5 significativamente más altas.

Concentraciones medidas de PM2,5 en el Bronx después de la calibración y agregación.

Otro uso común de los datos móviles sobre la calidad del aire es la regresión del uso de la tierra (LUR), una técnica de regresión espacial que utiliza la proximidad del uso de la tierra y los indicadores de emisiones para explicar y estimar los niveles de contaminación del aire en lugares sin medición. Utilizando las concentraciones medidas de PM2,5 en cada celda de la cuadrícula, creamos zonas de amortiguamiento de diferentes tamaños, que van desde 50 a 1000 m, y extraemos indicadores de emisión y uso de la tierra dentro de cada tamaño de zona de amortiguamiento. Los indicadores están documentados en la Tabla 5, que se alinea con los mapas regulatorios de contaminación del aire desarrollados bajo el programa New York City Community Air Survey (NYCCAS) y se obtienen de la plataforma de datos abiertos de Nueva York (https://nyccas.cityofnewyork.us/nyccas2021v9 /sites/default/files/NYCCAS-appendix/Appendix1.pdf). Nuestro mapa de predicción presentado en la Fig. 6 ilustra un patrón espacial similar al regulatorio NYCCAS en el mismo ámbito temporal, aunque los niveles absolutos de contaminación del aire difieren ligeramente. Además, contrastamos nuestras predicciones de PM2,5 en celdas de cuadrícula de 100 por 100 m con las predicciones de NYCCAS celda por celda. Empleamos datos de 2020 para comparar, dada la falta de disponibilidad de datos para 2021 en buena resolución. La correlación de Pearson es 0,38 entre los dos conjuntos de datos y el error cuadrático medio es 2,02 µg/m3. Dado que las predicciones del NYCCAS de 2020 también modelan resultados basados ​​en observaciones, se anticipa una correlación relativamente baja entre los dos modelos. Aún así, las estadísticas demuestran un desempeño satisfactorio de nuestro modelo de predicción y, por lo tanto, la validez de nuestro método de muestreo móvil y el control de calidad de los datos.

Superficies de regresión del uso del suelo de concentraciones de PM2,5 en el Bronx mediante (a) datos de City Scanner y (b) datos de NYCCAS.

Se anima a los usuarios a desarrollar más conocimientos a partir de nuestros conjuntos de datos de calidad del aire, modelos de calibración y casos de uso. Esta sección presenta posibles direcciones de investigación futuras para futuras discusiones y esfuerzos. En primer lugar, es útil que los investigadores y profesionales investiguen más a fondo las causas de los puntos críticos de emisión y contaminación del aire, que podrían no estar alineados espacialmente, para reflexionar sobre sus estrategias actuales de reducción de emisiones y gestión de la calidad del aire. En segundo lugar, al superponer las distribuciones espaciales de la calidad del aire y los indicadores de salud pública, como la tasa de asma, las visitas a las salas de emergencia y la incidencia de otras enfermedades respiratorias y cardiovasculares, se pueden rastrear los impactos adversos de la contaminación del aire en la salud desde una perspectiva epidemiológica. Por último, es interesante investigar la exposición a la contaminación del aire y su disparidad entre las comunidades a través de un análisis estático basado en la ubicación del hogar o un análisis dinámico basado en patrones de movilidad.

Aquí reconocemos algunas deficiencias conocidas de los conjuntos de datos publicados. En primer lugar, el OPC de bajo costo que utilizamos para medir las partículas es conocido por su rendimiento deteriorado en ambientes de alta humedad, ya que no puede diferenciar las partículas de las gotas de agua en el aire. Por lo tanto, nuestros conjuntos de datos no incluyen observaciones recopiladas en >90% de humedad relativa. En segundo lugar, los conjuntos de datos de Boston y Beirut se calibraron con sensores de grado de investigación en lugar de sensores de grado de referencia. Los sensores de investigación utilizados en Boston se calibraron en una estación de referencia inmediatamente antes del despliegue móvil. En Beirut, los sensores aptos para investigación eran la única opción disponible para la calibración local, dado que no existían estaciones de referencia reguladas por el gobierno. No consideramos que esto pueda dar lugar a sesgos significativos en los conjuntos de datos publicados. En tercer lugar, nuestros datos de temperatura y humedad no se han calibrado con respecto a monitores de referencia, ya que no son el foco principal de nuestras implementaciones. En este caso, su validez no se ha adoptado como criterio para la depuración de datos, cuyo objetivo es preservar el máximo número de observaciones válidas para partículas y NO2. Recomendamos encarecidamente a la audiencia que los adopte sólo con fines educativos o que tengan sentido y que realice una verificación de cordura antes de cualquier tipo de análisis. Por último, dado que CS es una plataforma de detección ambiental de bajo costo, es crucial colocar y calibrar la plataforma antes de usarla localmente. Esto es especialmente importante si un despliegue está midiendo PM, ya que el OPC cuenta partículas en contenedores de diferentes tamaños y luego estima la concentración de masa con suposiciones de forma y densidad, que pueden variar significativamente de un lugar a otro, de una temporada a otra.

Además de los datos de calidad del aire con hora y ubicación, también proporcionamos una compilación de capas GIS de uso del suelo que se utilizan en nuestros modelos LUR y en el de NYCCAS para una reproducción conveniente de los resultados en nuestro repositorio de Github (https://github.com/ MIT-Senseable-City-Lab/OSCS/tree/main). Estas capas SIG son publicadas por los gobiernos de la ciudad de Nueva York y del estado de Nueva York y los autores las procesan para modelar, con 2021 como año base. Se anima a la audiencia a explorar el repositorio con respecto a los detalles sobre cómo diseñamos, construimos, calibramos y utilizamos la plataforma CS. El código Python está disponible para la extracción automática de características de uso del suelo, capacitación LUR y evaluación del desempeño.

Anjomshoaa, A., Santi, P., Duarte, F. y Ratti, C. Cuantificación del potencial espacio-temporal de la detección de vehículos en ciudades inteligentes. Revista de Tecnología Urbana 28, 199–216 (2020).

Artículo de Google Scholar

Leifer, I. & Melton, C. Uso de sensores remotos e in situ de superficie móvil y sensores remotos aéreos para derivar emisiones de un campo petrolero en producción en el centro de California en un terreno complejo. Atmos Pollut Res 12, 101145 (2021).

Artículo CAS Google Scholar

Simón, MC y col. Combinación de mediciones de monitoreo móvil y un sitio de referencia para desarrollar modelos de concentración de número de partículas ultrafinas ambientales en residencias. Environ Sci Technol 52, 6985–6995 (2018).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Southerland, VA y cols. Evaluación de la distribución de los riesgos para la salud de la contaminación del aire dentro de las ciudades: un análisis a escala de vecindario que aprovecha conjuntos de datos de alta resolución en el Área de la Bahía, California. Perspectiva de salud ambiental 129, EHP7679 (2021).

Artículo de Google Scholar

Apte, JS et al. Mapeo de la contaminación del aire de alta resolución con Google Street View Cars: explotación de Big Data. Environ Sci Technol 51, 6999–7008 (2017).

Artículo ADS CAS PubMed Google Scholar

Kerckhoffs, J. y col. Marco de modelado de efectos mixtos para Ámsterdam y Copenhague para concentraciones de NO2 en exteriores utilizando mediciones muestreadas con Google Street View Cars. Environ Sci Technol acs.est.1c05806, https://doi.org/10.1021/ACS.EST.1C05806 (2022).

Messier, KP et al. Mapeo de la contaminación del aire con automóviles de Google Street View: enfoques eficientes con monitoreo móvil y regresión del uso del suelo. Environ Sci Technol 52, 12563–12572 (2018).

Artículo ADS CAS PubMed Google Scholar

Mui, W. y col. Desarrollo de un protocolo de evaluación del rendimiento para sensores de aire implementados en un automóvil de Google Street View. Environ Sci Technol 55, 1477–1486 (2021).

Artículo ADS CAS PubMed Google Scholar

Thompson, JE Estudios de calidad del aire de colaboración colectiva: una revisión de la literatura y sensores portátiles. Tendencias en química analítica ambiental 11, 23–34 (2016).

Artículo CAS Google Scholar

Wang, A. y col. Aprovechar los algoritmos de aprendizaje automático para avanzar en la calibración de sensores de aire de bajo costo en entornos estacionarios y móviles. Atmos Environ 301, 119692 (2023).

Artículo CAS Google Scholar

Anjomshoaa, A. et al. City Scanner: construcción y programación de una plataforma de detección móvil para servicios de ciudades inteligentes. IEEE Internet Things J 5, 4567–4579 (2018).

Artículo de Google Scholar

Mora, S., Anjomshoaa, A., Benson, T., Duarte, F. y Ratti, C. Hacia la detección de vehículos a gran escala con nodos de escáner urbano multipropósito. IEEE Quinto Foro Mundial sobre Internet de las Cosas, WF-IoT 2019 - Actas de la conferencia 743–748, https://doi.org/10.1109/WF-IOT.2019.8767186 (2019).

O'Keeffe, KP, Anjomshoaa, A., Strogatz, SH, Santi, P. y Ratti, C. Cuantificación del poder de detección de flotas de vehículos. Actas de la Academia Nacional de Ciencias 116, 12752–12757 (2019).

ADS del artículo Google Scholar

deSouza, P. et al. Monitoreo de la calidad del aire mediante sensores móviles de bajo costo montados en camiones de basura: desarrollo de métodos y lecciones aprendidas. Sustain Cities Soc 60, 102239 (2020).

Artículo de Google Scholar

Santana, P. et al. Mapeo y visualización de la calidad del aire: una solución asequible basada en una red de sensores montados en vehículos. J Clean Prod 315, 128194 (2021).

Artículo de Google Scholar

Spira-Cohen, A., Chen, LC, Kendall, M., Lall, R. y Thurston, GD Exposiciones personales a la contaminación del aire relacionada con el tráfico y salud respiratoria aguda entre escolares del Bronx con asma. Perspectiva de salud ambiental 119, 559–565 (2011).

Artículo PubMed PubMed Central Google Scholar

Hudda, N., Simon, MC, Patton, AP y Durant, JL Reducciones en las concentraciones de carbono negro y partículas ultrafinas relacionadas con el tráfico en un vecindario urbano durante la pandemia de COVID-19. Ciencia del Medio Ambiente Total 742, 140931 (2020).

Artículo ADS CAS PubMed Google Scholar

Simón, MC y col. Comparaciones de las concentraciones del número de partículas ultrafinas relacionadas con el tráfico medidas en dos áreas urbanas mediante monitoreo central, residencial y móvil. Atmos Environ 169, 113-127 (2017).

Artículo ADS CAS Google Scholar

Crilley, LR y cols. Evaluación de un contador óptico de partículas de bajo costo (Alphasense OPC-N2) para monitoreo del aire ambiente. Atmos Meas Tech 11, 709–720 (2018).

Artículo de Google Scholar

Di Antonio, A., Popoola, OAM, Ouyang, B., Saffell, J. & Jones, RL Desarrollo de una corrección de humedad relativa para sensores de bajo costo que miden partículas ambientales. Sensores 2018, vol. 18, Folio 2790 18, 2790 (2018).

Google Académico

EPA de EE. UU. Protocolos de prueba de rendimiento, métricas y valores objetivo para sensores de aire de partículas finas: uso en aplicaciones de monitoreo informativo y suplementario no regulatorio, en sitios fijos, al aire libre y ambientales. https://cfpub.epa.gov/si/si_public_record_Report.cfm?dirEntryId=350785&Lab=CEMM, EPA/600/R-20/280 (2021).

EPA de EE. UU. Protocolos de prueba de rendimiento, métricas y valores objetivo para sensores de aire con ozono: uso en aplicaciones de monitoreo ambiental, exterior, de sitio fijo, no regulatorias e informativas. https://cfpub.epa.gov/si/si_public_record_Report.cfm?dirEntryId=350784&Lab=CEMM, doi: EPA/600/R-20/279 (2021).

Pedregosa, F. et al. Scikit-learn: Aprendizaje automático en Python Para citar esta versión: Scikit-learn: Aprendizaje automático en Python. Revista de investigación sobre aprendizaje automático 12 (2011).

Ke, G. y col. LightGBM: un árbol de decisiones de impulso de gradiente altamente eficiente. en la 31ª Conferencia sobre Sistemas de Procesamiento de Información Neural (NIPS 2017) (2017).

Kim, J., Shusterman, AA, Lieschke, KJ, Newman, C. y Cohen, RC La Red de Observación de CO2 Atmosférico de Berkeley: Calibración de campo y evaluación de sensores de calidad del aire de bajo costo. Atmos Meas Tech 11, 1937-1946 (2018).

Artículo CAS Google Scholar

Sentido alfa. Sensor de dióxido de nitrógeno Alphasense NO2-A43F – Especificaciones técnicas de 4 electrodos Versión 1.0. https://www.alphasense.com/wp-content/uploads/2022/09/Alphasense_NO2-A43F_datasheet.pdf.

Sousan, S., Koehler, K., Hallett, L. & Peters, TM Evaluación del contador de partículas ópticas Alphasense (OPC-N2) y el espectrómetro de aerosol portátil Grimm (PAS-1.108). Ciencia y tecnología de aerosoles 50, 1352–1365 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Wang, A. y col. Conjuntos de datos abiertos para datos ambientales urbanos hiperlocales en ciudades globales. Zenodo https://doi.org/10.5281/zenodo.7961851 (2023).

Descargar referencias

El estudio fue financiado por el Consorcio MIT Senseable City Lab (LandWey, Consiglio per la Ricerca in Agricoltura e l'Analisi dell'Economia Agraria, Volkswagen Group America, FAE Technology, Samoo Architects & Engineers, Shell, GoAigua, Fundación ENEL, Universidad de Tokio, Weizmann Institute of Science, Universidad Autónoma de Occidente, Instituto Politecnico Nacional, Imperial College London, Università di Pisa, KTH Royal Institute of Technology, AMS Institute, Helsingborg, Laval, Estocolmo, Amsterdam). Agradecemos a Sarah Johnson del Departamento de Salud de la ciudad de Nueva York, al Prof. Issam Lakkis y al Prof. Nareg Karaoghlanian de la American University Beirut por proporcionar fuentes de datos complementarias, facilitar las campañas de recopilación de datos y sus aportes de conocimiento local, sin los cuales este trabajo no se puede terminar.

Senseable City Lab, Departamento de Planificación y Estudios Urbanos, Instituto de Tecnología de Massachusetts, Cambridge, EE.UU.

An Wang, Simone Mora, Yuki Machida, Sanjana Paul, Oluwatobi Oyinlola, Fabio Duarte y Carlo Ratti

Departamento de Ciencias de la Computación, Universidad Noruega de Ciencia y Tecnología, Trondheim, Noruega

Simón Mora

Departamento de Planificación Urbana y Regional, Universidad de Colorado Denver, Denver, EE.UU.

Priyanka De Souza

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

An Wang: conceptualización, redacción, metodología, adquisición de datos. Simone Mora: conceptualización, redacción, metodología, adquisición de datos, supervisión, gestión de proyectos. Yuki Machida: metodología, adquisición de datos. Priyanka deSouza: metodología, adquisición de datos. Sanjana Paul: adquisición de datos. Oluwatobi Oyinlola: metodología, adquisición de datos. Fábio Duarte: metodología, supervisión, edición, gestión de proyectos. Carlo Ratti: supervisión, adquisición de financiación.

Correspondencia a Simone Mora.

Los autores declaran no tener conflictos de intereses.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Wang, A., Mora, S., Machida, Y. et al. Datos ambientales hiperlocales con plataforma móvil en entornos urbanos. Datos de ciencia 10, 524 (2023). https://doi.org/10.1038/s41597-023-02425-3

Descargar cita

Recibido: 30 de marzo de 2023

Aceptado: 28 de julio de 2023

Publicado: 05 de agosto de 2023

DOI: https://doi.org/10.1038/s41597-023-02425-3

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt