Los bioindicadores bacterianos permiten la clasificación del estado biológico a lo largo del río Danubio continental
HogarHogar > Blog > Los bioindicadores bacterianos permiten la clasificación del estado biológico a lo largo del río Danubio continental

Los bioindicadores bacterianos permiten la clasificación del estado biológico a lo largo del río Danubio continental

May 01, 2024

Biología de las comunicaciones volumen 6, número de artículo: 862 (2023) Citar este artículo

698 Accesos

14 altmétrica

Detalles de métricas

A pesar de la importancia de las bacterias en los ecosistemas acuáticos y sus patrones de diversidad predecibles en el espacio y el tiempo, faltan herramientas de biomonitoreo para la evaluación del estado que dependan de estos organismos. Esto se debe en parte a la insuficiencia de datos y modelos para identificar predictores microbianos confiables. Aquí, mostramos metabarcodes en combinación con estadísticas multivariadas y el aprendizaje automático permite identificar bioindicadores bacterianos para los sistemas de clasificación de estado biológico existentes. La dinámica de la diversidad beta bacteriana sigue los gradientes ambientales y las asociaciones observadas resaltan posibles bioindicadores de resultados ecológicos. Los vínculos espacio-temporales que abarcan las comunidades microbianas a lo largo del río permiten una predicción precisa del estado biológico aguas abajo a partir de información aguas arriba. El análisis de red sobre variables de secuencia de amplicones identifica como buenos indicadores los géneros Fluviicola, Acinetobacter, Flavobacterium y Rhodoluna, y revela redundancia de información entre taxones, que coincide con la relación taxonómica. La redundancia entre los bioindicadores bacterianos revela taxones mutuamente excluyentes, que permiten un modelado preciso del estado biológico utilizando tan solo 2 o 3 variantes de secuencia de amplicones. Como tal, nuestros modelos muestran que el uso de algunas variantes de secuencia de amplicones bacterianos de géneros distribuidos globalmente permite la evaluación del estado biológico a lo largo de los sistemas fluviales.

En las últimas décadas, la conservación y restauración de ecosistemas fluviales en peligro de extinción se han vuelto fundamentales en todo el mundo. En Europa, la evaluación del estado ecológico se basa en varios indicadores, incluidos parámetros físicos, químicos y biológicos. Los indicadores biológicos abarcan diferentes componentes de las comunidades que viven en los ecosistemas de agua dulce: peces, macroinvertebrados, flora acuática, incluido el fitoplancton, el fitobentos y los macrófitos. Hasta ahora se ha prestado poca atención a los procariotas1,2,3, con la excepción de la evaluación de la calidad del agua relacionada con la salud, como la del agua para bañarse o beber4,5,6,7.

Los procariotas, debido a su pequeño tamaño y su alta relación superficie-volumen, son extremadamente sensibles a los cambios ambientales, incluidas variaciones en nutrientes o contaminantes, incluso en concentraciones muy bajas8. Esta capacidad los convierte en candidatos perfectos como bioindicadores y centinelas de alerta temprana, capaces de responder rápidamente a cualquier signo de estrés en el entorno9. Diferentes autores han enfatizado varias veces la necesidad de índices biológicos basados ​​en procariotas y se han propuesto múltiples enfoques para introducir estas comunidades en las redes actuales de biomonitoreo para ambientes marinos y de agua dulce10.

Fortunato et al.11 llevaron a cabo los primeros intentos de identificar taxones bacterianos adecuados como bioindicadores para la caracterización del estado biológico en el río Columbia y su estuario. Pudieron identificar múltiples taxones de comunidades de bacterioplancton específicos de diversas estaciones y tipos de hábitat. Aylagas et al.12 fueron un paso más allá y utilizaron un índice de estado biológico basado en macroinvertebrados bentónicos como base metodológica para desarrollar un índice comparable utilizando taxones bacterianos a partir de la secuenciación del amplicón de ARNr 16S. Los taxones bacterianos se dividieron en dos grupos ecológicos según su asociación positiva o negativa con aportes de contaminación tanto orgánicos como inorgánicos. El índice microgAMBI que desarrollaron se basa en la abundancia relativa de los taxones asociados con cada uno de los dos grupos ecológicos. Además, este estudio reveló una correlación significativa entre el índice bacteriano recientemente desarrollado y el método de clasificación tradicional basado en macroinvertebrados, mostrando un mejor desempeño del primero en algunos casos. Esto enfatizó que las bacterias y el estado ecológico pueden estar vinculados y que los índices basados ​​en bacterias pueden ser sustitutos válidos para la evaluación del impacto ambiental y la clasificación de la calidad del agua en las zonas costeras.

En un estudio reciente, Cordier et al.10 propusieron combinar la genómica ambiental y herramientas de aprendizaje automático para desarrollar rutinas confiables de evaluación del estado de la calidad ecológica. Sugirieron utilizar algoritmos de aprendizaje automático supervisados, que requieren una variable discreta (como las que ya se utilizan para el estado de calidad ecológica) derivada de valores continuos de indicadores biológicos obtenidos mediante la identificación de taxones morfológicos. El aprendizaje de árboles de decisión evita el problema de la caja negra asociado con otros algoritmos, ya que permite inspeccionar árboles individuales de modelos y así comprender la dinámica de los taxones relevantes. Al evaluar el metacódigo de barras y la identificación de taxones morfológicos al mismo tiempo, se podría construir un modelo de biomonitoreo predictivo entrenándolo en conjuntos de datos con una clasificación de estado ecológico conocida. En primer lugar, un enfoque de este tipo podría superar varios problemas relacionados con la falta de un marco taxonómico y la necesidad de bases de datos taxonómicos detallados. El modelo resuelve estos problemas durante la fase de entrenamiento, ya que el papel ecológico de los taxones (por ejemplo, unidades taxonómicas operativas o variantes de secuencia de amplicones) y su asociación con toda la comunidad se separan automáticamente del ruido de fondo10. En segundo lugar, los administradores pueden interpretar fácilmente los datos genómicos sin las discrepancias típicamente asociadas con la morfotaxonomía. Por lo tanto, la recopilación y el procesamiento de datos podrían automatizarse completamente. En tercer lugar, este enfoque molecular también es rentable y podría ampliarse en el tiempo y el espacio para programas de biomonitoreo consistentes en todos los países y años.

En nuestro trabajo, integramos estos enfoques utilizando algoritmos de aprendizaje de árboles de decisión para detectar posibles bioindicadores bacterianos entre la comunidad planctónica del río Danubio desde su nacimiento hasta su desembocadura. Aquí buscamos establecer un método para identificar bioindicadores bacterianos confiables para la caracterización y predicción de patrones ecológicos como el estado ecológico y la calidad del agua del río Danubio. Nuestra hipótesis es que la movilidad de los organismos dentro del río hace que la composición de la comunidad aguas arriba sea informativa para los resultados ecológicos aguas abajo, como el estado ecológico del índice saprobio y la concentración de clorofila a. Además, aplicamos estadísticas multivariadas para detectar bioindicadores adecuados basados ​​en la prevalencia y variación de taxones procarióticos asociados con factores ambientales, como un enfoque instantáneo que no tiene en cuenta la dependencia espacial de los sitios. Finalmente, comparamos los resultados de los enfoques instantáneos y espacio-temporales para evaluar la eficiencia y transferibilidad de los bioindicadores bacterianos para la evaluación del estado biológico del ecosistema fluvial como parte de los esfuerzos de conservación y restauración.

Los resultados del análisis de prevalencia/varianza de los datos de abundancia relativa de la variante de secuencia de amplicones (ASV) revelaron que los seis filos más relevantes fueron, en este orden, Actinobacteriota, Bacteroidota, Verrucomicrobiota, Proteobacteria, Cyanobacteria y Planctomycetota (Fig. 1). Actinobacteriota, por ejemplo, aumentó significativamente su abundancia relativa localmente en las partes bajas del río. El dbRDA reveló una relación positiva entre el aumento de la contribución de Actinobacteriota y la disminución de los valores de pH y temperatura del agua que caracterizan los tramos de los ríos más cercanos a la desembocadura. Por otro lado, Bacteroidota tuvo un mayor aporte en las cabeceras lo que parece estar correlacionado con mayores cargas de nitrógeno, valores de pH y conductividad. Otros filos que también muestran altas variaciones, como Verrucomicrobiota y Proteobacteria, exhibieron estrechas asociaciones con parámetros ambientales como la concentración de clorofila a, el pH alto y la distancia a la desembocadura del río, lo que a su vez estaba relacionado con el aumento de las cargas de nutrientes hacia los sitios río arriba.

a Dinámica de los filos entre todos los sitios de muestreo. Las muestras se organizan de izquierda (aguas arriba) a derecha (aguas abajo), a medida que aumenta la distancia desde la fuente. b Filos bacterianos con la mayor prevalencia entre los sitios de muestreo y la mayor variación; Los seis puntos de colores son los taxones más adecuados como indicadores biológicos (resaltados en las elipses) dada su amplia presencia y amplia variación en diferentes entornos. c La RDA muestra las relaciones de cada uno de los 6 filos identificados con los impulsores ambientales. Esto proporciona la base para vincular la dinámica de los filos individuales con las propiedades ambientales; es decir, Actinobacteria contribuye más a la comunidad en la desembocadura del río, mientras que Bacteriodota en la fuente y Verrucomicrobia aumentan en abundancia relativa con las concentraciones de clorofila-a. En las figuras complementarias se presentan análisis similares sobre clases y familias de bacterias. 4 y 5.

En consecuencia, también podrían identificarse taxones con potencial indicador para la evaluación del estado biológico en niveles taxonómicos inferiores (es decir, nivel de clase, familia y género). A nivel de género (Fig. 2), los seis principales bioindicadores candidatos fueron: hgcI_clade, grupo marino CL500-29, Flavobacterium, Limnohabitans, Candidatus_Methylopumilus y Sediminibacterium. Estos resultados de dbRDA enfatizan que una diferenciación de la estructura de la comunidad bacteriana puede estar relacionada con la sucesión de hábitats a lo largo del sistema fluvial utilizando una resolución taxonómica alta (filo) a baja (género).

a Dinámica de los géneros entre todos los sitios de muestreo. Las muestras se organizan de izquierda (aguas arriba) a derecha (aguas abajo), a medida que aumenta la distancia desde la fuente. b Géneros bacterianos con mayor prevalencia entre los sitios de muestreo y mayor variación; Los 15 puntos de colores son los taxones más adecuados como indicadores biológicos (resaltados en las elipses) dada su amplia presencia y amplia variación en diferentes entornos. c La RDA muestra las relaciones de cada uno de los 15 géneros identificados con los impulsores ambientales. Esto proporciona la base para vincular la dinámica de géneros individuales con las propiedades ambientales; es decir, Canditatus Methylopumilus contribuye más a la comunidad en la desembocadura del río, mientras que Limnohabitans en la fuente y Flavobacterium spp. aumento de la abundancia relativa con el pH. En las figuras complementarias se presentan análisis similares sobre clases y familias de bacterias. 4 y 5.

Para investigar la no linealidad y la idoneidad de la diversidad beta bacteriana para la clasificación, realizamos modelos utilizando un aumento de gradiente extremo (XGboost). El modelo para la composición de la comunidad bacteriana por pares de las diferencias de Bray-Curtis a lo largo del gradiente de clorofila a mostró patrones no lineales claros (Fig. 3) con un valor de R cuadrado de 0,32. Identificamos umbrales en los que la composición de la comunidad cambió más ampliamente que el promedio, en concentraciones de clorofila a de, por ejemplo, 1, 2,5 y 5,5 mg/l.

La escala de colores representa los valores de disimilitud de Bray-Curtis calculados entre sitios. Los ejes representan la concentración de clorofila a (mg L-1) en cada sitio. En (a), los patrones de diversidad beta observados se presentan a lo largo del gradiente de clorofila a, como se modela utilizando XGboost. En (b), se representa una relación hipotética donde la disimilitud entre comunidades aumenta linealmente en función de la diferencia en clorofila a entre sitios. El valor medio de la superficie de respuesta en (a) se puede tratar como la diversidad beta de referencia en todos los sitios. Los puntos de datos con valores por debajo de la media representan una mayor similitud entre sitios; Asimismo, los valores más altos representan una menor similitud. Para interpretar las superficies de respuesta de los valores observados, se puede comenzar mirando un punto que bordea la diagonal y luego seguir una línea de puntos más arriba en el eje de la clorofila a. Aquí, una cresta indica que la concentración de clorofila a es un umbral probable a partir del cual el cambio en la composición de la comunidad bacteriana es mayor que el promedio. De la misma manera, un valle indica una concentración de clorofila a probablemente ubicada en un intervalo del gradiente de clorofila a a lo largo del cual las comunidades bacterianas no cambian sustancialmente. En Fontaine et al.57 se ofrecen más detalles sobre el enfoque XGboost y su interpretación.

El enfoque espacio-temporal identificó varias combinaciones de ASV como buenos predictores tanto para la clasificación de la calidad del agua (según el índice saprobio) como para la concentración de clorofila a. Centramos el análisis de la red en los ASV más informativos según lo definido por un umbral del percentil 95 en términos de aparición en los resultados del modelo predictivo. Como se muestra en la Fig. 4, estos ASV formaron una red de coexclusión conectada. Aunque algunos de los ASV parecían ser mejores predictores que otros, ninguno resultó indispensable para obtener las predicciones más precisas. Los ASV que se consideren los mejores predictores podrían ensamblarse en combinaciones de dos o tres ASV para obtener la mayor precisión posible. Los modelos predictivos más simples que produjeron una precisión perfecta se obtuvieron con un representante de Fluviicola emparejado con un Acinetobacter o un Flavobacterium. Rhodoluna (clase Actinobacteriia) y Flavobacterium (clase Bacteroidia) fueron identificados como los taxones más importantes, por frecuencia de aparición, en términos de contenido de información para la predicción del estado biológico. Los otros seis de los 8 ASV más informativos pertenecían al grupo marino CL500-29 (clase Acidimicrobiia), Alterythrobacter (clase Alphaproteobacteria), al grupo acuático MWH-UniP1 (clase Gammaproteobacteria) y dos pertenecían a Acinetobacter (clase Gammaproteobacteria).

Los colores representan las respectivas clases de bacterias a las que pertenecen los ASV. En una red de coocurrencia, el diámetro del nodo representa el número de ocurrencias de cada taxón en los mejores modelos, mientras que el grosor de las líneas de conexión representa el número de coocurrencias de pares de ASV. b Red de coexclusión. Los enlaces representan taxones que nunca aparecieron juntos en un mismo modelo.

Se encontró que un total de 168 ASV en varias combinaciones produjeron modelos perfectamente precisos para la clasificación del estado biológico, mientras que 25 estaban presentes en el mejor modelo para la clorofila a. La mayoría de los ASV pertenecían al filo de Proteobacteria, siendo las clases de Gammaproteobacteria y Alphaproteobacteria las más abundantes. Las bacterias afiliadas a la clase Bacteroidia fueron la segunda clase más relevante por el número de ASV identificados como buenos predictores, seguidas por la clase Actinobacteria. Como se destaca en la Fig. 5, 20 ASV afiliados a cuatro clases de bacterias produjeron predicciones precisas tanto para la clasificación del estado biológico como para la eutrofización, y la mayoría de ellos afiliados a la clase de Gammaproteobacteria. Uno de ellos, un representante de Acinetobacter, también figura entre los principales predictores sugeridos por el análisis de la red. La clase Bacteroidia fue la segunda clase más importante en términos del número de ASV que son buenos predictores tanto para la clasificación del estado biológico como para la concentración de clorofila a, seguida por Verrucomicrobiae y solo un ASV perteneciente a la clase Bacilli. Se identificaron cinco ASV pertenecientes a Actinobacteria como buenos predictores sólo de la concentración de clorofila a.

Los colores representan clases de bacterias, mientras que los símbolos representan la variable para la cual se identificó un ASV como predictor. La posición horizontal de los nodos en el dendrograma indica en qué nivel taxonómico se encuentran, marcados con líneas de puntos desde el reino hasta el género. El histograma representa la frecuencia relativa de aparición de cada ASV en los resultados del modelo.

La precisión predictiva de los modelos fue desigual entre los diferentes transectos del río para la clorofila a. Mientras que los modelos solo para el transecto central arrojaron un R cuadrado de 0,98, el R cuadrado global para los tres transectos fue 0,86. En contraste, la precisión de los mejores modelos predictivos para la clasificación de la calidad del agua fue siempre del 100% para los tres transectos (observaciones izquierda, derecha y central).

Este estudio destaca el potencial de la identificación de bioindicadores bacterianos para evaluar el estado biológico de los ecosistemas fluviales a partir de datos de metabarcodes bacterianos, a pesar de limitaciones metodológicas como variaciones en el número de copias13, sesgos de PCR14, el carácter compositivo de los datos de secuenciación15 y otras limitaciones16. Tanto el enfoque de prevalencia/varianza como el espacio-temporal utilizados en este estudio arrojaron resultados comparables en términos de bioindicadores bacterianos candidatos, lo que demuestra que los taxones bacterianos dominantes pueden ser ecológicamente informativos. Como tal, ambos enfoques podrían complementar y ampliar los métodos basados ​​en la morfología actualmente implementados para producir evaluaciones de la calidad ecológica, pero de una manera más rápida y rentable. El enfoque espacio-temporal es un sistema de clasificación de enfoque totalmente basado en datos y puede actualizarse de forma iterativa, lo que puede desbloquear el potencial disruptivo de los metacódigos de barras y el aprendizaje automático para el biomonitoreo. Las muestras del monitoreo de rutina pueden complementar en tiempo real los datos de entrenamiento y mejorar aún más las predicciones del modelo y, a largo plazo, cubrir la mayor parte del espacio de condiciones ambientales posible.

Las posibles mejoras futuras de nuestro enfoque incluyen la interpretabilidad humana y la facilitación de la comprensión de los modelos entrenados. Esto es crucial para una transición fluida hacia enfoques de aprendizaje automático para problemas complejos de toma de decisiones17. Actualmente existen múltiples herramientas disponibles que permiten explicar las predicciones, identificando las características de los datos que contribuyen a una predicción determinada18. Estos enfoques permitirán además a los biólogos y ecólogos evaluar y controlar el desarrollo de modelos, sin caer en las advertencias del aprendizaje automático10.

Al utilizar el enfoque espacio-temporal, se puede lograr un modelado preciso del estado biológico y la concentración de clorofila a basándose únicamente en pequeños conjuntos de ASV, siempre que tengan un alto poder predictivo y sean complementarios en términos de contenido de información. El hecho de que el modelado preciso del estado biológico pueda basarse en tan solo 2 o 3 ASV abre oportunidades para diversos enfoques para la identificación de bioindicadores. Estos incluyen sistemas de identificación in situ que utilizan biosensores, como sensores ecogenómicos o pequeños dispositivos de laboratorio de microfluidos en chips que podrían apuntar a bioindicadores identificados para la clasificación del estado ecológico general. Los dispositivos de detección en tiempo real y en los puntos de atención podrían desbloquear el potencial real de los microbios en las redes actuales de biomonitoreo y pronóstico de la biodiversidad, como ya se ha visto en el pronóstico del tiempo.

El análisis de prevalencia/varianza a nivel de clase y género reveló que varios taxones afiliados al filo dominante de Actinobacteriota son los más informativos sobre los cambios en las propiedades ambientales. El filo Actinobacteriota abarca taxones que normalmente se encuentran en varios ambientes de agua dulce19 y desempeña un papel central en los procesos biogeoquímicos heterotróficos dentro de los ecosistemas fluviales20. Parecen estar fuertemente influenciados por el pH y las concentraciones de nutrientes, que a menudo afectan negativamente su abundancia debido a sus bajas tasas de crecimiento19,21,22,23 y los resultados de nuestro análisis confirman sus preferencias ambientales. Su mayor abundancia en los tramos inferiores del río Danubio puede estar relacionada con las menores concentraciones de nutrientes y contenido de materia orgánica como resultado de los efectos de la dilución, mientras que su menor abundancia en los tramos superiores del río podría deberse a la asociación negativa entre las partículas en suspensión y este taxón11,24,25.

Al centrarse en los ejes de visualización de la RDA (Figs. 1 y 2), los Bacteroidota se oponían a esta tendencia y estaban más relacionados con los tramos superiores del río con mayores aportes de nutrientes, conductividad y una fuerte dependencia de los bosques cercanos y las fuentes de agua subterránea26. Flavobacterium (clase Bacteroidia) fue el tercer género importante que se destacó en el análisis de prevalencia/varianza con las mayores abundancias en los tramos de los ríos aguas arriba, mostrando así una preferencia por ambientes más eutróficos. El patrón de abundancia de este filo probablemente esté relacionado con los aportes predominantes de materia orgánica recalcitrante de la zona ribereña y los bosques. Según la literatura, la comunidad microbiana de la cabecera probablemente tenga su principal fuente en el suelo y las comunidades de aguas subterráneas que se dirigen hacia los tramos superiores del río Danubio26,27. Ya se ha demostrado anteriormente que los Bacteroidota son buenos indicadores de la contaminación antropogénica y los impactos de la agricultura en los ecosistemas de agua dulce28. La qPCR en tiempo real se utiliza generalmente para identificar marcadores genéticos relacionados con este taxón dentro de los sistemas fluviales impactados por los efluentes de las plantas de tratamiento de aguas residuales y en los sistemas de acuicultura, lo que demuestra que Bacteroidota es confiable para determinar el grado de contaminación29,30,31,32,33. En nuestro estudio, los taxones pertenecientes a la clase Bacteroidota estaban claramente relacionados con el estado biológico del Danubio, lo que confirma aún más su posible relevancia para el biomonitoreo en los ecosistemas fluviales.

Las proteobacterias fueron otro grupo destacado como bioindicadores mediante el análisis de varianza/prevalencia, con el género Limnohabitans, un representante de la clase Gammaproteobacteria, identificado como indicador de condiciones eutróficas. Otros miembros de la clase de gammaproteobacterias, como E. coli, son indicadores importantes y sensibles de la contaminación fecal en ecosistemas acuáticos y recursos hídricos. Su número se encuesta tradicionalmente mediante métodos de enumeración estandarizados basados ​​en la cultura5,34. Curiosamente, las cianobacterias tenían abundancias relativamente bajas en las secciones de los ríos caracterizadas por una mayor concentración de clorofila a. Este patrón puede parecer contradictorio, pero lo más probable es que esté relacionado con la abundancia de algas verdes y diatomeas en la comunidad de fitoplancton, que tuvieron un mayor impacto en las concentraciones de clorofila a en comparación con sus contrapartes bacterianas35.

De ambos enfoques implementados en este estudio, parece que los ASV que pertenecen a los taxones dominantes en la comunidad bacteriana, como Actinobacteriota, con el género Rhodoluna en particular, Bacteroidota, en particular con el género Flavobacterium, así como Proteobacteria, también se encuentran entre los mejores indicadores de cambios. en el estado biológico de la calidad del agua en el río Danubio. Este hallazgo se alinea con los resultados de Fortunato et al.11, donde entre las comunidades microbianas de tres ambientes diferentes que abarcan un gradiente de salinidad, los mejores indicadores de cambios en los impulsores ambientales se encontraban entre los taxones más abundantes.

Aunque el enfoque espacio-temporal identificó múltiples combinaciones de ASV que arrojaban predicciones precisas, muchos ASV que aparecían con frecuencia nunca ocurrieron juntos en ningún modelo determinado. Se puede suponer que estos ASV no coexisten en los modelos porque contienen contenido de información redundante. La red de coexclusión (Fig. 4) permite la identificación de redundancias en el contenido de la información entre los ASV más informativos. Estos resultados de los análisis de la red sugieren que no existen taxones bacterianos verdaderamente mejores ni indispensables que proporcionen información sobre el estado biológico y la concentración de clorofila a. Más bien, se requiere una cierta cantidad de información para obtener modelos precisos que se comparte entre múltiples taxones con diversos grados de superposición.

Si bien en este estudio no se dispuso de información funcional sobre las comunidades bacterianas, es concebible que la función ecológica y el contenido de la información estén vinculados. Los ASV redundantes deberían ser taxones que ocupen nichos ecológicos similares, aunque sin experimentar exclusión competitiva. Es probable que la redundancia, y como tal la superposición en el contenido de la información ecológica, aumente con la relación filogenética entre los taxones, como lo visualiza un mayor número de conexiones entre taxones estrechamente relacionados en la red de coexclusión. Entre los mejores predictores, los representantes de las mismas clases mostraron relaciones de redundancia más altas en comparación con los taxones que pertenecen a diferentes filos (Fig. 5). Esto se ha demostrado en un estudio previo en el que la coherencia funcional entre taxones estrechamente relacionados oscilaba entre niveles taxonómicos bajos (especies) y altos (filos)36. Al mismo tiempo, las bacterias pueden pertenecer a diferentes grupos ecológicos y al mismo tiempo ser taxonómicamente distintas al nivel de un solo nucleótido en una etiqueta de ARNr 16S37.

La coherencia funcional puede verse oscurecida dentro de los conjuntos de datos taxonómicos por la degeneración genética y la transferencia horizontal de genes. Sin embargo, los estudios que compararon los resultados de las bioevaluaciones de diferentes niveles taxonómicos mostraron que algunos taxones superiores (en particular el nivel de género) podrían ser relativamente precisos y eficientes en comparación con el nivel de especie en los eucariotas38,39. Otros enfatizaron la ventaja de los niveles taxonómicos mixtos para adaptar el detalle taxonómico al contenido de la información para cada clado40. Los ASV redundantes que pertenecen al mismo nivel taxonómico alto identificado en nuestro estudio confirman el potencial de un alto contenido de información en niveles taxonómicos altos. Además, estos grupos taxonómicos pueden contener bioindicadores de alto contenido de información en una amplia gama de sistemas fluviales, aunque no estén presentes exactamente los mismos ASV identificados en nuestro estudio.

Para identificar la verdadera naturaleza de la señal detrás de la redundancia de información entre taxones, se puede argumentar que se debe obtener toda la información genómica de las comunidades microbianas. Este caso ideal de tener acceso a información genómica completa permitiría identificar rasgos funcionales compartidos y, de manera más general, dividir todo el contenido de la información en componentes discretos. Si bien esto último actualmente no es realista, se puede comenzar la búsqueda de bioindicadores ideales con la hipótesis de que los grupos de genes ortólogos deberían ser superiores a los ASV de ARNr 16S. Sin embargo, es posible que los genes funcionales por sí solos no necesariamente resulten ser una unidad de información ecológica, ya que pueden estar degenerados o formar parte de vías metabólicas incompletas.

La dinámica comunitaria mostrada en nuestro estudio confirma los hallazgos de estudios previos de bacterioplancton en otros ecosistemas fluviales41,42,43 así como en el propio río Danubio26. Parece que incluso en diferentes ecosistemas fluviales de todo el mundo, la sucesión del bacterioplancton sigue trayectorias similares, siendo las comunidades aguas arriba y aguas abajo bastante diferentes y estrictamente relacionadas con el tiempo de residencia en el agua43. Como plantearon la hipótesis de Read et al.43, los tramos de los ríos aguas arriba podrían caracterizarse por taxones bacterianos de rápido crecimiento, estrategas r capaces de procesar los recursos; estos serían los Bacteroidota. Mientras que por otro lado, cuando el río se hace más grande, la influencia de la zona ribereña es menor y la disponibilidad de nutrientes se reduce debido al efecto de dilución y la reducción de la biodisponibilidad de las fuentes de carbono recalcitrantes; Prevalecerían los organismos k-estrategas como Actinobacteriota. Este patrón recurrente de sucesión microbiana sugiere que el modelado predictivo espacio-temporal para todos los tipos de evaluación del estado biológico y ecológico es aplicable a los ecosistemas fluviales que comparten una composición de bacterioplancton similar.

El ensamblaje de comunidades microbianas a través de gradientes puede seguir patrones de relación que van desde ampliamente lineales hasta claramente no lineales. Por lo tanto, plantea la cuestión de la naturaleza de tales relaciones en este estudio y cómo modelarlas de una manera que sea coherente con los patrones naturales. Cuando las relaciones son de tipo lineal, se debe modelar una variable de respuesta continua, ya que evita la pérdida innecesaria de información al discretizar un gradiente en clases. Asimismo, una marcada no linealidad es un terreno fértil para un enfoque de clasificación.

En nuestro estudio, la aparición de tasas de cambio abruptas y por debajo del promedio en la composición de la comunidad microbiana a lo largo del gradiente de clorofila a indica que las comunidades bacterianas tienden a ser algo homogéneas a lo largo de ciertas secciones del río a lo largo de la ruta del flujo y cambian notablemente más allá de umbrales específicos. Por ejemplo, el último cambio claro ocurre entre 5 y 6 mg de clorofila por litro, después de lo cual la tasa de cambio de la comunidad bacteriana permanece aproximadamente por debajo del promedio hasta el final del gradiente (Fig. 3). Las concentraciones de 6 mg de clorofila a/ly superiores pueden considerarse como el rango natural correspondiente a las aguas eutróficas. La relación no lineal entre la composición de la comunidad de bacterioplancton a lo largo del gradiente de clorofila a respalda un enfoque de clasificación biológica general, aunque deja sin respuesta cuántas clases naturales posee esta última y si las clases del índice saprobio de referencia se superponen con las naturales.

El análisis de umbral trató las observaciones como independientes, mientras que están vinculadas en el espacio y el tiempo, lo que significa que pueden ocurrir discrepancias en el tiempo de reacción de la asamblea comunitaria entre los productores primarios y el resto de la comunidad microbiana a medida que las masas de agua viajan y las condiciones cambian más rápido de lo que se puede alcanzar el equilibrio. En caso de fusión de afluentes, las masas de agua pueden fluir inicialmente una al lado de la otra y mezclarse completamente sólo después de muchos kilómetros44. Nuestros resultados del enfoque espacio-temporal con respecto a la clorofila apuntan en esta dirección. Esta dualidad laminar versus mezcla se refleja en una mayor precisión del modelo para el transecto intermedio y debe considerarse al crear matrices de diseño. Por lo tanto, las observaciones de izquierda, derecha y mitad de la corriente deben tratarse como series espaciales separadas en términos de orden de observación. Sin embargo, la precisión general es mayor cuando se integran distintas series temporales en un modelo en lugar de procesarlas por separado. Para lograr precisiones para los transectos izquierdo y derecho que sean comparables a las de la mitad de la corriente, es concebible que los valores utilizados para los pasos de retraso y la escala en los lugares de unión de los afluentes tengan que provenir de sitios aguas arriba del afluente mismo en lugar del río principal.

Para verificar si los indicadores bacterianos son sólidos para la predicción del estado biológico, sería necesario probar si los clados subyacentes a determinados procesos ecológicos en un sistema fluvial se aplican de la misma manera a otros ríos y a lo largo de las estaciones. Para descubrir la idoneidad de los ASV candidatos destacados en este estudio, así como la aplicabilidad general de los métodos de detección de ASV espacio-temporales y basados ​​en la varianza, se requieren datos de capacitación extensos de múltiples sistemas fluviales para desarrollar sistemas de clasificación generales y sólidos para la evaluación ambiental. basado en datos bacterianos. También es necesario armonizar los protocolos de muestreo, la preparación de bibliotecas de ADN, la generación de datos de secuencias y el procesamiento bioinformático posterior para lograr una evaluación reproducible del estado biológico en todos los sistemas fluviales.

El río Danubio se extiende a lo largo de 2780 km, desde su nacimiento en la Selva Negra en Alemania, desde donde atraviesa diez países diferentes (Alemania, Austria, Eslovaquia, Hungría, Croacia, Serbia, Bulgaria, Rumanía, Moldavia y Ucrania), finalizando su curso en un delta en el Mar Negro. Su cuenca hidrográfica cubre 801.500 km2 y está poblada por casi 81 millones de habitantes45. El agua del río Danubio sirve a las industrias, la agricultura y a las personas como suministro de agua potable y área recreativa, así como una ruta de transporte que conecta varios países30.

Cada seis años desde 2001, la Comisión Internacional para la Protección del Río Danubio (ICPDR)30,45,46 organiza el Estudio Conjunto del Danubio (JDS). Como un estudio extenso de 2600 km del río Danubio (Figura 1 complementaria), el JDS es una de las expediciones científicas internacionales más grandes, cuyo objetivo es recopilar datos sobre la hidromorfología del río, la dinámica de varias comunidades biológicas, el estado físico-químico del agua. parámetros, contaminantes y más.

Se recolectaron manualmente muestras de agua para la comunidad microbiana del epilimnion en matraces de 1 L, al mismo tiempo que también se midieron los parámetros físico-químicos del agua con sondas manuales. Los muestreos de macroinvertebrados se realizaron utilizando un enfoque de muestreo de hábitats múltiples47, donde se perturbaron diferentes partes del lecho del río y los macroinvertebrados se recolectaron con una red. Se tomaron muestras de los lados izquierdo y derecho del río, junto con su centro, en 60 lugares.

Todos los datos, métodos de muestreo y métodos analíticos están disponibles públicamente a través del sitio web oficial de la Comisión Internacional para la Protección del Río Danubio (ICPDR; http://www.icpdr.org/wq-db/) y el informe científico final48. Los datos seleccionados de JDS3 (2013) se publicaron previamente en varios estudios30,35.

La clasificación del estado ecológico de acuerdo con la Directiva Marco del Agua se realizó a partir de datos JDS3 recopilados para algunas de las comunidades biológicas analizadas a lo largo del río, entre las que se encuentran macroinvertebrados, macrófitos, peces y fitoplancton. Los diferentes países utilizan diferentes sistemas de clasificación biológica y la intercalibración de los diferentes métodos sigue siendo un desafío48. El índice saprobio, basado en comunidades de macroinvertebrados bentónicos, es uno de los sistemas de clasificación mejor establecidos para evaluar el estado biológico de conformidad con la DMA y se utiliza principalmente para evaluar la contaminación orgánica. Este fue el único sistema de clasificación utilizado de manera consistente en los distintos países a lo largo del río Danubio y, por lo tanto, se utilizó como sistema de clasificación biológica de referencia en nuestro estudio.

El ADN genómico se extrajo utilizando un protocolo ligeramente modificado de un procedimiento basado en fenol-cloroformo y batido de perlas49 utilizando isopropanol en lugar de polietilenglicol para la precipitación del ADN50. La concentración de ADN total se evaluó aplicando el kit de ensayo de ADNds Quant-iT™ PicoGreen® (Life Technologies Corporation, EE. UU.) y las concentraciones del gen 16S rRNA en los extractos de ADN se cuantificaron mediante PCR cuantitativa de dominio específico donde las reacciones contenían 2,5 μL de 1:4 y Extracto de ADN diluido 1:16 como plantilla, 0,2 μM de cebadores 8F y 338 dirigidos a la región V1-V2 de la mayoría de los genes bacterianos de ARNr 16S y iQ SYBR Green Supermix (Bio-Rad Laboratories, Hercules, EE. UU.)26. Los extractos de ADN se normalizaron con respecto a las concentraciones del gen 16S rRNA para utilizar números estandarizados de plantillas de genes bacterianos 16S rRNA para la amplificación y codificación de barras en un procedimiento de codificación de barras de dos pasos. En resumen, los cebadores del primer paso (341f y 805r) contenían adaptadores para introducir adaptadores Illumina y en el segundo paso se utilizaron códigos de barras duales. Los cebadores de PCR del primer paso fueron, por tanto, (secuencia del adaptador, seguida de la secuencia del cebador) adaptador-341f ('5 - ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNCCTACGGGNGGCWGCAG-3') y adaptador-805r ('5-AGACGTGTGCTCTTCCGATCTGACTACHVGGGTATCTAATCC-3'). La PCR del amplicón del primer paso (ampPCR) se llevó a cabo por duplicado en 20 µl de mezclas de reacción que contenían 1 x tampón de reacción Q5, trifosfatos de dinucleósidos (dNTP) 0,2 mM, 0,5 µmol L-1 de cebadores directos e inversos, 0,4 U de Q5 de alta fidelidad. ADN polimerasa (New England BioLabs), así como ADN ambiental como plantilla que se normalizó a cantidades iguales de copias del gen 16S rRNA antes de la codificación de barras para aumentar la comparabilidad y reducir el sesgo de la PCR. Las condiciones de ciclado para ampPCR del primer paso fueron 98 °C durante 1 min, seguido de 20 ciclos de 98 °C durante 10 s, 62 °C durante 30 s, 72 °C durante 30 s y una extensión final a 72 °C durante 2 minutos. Los productos duplicados se combinaron y purificaron utilizando el sistema de purificación Agencourt AMPure XP (Beckman Coulter). El segundo paso de la PCR contiene combinaciones variables de cebadores con diferentes identificadores multiplex para el 'código de barras' específico de la muestra (directo, AATGATACGGCGACCACCGAGATCTACAC-[índice]-ACACTCTTTCCCTACACGACG; inverso, CAAGCAGAAGACGGCATACGAGAT-[índice]-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT) que se une a los adaptadores del primer paso y La incorporación de adaptadores Illumina se llevó a cabo en reacciones individuales de 20 µL. Las reacciones contenían 1 × tampón de reacción Q5, 0,2 mmol L-1 de trifosfatos de dinucleósidos (dNTP), 0,25 µmol L-1 de cebadores de índice directo e inverso, 0,4 U de ADN polimerasa de alta fidelidad Q5 (New England BioLabs) y 2 µl de amplicones purificados. desde ampPCR del primer paso como plantilla. Las condiciones de ciclado para la PCR de índice de segundo paso (idxPCR) fueron 98 °C durante 1 min, seguido de 15 ciclos de 98 °C durante 10 s, 66 °C durante 30 s, 72 °C durante 30 s y una extensión final. a 72°C durante 2 min. Los productos de PCR (bibliotecas de amplicones) se purificaron como se describe anteriormente y se cuantificaron con el kit PicoGreen (Life Technologies). Los productos se secuenciaron en las instalaciones de secuenciación SciLifeLab SNP/SEQ de la Universidad de Uppsala, Uppsala, Suecia, en un Illumina MiSeq (2 × 300 pb) en dos ejecuciones.

Los datos de secuencia sin procesar de JDS3 de diferentes ejecuciones de secuenciación se procesaron por separado. Después de la demultiplexación automática de los datos de secuenciación de amplicones sin procesar mediante el software de secuenciación Illumina MiSeq en 675 muestras individuales (incluidos 66 pares técnicos y 329 pares de réplicas biológicas) de dos ejecuciones de secuenciación para JDS3, los cebadores se eliminaron utilizando la herramienta CUTADAPT51 y las secuencias sin cebadores coincidentes se descartaron. El paquete R dada2 (versión 1.8)52 se utilizó para la desreplicación, la eliminación de ruido y la concatenación de pares de secuencias. Después de la inspección manual de los gráficos de puntuación de calidad, las lecturas directas e inversas de los amplicones del gen bacteriano 16S rRNA se recortaron a 260 y 200 pb de longitud, respectivamente, y se eliminaron las lecturas con una puntuación única de phred inferior a 10. Después de la desreplicación de las lecturas, se crearon modelos de error directo e inverso utilizando un subconjunto de ~107 lecturas de secuencia. Las quimeras se eliminaron utilizando la función "removeBimeraDenovo" en "dada2". La taxonomía se asignó utilizando el clasificador bayesiano y la base de datos no redundante SILVA 13853,54. A continuación, se fusionaron y promediaron 329 pares de réplicas biológicas para el conjunto de datos JDS3 para obtener la tabla final de variantes de secuencia de amplicones (ASV). El conjunto de datos considerado para este estudio comprendió los transectos izquierdo, derecho y central del río Danubio, sumando un total de 160 muestras, después de excluir las muestras de los sitios tributarios. Se eliminaron ASV de cloroplastos, mitocondriales, eucariotas y arqueas utilizando el paquete phyloseq versión 1.40.0, lo que dio como resultado 3509 ASV bacterianos. Los detalles sobre los datos de muestra y secuencia se proporcionan en la Tabla complementaria 1.

El código utilizado para el procesamiento de datos de secuencia está disponible en github: https://github.com/alper1976/danube_indicators (https://doi.org/10.5281/zenodo.8193431)55.

Los análisis estadísticos y la generación de gráficos se realizaron en R versión 4.0.2 (2019-12-12; R Core Team, 2014). A partir de la tabla ASV, creamos cuatro conjuntos de datos, agrupando los ASV en niveles de filo, clase, familia y género. Para cada uno de los cuatro conjuntos de datos calculamos la prevalencia (frecuencia de aparición en cada sitio de muestreo) y el coeficiente de variación (desviación estándar de la abundancia del taxón dividida por la media)3. Estos dos parámetros se compararon entre sí en un diagrama de dispersión para detectar taxones con la variación más alta que ocurren con mayor frecuencia en todos los sitios de muestreo, ya que estos podrían representar indicadores biológicos adecuados.

Para identificar los impulsores ambientales detrás del ensamblaje de comunidades bacterianas, seleccionamos variables específicas entre los metadatos ("pH", "Conductividad eléctrica", "temperatura del agua", "Km del río/Distancia a la desembocadura", "Ntot", "Chl a", “DOC”, “Coliformes totales (LOG10(x + 1)”, “BacHum (LOG10(x + 1)”, “AllBac (LOG10(x + 1)”, “E.coli (LOG10(x + 1)” ) (Figura complementaria 2). Las observaciones faltantes se imputaron con la función de ratones del paquete R 'homónimo' (versión 3.13.0) y el paquete VIM (versión 6.2.2), utilizando el enfoque de imputación de coincidencia de medias predictivas56. Se investigaron la diversidad beta y la clorofila a para caracterizar el grado de linealidad a lo largo de este gradiente y buscar posibles umbrales asociados con cambios en la composición de la comunidad microbiana. El análisis se realizó utilizando las diferencias de Bray-Curtis en la composición de la comunidad bacteriana por pares a lo largo del gradiente de clorofila a según a Fontaine et al.57.

Al utilizar un modelo de selección paso adelante (versión vegana 2.6-2), seleccionamos las variables más relacionadas con la matriz de disimilitud de Bray-Curtis transformada por Hellinger para cada uno de los cuatro niveles taxonómicos bacterianos. El objetivo de la selección directa fue identificar parámetros ambientales que covarían con la composición de la comunidad. A continuación, se probó la multicolinealidad de las variables más informativas utilizando el valor del factor de inflación de varianza y el valor de tolerancia. Aquellas variables que mostraban un valor del factor de inflación de varianza superior a 5 fueron excluidas de análisis adicionales. Se realizó un análisis de redundancia basado en distancia (dbRDA) utilizando la matriz de Bray-Curtis transformada por Hellinger para cada uno de los cuatro niveles taxonómicos incluyendo solo los taxones más prevalentes y variables con los metadatos seleccionados anteriormente para identificar relaciones específicas entre filos, clases , familias o géneros con factores ambientales particulares.

Las variables relacionadas con el estado biológico (concentración de clorofila a como indicador de eutrofización y clasificación de saprobidad según el índice saprobio) para sitios aguas abajo se predijeron utilizando información de la composición de la comunidad bacteriana aguas arriba. La identificación de ASV informativos para la predicción del estado biológico se realizó en dos pasos principales. Al principio, creamos un modelo de bosque aleatorio no supervisado (randomForest versión 4.6–14) para obtener conocimientos sobre la estructura latente de los sitios basados ​​en ASV, con el fin de filtrar previamente la tabla ASV debido a que el siguiente paso de selección es computacionalmente exigente. Sin conocimiento de la verdadera estructura dentro de los datos, se realizó una optimización de búsqueda en cuadrícula de parámetros para el modelo de bosque aleatorio no supervisado en un modelo supervisado donde la variable de respuesta era la concentración de clorofila a y los datos explicativos eran la tabla de abundancia de ASV transformada por Hellinger. El error cuadrático medio más bajo de estos modelos de aprendizaje supervisado se obtuvo con una combinación de mtry=1600 y ntree=30 con una división del conjunto de datos de 0,8/0,2 para conjuntos de entrenamiento y prueba. Utilizando estos parámetros, el modelo de bosque aleatorio no supervisado se entrenó en la misma tabla de abundancia de ASV transformada por Hellinger. A partir del resultado del modelo no supervisado, se seleccionaron ASV candidatos para el análisis posterior en función de exceder un umbral de 0 en el aumento porcentual del error cuadrático medio (%IncMSE).

El segundo paso principal en el proceso de selección de ASV fue ejecutar, para cada ASV en orden decreciente de %IncMSE, una búsqueda en cuadrícula de la combinación óptima de pasos (es decir, número de sitios ascendentes) para usar para (i) transformación y (ii ) retraso en el uso de XGboost (implementación de aprendizaje de sci-kit de XGboost versión 1.3.3). En otras palabras, el objetivo de la búsqueda en cuadrícula es encontrar los dos marcos de desplazamiento óptimos de número de sitios para cada ASV utilizado para predecir las variables de respuesta. La transformación en este caso es escalar y centrar las abundancias de ASV, mientras que el retraso es el número de observaciones necesarias desde sitios aguas arriba para la predicción en un sitio aguas abajo determinado. El criterio para seleccionar las mejores combinaciones de valores de transformación y retraso fue el modelo R cuadrado en el conjunto de pruebas para clorofila a y el porcentaje de precisión para la clasificación del estado biológico. La matriz de diseño para la evaluación del ASV contiene inicialmente la identificación del muestreo, el código del transecto (izquierda, derecha y centro) y la distancia hasta la desembocadura del río. Estas variables de metadatos se incluyen para dar cuenta de la continuidad de cada transecto longitudinal en términos de dinámica de flujo laminar, así como el tiempo de viaje en el caso de la distancia a la desembocadura del río. Al generar un modelo R cuadrado mejorado, se agrega un ASV a la matriz de diseño en su combinación óptima de transformación y retraso. El proceso de selección de ASV se ejecutó 1000 veces, para ambas variables de calidad del agua, con orden de ASV aleatorio y combinaciones aleatorias de hiperparámetros XGboost. Sin embargo, para la clasificación basada en el Índice Saprobio, dos observaciones presentaron un estado biológico alto y aparecieron por primera vez a 550 km de la desembocadura del río (Figura complementaria 3), lo que supera el primer 80 % de las observaciones, por orden de distancia desde el río. Fuente del Danubio. Es imposible evaluar la precisión del modelo si el conjunto de prueba contiene clases de variables que no están presentes en el conjunto de entrenamiento. Por lo tanto, para incluir observaciones de todas las clases de variables en el conjunto de entrenamiento, la división de entrenamiento y prueba de los datos para los modelos XGboost (tanto para la concentración de clorofila a como para la clasificación del estado biológico) se estableció en 0,85 y 0,15 respectivamente, y la división se produjo después del primer 85% de las observaciones.

Los resultados del modelo para la detección del ASV para la clasificación biológica se filtraron para mantener solo aquellos que presentaban una precisión del 100 %. En el caso de la clorofila a, se mantuvo el modelo que arrojaba el R cuadrado más alto. Los resultados del modelo se convirtieron en una tabla de presencia/ausencia con modelos individuales como filas y ASV como columnas para la clasificación de la calidad del agua. Luego, la tabla resultante se usó para un análisis de red, realizado con la biblioteca R igraph (versión 1.2.4.2). Se utilizaron redes de coocurrencia y coexclusión para investigar el contenido de la información y la redundancia entre ASV. La redundancia de información entre taxones individuales, en el sentido de que el contenido de la información se traduce en poder predictivo del modelo, se interpretó aquí como ASV que nunca están presentes juntos en ningún resultado del proceso de selección individual. La lógica detrás de esta suposición es que los ASV son mutuamente excluyentes si contienen información predictiva compartida. Como el proceso de selección seleccionará el primer ASV de un conjunto que contenga una determinada porción de información, los siguientes de ese mismo conjunto quedarían fuera ya que no mejorarían el modelo.

A diferencia de la co-ocurrencia donde hay certeza sobre dicha relación, no se puede asumir lo mismo de la co-exclusión aquí encontrada, ya que podría resultar del número limitado de permutaciones aleatorias de ASV examinados juntos. Sin embargo, apareció una pequeña cantidad de ASV en la mayoría de los resultados del proceso de selección, lo que sugiere una apariencia de saturación en su muestreo y, por lo tanto, que sus relaciones de coexclusión son precisas. La selección de ASV mantenida para este análisis de coexclusión se fijó, por lo tanto, en el percentil 95 por número de ocurrencias. Luego se construyó un dendrograma con todos los ASV que arrojaron los mejores modelos de eutrofización y calidad del agua para visualizar la superposición taxonómica entre los predictores de ambas variables. La agrupación jerárquica se realizó en una matriz de distancias calculada a partir de la tabla de taxonomía.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Los datos de la ICPDR que se utilizaron en este manuscrito se pueden encontrar en GitHub: https://github.com/alper1976/danube_indicators (https://doi.org/10.5072/zenodo.1222217)55. Todos los datos de secuenciación están disponibles en NCBI Sequence Read Archive con el número de acceso PRJNA835446. Se pueden obtener datos adicionales previa solicitud a la ICPDR. Los datos fuente detrás de los histogramas en las Figs. 1, 2 y 5 están disponibles en los Datos complementarios 1 a 3, respectivamente.

El código utilizado para secuenciar el procesamiento de datos, el modelado, el análisis estadístico y detalles adicionales sobre los enfoques están disponibles en GitHub: https://github.com/alper1976/danube_indicators (https://doi.org/10.5281/zenodo.8193431)55.

Heiskanen, AS et al. Biodiversidad en los ecosistemas marinos: avances europeos hacia evaluaciones sólidas. Frente. Marzo ciencia. 3, 184 (2016).

Artículo de Google Scholar

Cordier, T. y col. El aprendizaje automático supervisado supera al metabarcode de ADN ambiental basado en taxonomía aplicado al biomonitoreo. Mol. Ecológico. Recurso. 18, 1381-1391 (2018).

Artículo CAS PubMed Google Scholar

Pin, L., Eiler, A., Fazi, S. y Friberg, N. Dos enfoques diferentes de caracterización de la estructura de la comunidad microbiana en biopelículas epilíticas fluviales en condiciones de múltiples factores estresantes: desarrollo de indicadores moleculares. Mol. Ecológico. Recurso. 22, 1200-1215 (2021).

Artículo de Google Scholar

Mansilha, CR et al. Aguas de baño: nueva directiva, nuevas normas, nuevo enfoque de calidad. Mar. Contaminación. Toro. 58, 1562-1565 (2009).

Artículo CAS PubMed Google Scholar

Figueras, MJ & Borrego, JJ Nuevas perspectivas en el monitoreo de la calidad microbiana del agua potable. En t. J. Medio Ambiente. Res. Salud pública 7, 4179–4202 (2010).

Artículo PubMed PubMed Central Google Scholar

Oliver, DM y cols. Oportunidades y limitaciones de los métodos moleculares para cuantificar los parámetros de cumplimiento microbiano en aguas de baño de la UE. Reinar. En t. 64, 124-128 (2014).

Artículo CAS PubMed Google Scholar

Wen, X. y col. Indicadores microbianos y su uso para monitorear la calidad del agua potable: una revisión. Sostenibilidad 2, 2249 (2020).

Artículo de Google Scholar

Martínez-Santos, M. et al. Los efluentes de aguas residuales tratados y no tratados alteran las comunidades bacterianas de los sedimentos fluviales involucradas en el ciclo del nitrógeno y el azufre. Ciencia. Medio ambiente total. 633, 1051–1061 (2018).

Artículo PubMed Google Scholar

Bloem, J. & Breure, AM en Traza de metales y otros contaminantes en el medio ambiente Cap. 8 (Elsevier, 2007).

Cordier, T., Lanzén, A., Apothéloz-Perret-Gentil, L., Stoeck, T. & Pawlowski, J. Adoptar la genómica ambiental y el aprendizaje automático para el biomonitoreo de rutina. Tendencias Microbiol. 27, 387–397 (2019).

Artículo CAS PubMed Google Scholar

Fortunato, CS et al. Determinación de taxones indicadores a través de gradientes espaciales y estacionales en el margen costero del río Columbia. ISME J. 7, 1899-1911 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Aylagas, E. et al. Un índice basado en comunidades bacterianas para evaluar el estado ecológico de los ambientes estuarinos y costeros. Mar. Contaminación. Toro. 114, 679–688 (2017).

Artículo CAS PubMed Google Scholar

Louca, S., Doebeli, M. y Parfrey, LW La corrección del número de copias del gen 16S rRNA en estudios de microbioma sigue siendo un problema sin resolver. Microbioma 6, 41 (2018).

Artículo PubMed PubMed Central Google Scholar

Krehenwinkel, H. y col. Estimación y mitigación del sesgo de amplificación en metabarcodes de artrópodos cualitativos y cuantitativos. Ciencia. Rep. 7, 17668 (2017).

Artículo PubMed PubMed Central Google Scholar

Gloor, GB, Macklaim, JM, Pawlowsky-Glahn, V. & Egozcue, JJ Los conjuntos de datos de microbiomas son compositivos: y esto no es opcional. Frente. Microbiol. 8, 2224 (2017).

Artículo PubMed PubMed Central Google Scholar

Poretsky, R., Rodriguez-R, LM, Luo, C., Tsementzi, D. y Konstantinidis, KT Fortalezas y limitaciones de la secuenciación del amplicón del gen 16S rRNA para revelar la dinámica temporal de la comunidad microbiana. MÁS UNO 9, e93827 (2014).

Artículo PubMed PubMed Central Google Scholar

Miotto, R., Wang, F., Wang, S., Jiang, X. y Dudley, JT Aprendizaje profundo para la atención médica: revisión, oportunidades y desafíos. Breve. Bioinformar. 19, 1236-1246 (2018).

Artículo PubMed Google Scholar

Ribeiro, MT, Singh, S. & Guestrin, C. “¿Por qué debería confiar en ti?”: explicando las predicciones de cualquier clasificador. Actas de la Conferencia de 2016 del Capítulo Norteamericano de la Asociación de Lingüística Computacional: Demostraciones, 1135-1144. https://doi.org/10.18653/v1/N16-3020 (2016).

Newton, RJ, Jones, SE, Eiler, A., McMahon, KD y Bertilsson, S. Una guía de la historia natural de las bacterias de los lagos de agua dulce. Microbiol. Mol. Biol. Rev. P. 75, 14–49 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Zhang, B. y col. Variación en la composición de la comunidad actinobacteriana y su función potencial en diferentes ecosistemas del suelo pertenecientes a la árida cuenca del río Heihe en el noroeste de China. Frente. Microbiol. 10, 2209 (2019).

Artículo PubMed PubMed Central Google Scholar

Fierer, N. & Jackson, RB La diversidad y biogeografía de las comunidades bacterianas del suelo. Proc. Acad. Nacional. Ciencia. Estados Unidos 103, 626–631 (2006).

Artículo CAS PubMed PubMed Central Google Scholar

Haukka, K. y col. Efecto de la carga de nutrientes sobre la composición de la comunidad de bacterioplancton en mesocosmos lacustres. Microbio. Ecológico. 51, 137-146 (2006).

Artículo PubMed Google Scholar

Šimek, K. et al. Tasas máximas de crecimiento y posibles estrategias de vida de diferentes grupos de bacterioplancton en relación con la disponibilidad de fósforo en un reservorio de agua dulce. Reinar. Microbiol. 8, 1613-1624 (2006).

Artículo PubMed Google Scholar

Ruiz-González, C., Proia, L., Ferrera, I., Gasol, JM & Sabater, S. Efectos de la regulación de grandes presas fluviales sobre la estructura de la comunidad de bacterioplancton. Microbiol FEMS. Ecológico. 84, 316–331 (2013).

Artículo PubMed Google Scholar

Wang, Y. et al. Patrón biogeográfico de la comunidad bacterioplanctónica y función potencial en el río Yangtze: funciones de taxones abundantes y raros. Ciencia. Medio ambiente total. 747, 141335 (2020).

Artículo CAS PubMed Google Scholar

Savio, D. et al. Diversidad bacteriana a lo largo de un continuo fluvial de 2600 km. Reinar. Microbiol. 17, 4994–5007 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Besemer, K. et al. Desentrañar el ensamblaje de comunidades de biopelículas de arroyos. ISME J. 6, 1459-1468 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Teixeira, P. et al. Bacteroides spp. y bacterias indicadoras fecales tradicionales en la evaluación de la calidad del agua: un enfoque integrado para la gestión de recursos hídricos en centros urbanos. J. Medio Ambiente. Gestionar. 271, 110989 (2020).

Artículo de Google Scholar

Mayer, RE et al. Aparición de marcadores de seguimiento de fuentes genéticas de Bacteroidetes asociados a humanos en aguas residuales sin tratar y tratadas de origen municipal y doméstico y comparación con indicadores estándar y alternativos de contaminación fecal. Agua Res. 90, 265–276 (2016).

Artículo CAS PubMed Google Scholar

Kirschner, AKT y cols. El seguimiento multiparamétrico de la contaminación fecal microbiana revela el predominio de la contaminación humana a lo largo de todo el río Danubio. Agua Res. 124, 543–555 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Mayer, RE et al. Distribución global de marcadores genéticos fecales asociados a humanos en muestras de referencia de seis continentes. Reinar. Ciencia. Tecnología. 52, 5076–5084 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Nguyen, PL y cols. Detección y seguimiento rápidos de Flavobacterium psychrophilum en agua mediante el uso de un sistema de PCR cuantitativo portátil de mano. J. Aquat. Animación. Salud 30, 302–311 (2018).

Artículo CAS PubMed Google Scholar

Joe-Gaddy, V., Brassill, N., Carr, D., McLain, J. & Rock, C. Evaluación de Bacteroides sp. total, como indicador alternativo en la calidad del agua agrícola. J. Microbiol alimentario. Seguro. Hig. 6, 1000148 (2021).

Google Académico

Farnleitner, AH y cols. Escherichia coli y enterococos son indicadores sensibles y confiables de la contaminación fecal humana, ganadera y silvestre en los recursos hídricos de las montañas alpinas. J. Aplica. Microbiol. 109, 1599-1608 (2010).

CAS PubMed PubMed Central Google Académico

Liška, I., Wagner, F., Sengl, M., Deutsch, K. & Slobodník, J. Joint Danube Survey 3: un análisis exhaustivo de la calidad del agua del Danubio. https://www.danubesurvey.org/jds3/jds3-files/nodes/documents/jds3_final_scientific_report_1.pdf (2015).

Pawlowski, J. y col. El futuro de los índices bióticos en la era ecogenómica: integración del metabarcode (e)DNA en la evaluación biológica de los ecosistemas acuáticos. Ciencia. Medio ambiente total. 637-638, 1295-1310 (2018).

Artículo CAS PubMed Google Scholar

Tikhonov, M., Leach, RW y Wingreen, NS Interpretación de datos metagenómicos 16S sin agrupación para lograr una resolución sub-OTU. ISME J. 9, 68–80 (2015).

Artículo PubMed Google Scholar

Kelly, MG, Penny, CJ y Whitton, BA Rendimiento comparativo de los índices de diatomeas bentónicas utilizados para evaluar la calidad del agua de los ríos. Hidrobiología 302, 179–188 (1995).

Artículo CAS Google Scholar

Rimet, F. & Bouchez, A. Biomonitoreo de diatomeas fluviales: implicaciones de la resolución taxonómica. Ecológico. Índico. 15, 92–99 (2012).

Artículo de Google Scholar

Jones, FC Suficiencia taxonómica: la influencia de la resolución taxonómica en las bioevaluaciones de agua dulce utilizando macroinvertebrados bentónicos. Reinar. Rev. 16, 45–69 (2008).

Artículo de Google Scholar

Staley, C. y col. Aplicación de la secuenciación de próxima generación de Illumina para caracterizar la comunidad bacteriana del río Upper Mississippi. J. Aplica. Microbiol. 115, 1147-1158 (2013).

Artículo CAS PubMed Google Scholar

Kolmakova, OV, Gladyshev, MI, Rozanov, AS, Peltek, SE y Trusova, MY Biodiversidad espacial de bacterias a lo largo del río Ártico más grande determinada mediante secuenciación de próxima generación. Microbiol FEMS. Ecológico. 89, 442–450 (2014).

Artículo CAS PubMed Google Scholar

Leer, DS et al. Biogeografía a escala de cuenca del bacterioplancton ribereño. ISME J. 9, 516–526 (2015).

Artículo CAS PubMed Google Scholar

Velimirov, B., Milosevic, N., Kavka, GG, Farnleitner, AH & Kirschner, AKT Desarrollo del compartimento bacteriano a lo largo del río Danubio: un continuo a pesar de las influencias locales. Microbio. Ecológico. 61, 955–967 (2011).

Artículo PubMed Google Scholar

Kirschner, AKT y cols. Calidad microbiológica del agua a lo largo del río Danubio: integración de datos de dos estudios de todo el río y una red de monitoreo transnacional. Agua Res. 43, 3673–3684 (2009).

Artículo CAS PubMed Google Scholar

Kavka, GG, Kasimir, GD & Farnleitner, AH Calidad microbiológica del agua del río Danubio (km 2581 - km 15): variación longitudinal de la contaminación determinada por parámetros estándar. https://www.researchgate.net/publication/240633716_Microbiological_water_quality_of_the_River_Danube_km_2581_-_km_15_Longitudinal_variation_of_pollution_as_determined_by_standard_parameters/citation/download (2002).

Birk, S. & Hering, D. Comparación directa de métodos de evaluación utilizando macroinvertebrados bentónicos: una contribución al ejercicio de intercalibración de la Directiva Marco del Agua de la UE. Hidrobiología 566, 401–415 (2006).

Artículo de Google Scholar

Birk, S. y col. Clasificaciones intercalibradas del estado ecológico: la búsqueda de Europa de objetivos de gestión comunes para los ecosistemas acuáticos. Ciencia. Medio ambiente total. 454–455, 490–499 (2013).

Artículo PubMed Google Scholar

Griffiths, RI, Whiteley, AS, O'Donnell, AG y Bailey, MJ Método rápido para la coextracción de ADN y ARN de entornos naturales para el análisis de la composición de la comunidad microbiana basada en ADN ribosómico y ARNr. Aplica. Reinar. Microbiol. 66, 5488–5491 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Reischer, GH y cols. Seguimiento cuantitativo de fuentes fecales microbianas con muestreo guiado por la dinámica de la cuenca hidrológica. Reinar. Microbiol. 10, 2598–2608 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Martin, M. Cutadapt elimina secuencias de adaptadores de lecturas de secuenciación de alto rendimiento. EMBnet J. 17, 10-12 (2011).

Artículo de Google Scholar

Callahan, BJ y cols. DADA2: inferencia de muestras de alta resolución a partir de datos de amplicones de Illumina. Nat. Métodos 13, 581–583 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Quast, C. y col. El proyecto de base de datos de genes de ARN ribosómico SILVA: procesamiento de datos mejorado y herramientas basadas en web. Ácidos nucleicos res. 41, D590-D596 (2013).

Artículo CAS PubMed Google Scholar

Yilmaz, P. et al. Los marcos taxonómicos SILVA y el “Proyecto de árboles vivos para todas las especies (LTP)”. Ácidos nucleicos res. 42, D643–D648 (2014).

Artículo CAS PubMed Google Scholar

Fontaine, L., Pin, L. y Eiler, A. danube_indicators. https://doi.org/10.5072/zenodo.1222217 (2023).

Horton, NJ y Lipsitz, SR Imputación múltiple en la práctica: comparación de paquetes de software para modelos de regresión con variables faltantes. Soy. Estadística. 55, 244–254 (2001).

Artículo de Google Scholar

Fontaine, L. y col. Múltiples umbrales y trayectorias de biodiversidad microbiana predichos a través de gradientes de pardeamiento mediante redes neuronales y aprendizaje de árboles de decisión. Comunal ISME. 1, 37 (2021).

Artículo PubMed Central Google Scholar

Descargar referencias

Este estudio ha contado con el apoyo financiero del Departamento de Biociencias y el Centro de Biogeoquímica en el Antropoceno de la Universidad de Oslo (“Startpakke” de Alexander Eiler). Esta investigación es parte del proyecto EuroFLOW (red EUROpea de formación e investigación para la gestión ambiental FLOW en cuencas fluviales) financiado por el Programa Marco de Investigación e Innovación Horizonte 2020 de la Unión Europea en virtud del acuerdo de subvención Marie Skłodowska-Curie (MSCA) No.765553. Este estudio fue apoyado por el Fondo Austriaco para la Ciencia (FWF) como parte del “Programa de Doctorado de Viena sobre Sistemas de Recursos Hídricos” (DKplus W1219-N22) y los proyectos FWF P25817-B22, P23900-B22 y P32464-B, así como el proyecto de investigación “Sistemas de recursos de aguas subterráneas de Viena” en cooperación con Vienna Water (MA31). La Comisión Internacional para la Protección del Río Danubio (ICPDR) proporcionó la infraestructura (cruceros, laboratorio flotante) y la logística para la recolección, almacenamiento y transporte de muestras. Este manuscrito incluye datos con licencia de la ICPDR, recuperados de la base de datos Danubis (https://danubis.icpdr.org/). Agradecemos específicamente a Wolfram Graf, Béla Csány, Patrick Leitner, Momir Paunovic, Thomas Huber, Joszef Szekeres, Claudia Nagy y Peter Borza por proporcionar datos de macroinvertebrados y clasificación del índice saprobio, Martin Dokulil y Ulrich Donabaum por proporcionar datos de clorofila a, Carmen Hamchivici, Florentina Dumitrache, Fabio Sena, Günther Umlauf, Carmen Postolache e Ion Udrea por proporcionar parámetros fisicoquímicos y nutrientes generales, así como a Marija Marjanovic-Rajcic y Damir Thomas por proporcionar datos DOC. Agradecemos a Franck Lejzerowicz por sus interesantes sugerencias que mejoraron el manuscrito.

Sección de Biología y Toxicología Acuáticas, Centro de Biogeoquímica en el Antropoceno, Departamento de Biociencias, Universidad de Oslo, Blindernv. 31, 0371, Oslo, Noruega

Laurent Fontaine, Lorenzo Pin y Alexander Eiler

Instituto Noruego para la Investigación del Agua (NIVA) Gaustadalléen 21, 0349, Oslo, Noruega

Lorenzo Pin y Nikolai Friberg

División Calidad del Agua y Salud, Departamento de Farmacología, Fisiología y Microbiología, Universidad de Ciencias de la Salud Karl Landsteiner, Krems an der Donau, Austria

Domenico Savio, Alexander KT Kirschner y Andreas H. Farnleitner

Centro de Cooperación Interuniversitaria para el Agua y la Salud, Viena, Austria

Domenico Savio, Alexander KT Kirschner y Andreas H. Farnleitner

Grupo de Investigación de Microbiología y Diagnóstico Molecular 166/5/3, Instituto de Ingeniería Química, Ambiental y de Biociencias, TU Wien, Viena, Austria

Domenico Savio y Andreas H. Farnleitner

Sección de Biología de Agua Dulce, Universidad de Copenhague, Universitetsparken 4, Tercer Piso, 2100, Copenhague, Dinamarca

Nikolai Friberg

Escuela de Geografía, Universidad de Leeds, Leeds, LS2 9JT, Reino Unido

Nikolai Friberg

Universidad Médica de Viena, Instituto de Higiene e Inmunología Aplicada, Microbiología del Agua, Kinderspitalgasse 15, 1090, Viena, Austria

Alexander KT Kirschner

eDNA Solutions AB, Kärrbogata 22, 44196, Alingsås, Suecia

Alejandro Eiler

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

DS, AKTK y AHF diseñaron la encuesta y gestionaron y realizaron el muestreo. DS realizó el trabajo de laboratorio para procesar muestras de ADN. LP, DS y AE procesaron los datos de secuenciación. LF ejecutó el modelado espacio-temporal y el análisis de umbral. LP realizó el análisis de prevalencia/varianza. AE, NF, AKTK y AHF obtuvieron financiación para la encuesta. LF, LP, DS y AE escribieron el manuscrito.

Correspondencia a Alexander Eiler.

Los autores declaran no tener conflictos de intereses.

Communications Biology agradece a Lorenzo Brusetti y a los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Editores principales: Eoin O'Gorman, Luke R. Grinham y George Inglis. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Fontaine, L., Pin, L., Savio, D. et al. Los bioindicadores bacterianos permiten la clasificación del estado biológico a lo largo del río Danubio continental. Común Biol 6, 862 (2023). https://doi.org/10.1038/s42003-023-05237-8

Descargar cita

Recibido: 15 de mayo de 2022

Aceptado: 10 de agosto de 2023

Publicado: 18 de agosto de 2023

DOI: https://doi.org/10.1038/s42003-023-05237-8

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.