Computational tools to study emergent behaviours in bacterial populations and their hosts

Núñez Berrueco, Elena ORCID: https://orcid.org/0000-0003-3995-6176 (2024). Computational tools to study emergent behaviours in bacterial populations and their hosts. Tesis (Doctoral), E.T.S. de Ingenieros Informáticos (UPM). https://doi.org/10.20868/UPM.thesis.81366.

Descripción

Título: Computational tools to study emergent behaviours in bacterial populations and their hosts
Autor/es:
Director/es:
Tipo de Documento: Tesis (Doctoral)
Fecha de lectura: 29 Abril 2024
Materias:
ODS:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of ELENA_NUNEZ_BERRUECO_01.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (50MB)
[thumbnail of ELENA_NUNEZ_BERRUECO_02.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (35MB)

Resumen

The fields of systems and synthetic biology in the context of microbiology greatly rely on computational tools. Systems biology views cells as interconnected networks, while synthetic biology engineers biocircuits with novel behaviours. Computational models are pivotal for understanding biological systems, forecasting behaviours, and optimizing experimentation in both fields.

Artificial neural networks (ANNs) exhibit unparalleled versatility and accuracy inpredictions. Alongside manual models, agent-based models (ABMs) provide detailedmechanistic representations, mapping individual cell interactions to emergent population-level behaviours. ABMs excel in capturing spatial heterogeneity, of significantvalue in light of the growing interest in multicellular circuits. Nevertheless, these twomethodologies entail limitations that constraint their application. This thesis aims toenhance their applicability and accessibility in systems and synthetic microbiology.

The first contribution of this thesis is an interpretable ANN architecture namedsmall interpretable neural networks (SINNs), specifically designed for extremely limiteddatasets. It resides within the emerging domain of visual neural networks (VNNs),which utilise biological networks as ANN architectures. While the prevalent applicationof this approach aims to enhance interpretability, this thesis uniquely capitalises on theirsparse representation to train models with scarce data. This novel SINN architectureintegrates targeted enhancements tailored towards this objective, diverging from existingmethodologies. The work underscores how this constrained, biologically meaningfulconnectivity mitigates noise and spurious patterns from the dataset.

The SINN approach has materialized into a software tool for model training via amultipopulation, steady-state, real-coded genetic algorithm. Applied to the intricatenetwork of type III secretion system (T3SS) effectors of Citrobacter rodentium witha minimal dataset of 100 instances, the model yielded unexpected yet experimentallyvalidated insights. These findings guided subsequent experimental investigations.

As a second contribution, this thesis introduces an enhanced version of the widelyknown ABM simulator, gro, termed gro 3.0. This updated iteration aims to augmentaccessibility and align with evolving synthetic biology trends. Notably, gro 3.0 replacesthe original programming language with a graph-based experiment specification layer,rendering the software more accessible while retaining substantial flexibility. gro 3.0 is acompletely revamped software with enhanced performance, expandability, user interface,associated tools, and simulation capabilities.

Among the plethora of new biological features, quantitative DNA dynamics stand out,encompassing plasmid replication, segregation, mutation, gene editing, and various formsof horizontal gene transfer. These facilitate simulations of DNA-based communication,a promising area in synthetic biology research. Additionally, an inventive stochasticitymanagement approach introduces spatially-structured cell variability and supportsevolution experiments. With this comprehensive catalogue of features, gro 3.0 emergesas a premier option for the development of bacterial ABMs and lays a robust foundationfor the prospective establishment of a unified simulation platform for multicellularconsortia.

These two contributions offer accessible modelling tools, one automated and one mechanistic, optimizing experimentation and accelerating the pace of discovery in microbiological research. Moreover, certain concepts and methodologies introduced in this work hold the potential to extend beyond biology.

RESUMEN

Los campos de la biología de sistemas y la biología sintética en microbiología dependen ampliamente de herramientas computacionales. La biología desistemas entiende las células como redes interconectadas, mientras que la biología sintéticadiseña biocircuitos con comportamientos novedosos. Los modelos computacionales son cruciales para comprender sistemas biológicos, predecir comportamientos y optimizar laexperimentación en ambos campos.

Las redes neuronales artificiales (ANNs) exhiben versatilidad y exactitud sin igual en sus predicciones. Entre los modelos manuales, los basados en agentes (ABMs) ofrecen representaciones mecanicistas detalladas, relaciona interacciones celulares individuales con comportamientos poblacionales emergentes. Los ABMs destacan por capturar la heterogeneidad espacial, de gran valor considerando el creciente interés en los circuitos multicelulares. No obstante, estos dos enfoques conllevan limitaciones que restringensu uso. Esta tesis pretende mejorar su aplicabilidad y accesibilidad en microbiología de sistemas y sintética.

La primera contribución de esta tesis es una arquitectura interpretable ANN llamada redes neuronales interpretables pequeñas (SINNs), diseñadas específicamente para conjuntos de datos extremadamente limitados. Se engloba en el dominio de las redes neuronales visuales (VNNs), que utilizan redes biológicas como arquitecturas ANN. Mientras que la aplicación prevalente de este método se centra en mejorar la interpretabilidad, esta tesis aprovecha su representación dispersa para entrenar modelos con datos escasos. La novedosa arquitectura SINN integra mejoras dirigidas hacia este objetivo, divergiendo de metodologías existentes. Este trabajo resalta cómo esta conectividad restringida y con sentido biológico mitiga el ruido y los patrones espurios del conjunto de datos.

El enfoque SINN se ha materializado en una herramienta software para entrenar modelos mediante un algoritmo genético multi-población, de estado estacionario y codificación real. Aplicado a la intrincada red de efectores del sistema de secreción tipo III (T3SS) de Citrobacter rodentium con un conjunto de datos mínimo de 100 casos, el modelo produjo resultados inesperados pero validados experimentalmente. Estos hallazgos orientaron investigaciones experimentales posteriores.

Como segunda contribución, esta tesis introduce una versión mejorada del conocido simulador ABM, gro, denominada gro 3.0. Esta nueva iteración pretende mejorar la accesibilidad y alinearse con las tendencias en evolución en biología sintética. A destacar, gro 3.0 reemplaza el lenguaje de programación original por una capa de especificación de experimentos basada en grafos, haciendo el software accesible mientras conserva flexibilidad. gro 3.0 es un software completamente renovado con un mejor rendimiento,capacidad de expansión, interfaz de usuario, herramientas asociadas y capacidades desimulación.

Entre la multitud de nuevas funcionalidades biológicas, destacan las dinámicas del ADN, abarcando replicación de plásmidos, segregación, mutación, edición génica y transferencia genética horizontal. Éstas facilitan la simulación de comunicación basada en ADN, un área prometedora en biología sintética. Además, un enfoque innovador de manejo de la estocasticidad introduce variabilidad celular espacialmente estructurada y sustenta experimentos de evolución. Con este catálogo de características, gro 3.0 emerge como una opción principal para el desarrollo de ABMs bacterianos y sienta una base sólida para el establecimiento futuro de una plataforma de simulación unificada para consorcios multicelulares.

Estas dos contribuciones ofrecen herramientas de modelado accesibles, una automatizaday otra mecanicista, destinadas a optimizar la experimentación y acelerar elritmo de descubrimiento en la investigación microbiológica. Además, ciertos conceptos y metodologías introducidos en este trabajo tienen el potencial de extenderse más allá de la biología.

Proyectos asociados

Tipo
Código
Acrónimo
Responsable
Título
Gobierno de España
PID2019-106960GB-I00
Sin especificar
Sin especificar
Hacia la inteligencia artificial in vivo: programación de fármacos multicelulares vivos inteligentes
Gobierno de España
PID2022-142815NB-I00
Sin especificar
Sin especificar
Descifrando las infecciones bacterianas con técnicas de inteligencia artificial e ingeniería de biocircuitos

Más información

ID de Registro: 81366
Identificador DC: https://oa.upm.es/81366/
Identificador OAI: oai:oa.upm.es:81366
Identificador DOI: 10.20868/UPM.thesis.81366
Depositado por: Archivo Digital UPM 2
Depositado el: 17 Jun 2024 07:37
Ultima Modificación: 17 Dic 2024 01:45