Citation
Catalán Valbuena, Marco
(2017).
Nuevo lenguaje de especificación de experimentos para el simulador GRO.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.
Abstract
La biología sintética es un campo de investigación que está en auge actualmente.
Hay numerosos grupos de investigación por todo el mundo, y
estos grupos necesitan unas herramientas eficaces para poder trabajar adecuadamente.
Para ello el Laboratorio de Inteligencia Artificial (LIA) de la
UPM está desarrollando un simulador genético multicelular. Este simulador
necesita que los usuarios introduzcan los experimentos genéticos que quieren
realizar. Para ello, se ha diseñado un lenguaje de entrada basado en el lenguaje
YAML, teniendo como objetivo la simplicidad de lectura por personas
sin grandes conocimientos en informática. Se ha creado un módulo para este
simulador, cuyo objetivo es, dado un fichero de entrada de configuración,
determinar si es correcto, informando al usuario de posibles errores de tipo
léxico, semántico o sintáctico, y exponer la información contenida en la configuración
al resto de módulos del simulador. Se pretende que este lenguaje
de especificación de experimentos no sea únicamente usado en el simulador
que se está desarrollando en el LIA, sino que se pueda usar en otros simuladores
existentes, como el simulador GRO. La motivación detrás de crear
este lenguaje es la simplificación de la especificación de experimentos genéticos.
La mayoría de lenguajes de especificación de experimentos existentes,
como el lenguaje usado por el simulador GRO, resultan muy complicados a
usuarios sin conocimientos de informática, como biólogos, ya que no es completamente
declarativo, si no que dentro de los archivos de configuración se
necesita especificar código imperativo. Este nuevo lenguaje está basado en
ser completamente declarativo, de tal manera que el usuario del simulador no
necesite programar. En concreto, se ha elegido el lenguaje base YAML por
su simplicidad y legibilidad por humanos. Palabras clave: Biología sintética,
Bioingeniería, Genética...---ABSTRACT---Synthetic biology is a research field that is gaining a lot of traction. There
are many research groups around the world, and these groups need proper
tools in order to work properly. The LIA (Laboratorio de Inteligencia Artificial)
of the UPM is developing a multicellular genetic simulator. This simulator
needs users to provide the experiments they want to perform as inputs.
An input language based on the YAML markup language has been designed.
Its main objective is to make reading it easy for users without a computer
science background. A module for the simulator has been developed, which
given an input file, checks its validity at multiple levels (lexical, semantical,
syntactical) and passes the parsed information on to other modules of the simulator.
The objective of this experiment specification language is not only to
be used with the mentioned simulator, but also to be compatible with other
well-known simulators, like the GRO simulator. The main motivation behind
this language is simplifying the specification of genetic experiments. Most
genetic specification languages, like the one used by the GRO simulator, are
very hard to understand to users without computer science knowledge, like
biologists, which are one of the main user groups of the simulator. This is because
these languages are not purely declarative, and in the specification files
users need to write imperative code. This new language has been designed
with the main objective of being purely declarative, so the end user doesn’t
need to write any code. YAML language has been chosen because of its simplicity
and legibility by both machines and humans. Keywords: Synthetic
biology, Bioengineering, Genetics...