Espacio secuencial (evolución)
From Wikipedia, the free encyclopedia
En biología evolutiva, el espacio secuencial es una forma de representar todas las secuencias posibles (para una proteína, gen o genoma).[1][2] El espacio de secuencia tiene una dimensión por aminoácido o nucleótido en la secuencia que conduce a espacios altamente dimensionales.[3][4]
La mayoría de las secuencias en el espacio secuencial no tienen función, dejando regiones relativamente pequeñas que están pobladas por genes naturales.[5] Cada secuencia de proteína es adyacente a todas las demás secuencias a las que se puede llegar a través de una sola mutación. Se ha estimado que la vida en la Tierra ha explorado todo el espacio funcional de secuencias de proteínas.[6] La evolución se puede visualizar como el proceso de muestrear secuencias cercanas en el espacio de secuencia y moverse a cualquiera con una mejor aptitud sobre la actual.
Un espacio de secuencia generalmente se presenta como una cuadrícula. Para los espacios secuencial de proteínas, cada residuo en la proteína está representado por una dimensión con 20 posibles posiciones a lo largo de ese eje correspondiente a los posibles aminoácidos.[3][4] Por lo tanto, hay 400 posibles dipéptidos dispuestos en un espacio de 20x20, pero eso se expande a 10130 para que incluso una pequeña proteína de 100 aminoácidos se organice en un espacio con 100 dimensiones. Aunque tal multidimensionalidad abrumadora no se puede visualizar o representar esquemáticamente, proporciona un modelo abstracto útil para pensar sobre el rango de proteínas y la evolución de una secuencia a otra.
Estos espacios altamente multidimensionales se pueden comprimir a 2 o 3 dimensiones mediante el análisis de componentes principales. Un paisaje de fitness es simplemente un espacio de secuencia con un eje vertical adicional de fitness agregado para cada secuencia.[7]
