A new method to study DNA sequences: the languages of evolution
Fecha de publicación
2005Author
Spinelli, Gino
Mayer-Foulkes, David
Formato
application/PDF
URL del recurso
http://hdl.handle.net/11651/6172Idioma
eng
Acceso
Acceso abierto
Compartir
Metadata
Show full item recordAbstract
In the last years several authors have reported the finding of deterministic dynamics in the flux of genetic information. Such dynamics suggest that evolution occurs with the emergence and maintenance of a fractal landscape in DNA chains. In this work we examine the idea that the repetition of motifs lies at the origin of these statistical properties of DNA. To analyse such dynamics of repetition we apply a modification of the BDS statistic, a method borrowed from economic statistics, and we adapt it to DNA sequence analysis. We compare the statistical properties of naturally occurring sequences along the evolutionary tree with simulated randomly generated sequences and also simulated sequences with repetition motifs. We provide a new method to analyse DNA information, which is able to search for a structured signal in genetic information. To better understand the graphic results, we also define a new statistic for a DNA sequence. On the basis of a mathematical interpretation of repetition patterns, a specific fingerprint of DNA sequences is proposed. With this new method we study the statistical properties of exon and intron DNA sequences finding specific statistical differences. Moreover, by analysing DNA sequences of different species from Bacteria to man, we estimate the evolution of these linguistic DNA features along the evolutionary tree. The results are consistent with the idea that the flux of DNA information is not random, but that it is formed by patterns of repetitions along the evolutionary tree. The implications for evolutionary theory will be discussed. En los últimos años varios autores han reportado resultados de dinámica determinista en el flujo de la información genética. Tal dinámica sugiere que la evolución ocurre con el surgimiento y mantenimiento de características fractales en las cadenas DNA. En este trabajo examinamos la idea de que la repetición de secuencias se encuentra en el origen de estas propiedades estadísticas del DNA. Para analizar la dinámica de repeticiones aplicamos una modificación del estadístico BDS, método aportado por la estadística económica que adaptamos al análisis de secuencias de DNA. Comparamos las propiedades estadísticas de secuencias que ocurren en forma natural a lo largo del árbol de la evolución, con secuencias simuladas generadas al azar y también secuencias simuladas con secuencias de repetición. Proporcionamos un nuevo método para analizar la información del DNA, que tiene la facultad de buscar señales estructuradas en la información genética. Para entender mejor los resultados gráficos definimos también un nuevo estadístico para una secuencia DNA. Sobre la base de una interpretación matemática de patrones de repetición, este constituye una huella específica de secuencias de DNA. Con este nuevo método estudiamos las propiedades estadísticas de las secuencias DNA de tipo exon e intron, y encontramos diferencias estadísticas específicas. Más aún, el analizar las secuencias DNA de diferentes especies, desde bacterias hasta el hombre, sugiere cómo evolucionan estas características lingüísticas del DNA a lo largo del árbol de la evolución. Estos resultados son consistentes con la idea de que el flujo de información en el DNA no es al azar, sino que está formado por patrones de repeticiones a lo largo del árbol evolutivo. Se discuten las implicaciones para la teoría evolutiva.
Editorial
Centro de Investigación y Docencia Económicas, División de Economía
Derechos
El Centro de Investigación y Docencia Económicas A.C. CIDE autoriza a poner en acceso abierto de conformidad con las licencias CREATIVE COMMONS, aprobadas por el Consejo Académico Administrativo del CIDE, las cuales establecen los parámetros de difusión de las obras con fines no comerciales. Lo anterior sin perjuicio de los derechos morales que corresponden a los autores.
Tipo
Documento de trabajo
Cita
Spinelli, GinoMayer-Foulkes, David. "A new method to study DNA sequences: the languages of evolution". Documento de trabajo. , 2005. http://hdl.handle.net/11651/6172Materia
Genomics -- Statistical methods.
Molecular evolution -- Statistical methods.