کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
2784478 1153820 2007 20 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Periodic oscillations of the genomic nucleotide sequences disclose major differences in the way of constructing homologous proteins from different procaryotic species
موضوعات مرتبط
علوم زیستی و بیوفناوری علوم کشاورزی و بیولوژیک علوم کشاورزی و بیولوژیک (عمومی)
پیش نمایش صفحه اول مقاله
Periodic oscillations of the genomic nucleotide sequences disclose major differences in the way of constructing homologous proteins from different procaryotic species
چکیده انگلیسی

In this study, a set of 80 completely sequenced procaryotic genomes has been analysed by an alignment-free method, namely the expectancy-rectified frequency of bigrams or 2-tuples, representing the 16 combinations of A, T, G, C. It demonstrates that all genomes exhibit periodic oscillations of their nucleotide sequence, with a period close to 11 phosphodiester bonds, and resembling in shape an exponentially dampened sinusoid at the distance from 5 to 49 bonds. Interestingly, the amplitude of nucleotide oscillation (but not the period) can differ drastically from one species to another. I show that these differences are due neither to the (G + C) content, nor to the size of the genome. They are not directly related to phylogeny, since specific genomes from Archaea and Bacteria can display large as well as small amplitudes. I have compared also a set of genes coding for proteins rich in alpha helical structures (as determined by X-ray diffraction) with a set of genes coding for proteins devoid of alpha helices. The first set has periodic oscillations of large amplitude, with an 11-bond period, while the second has none. Furthermore, I analysed a large number of sets of homologous genes from several different species. They exhibit very different amplitudes of oscillations. Altogether, the data with their statistical analyses strongly suggest that the nucleotide oscillations are due to the ‘genomic style of proteins’, which means that homologous proteins, having the same biochemical function in different organisms, may have different secondary structures or may use different ways to be constructed. I realize that this idea is a heterodox one, but I believe that it can shed a new light both on phylogenies and on constraints between proteins and their coding sequences. To cite this article: P.P. Slonimski, C. R. Biologies 330 (2007).

RésuméUn ensemble de 80 génomes procaryotes complètement séquencés a été analysé par une méthode sans alignement, dite des bigrames (n  -tuples avec n=2n=2), et représentant les 16 combinaisons de A, T, G, C. Les résultats montrent que tous les génomes observés manifestent des oscillations périodiques de leur séquence nucléotidique, dont la période est proche de 11 liaisons phosphodiester et qui évoquent une sinusoïde amortie, sur une distance de 5 à 49 liaisons. Contrairement à la période, qui reste constante, l'amplitude des oscillations nucléotidiques peut varier de manière étonnante d'un génome à l'autre. Je montre que ces différences ne sont dues, ni à la teneur en (G + C), ni à la taille des génomes. Elles ne sont pas reliées à la phylogénie : on observe des oscillations de fortes et de faibles amplitudes, aussi bien dans les génomes des Archae que dans ceux des Bactéries. J'ai aussi comparé deux ensembles de gènes, codant l'un des protéines riches en hélices alpha (d'après les données de diffraction aux rayons X) et l'autre des protéines dépourvues d'hélices alpha. Le premier ensemble présente des oscillations de forte amplitude, dont la période est de 11 liaisons phosphodiester, alors que le second n'en manifeste pas. J'ai, de plus, observé que des ensembles de gènes homologues, issus d'espèces distinctes, peuvent présenter des oscillations d'amplitudes très différentes. Ces résultats et leurs analyses statistiques suggèrent très fortement que les oscillations nucléotidiques observées sont la conséquence du « style génomique des protéines », concept selon lequel des protéines homologues, exerçant la même fonction chez des organismes différents, peuvent, en raison des propriétés globales du génome, utiliser des modalités différentes pour établir leur structure secondaire. Je conçois que cette idée puisse paraître hétérodoxe, mais je suis persuadé qu'elle peut ouvrir de nouvelles perspectives dans le domaine de la phylogénie et révéler les contraintes insoupçonnées qui se sont établies entre les protéines et leurs séquences codantes. Pour citer cet article : P.P. Slonimski, C. R. Biologies 330 (2007).

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Comptes Rendus Biologies - Volume 330, Issue 1, January 2007, Pages 13–32
نویسندگان
,