Article ID Journal Published Year Pages File Type
4671124 Comptes Rendus Mathematique 2008 6 Pages PDF
Abstract

We propose a new method to approximate the significativity of gapped local sequence alignments. We focus on short sequences for which standard methods are known to be less accurate since they have been developed under asymptotics. Our approach combines an approximate distribution of ungapped local score of two sequences and a special scoring scheme that allows the insertion of gaps. For a positive integer h, the scoring scheme is defined on h-tuples of the components of the sequences and corresponds to the gapped global score. The influence of h and the accuracy of the p-value are numerically studied. To cite this article: A.M. Fayyaz et al., C. R. Acad. Sci. Paris, Ser. I 346 (2008).

RésuméNous proposons une nouvelle méthode pour estimer la signification statistique des alignements locaux de deux séquences avec gaps. On s'intéresse plus particulièrement aux séquences courtes pour lesquelles les méthodes standards sont moins efficaces étant donné leur aspect asymptotique. Notre approche combine une distribution approchée du score local sans gaps de deux séquences et une fonction de score spécifique qui permet d'introduire les gaps. Soit h un entier positif, la fonction de score est définie sur les h-uplets des composants des séquences et correspond au score global avec gap. L'influence de h et la qualité de la p-valeur sont ensuite étudiées numériquement. Pour citer cet article : A.M. Fayyaz et al., C. R. Acad. Sci. Paris, Ser. I 346 (2008).

Related Topics
Physical Sciences and Engineering Mathematics Mathematics (General)