کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6369067 1623806 2016 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Predicting protein structural classes based on complex networks and recurrence analysis
ترجمه فارسی عنوان
پیش بینی کلاس های ساختاری پروتئین بر اساس شبکه های پیچیده و تجزیه و تحلیل عود
کلمات کلیدی
پیش بینی ساختار پروتئین پروتئین، نمایندگی بازی هرج و مرج، ماتریس عود، شبکه پیچیده
ترجمه چکیده
توالی پروتئین به چهار طبقه ساختاری تقسیم می شود. تعریف کلاس، یک وظیفه چالش برانگیز و مفید در زمینه بیوانفورماتیک است. برای این منظور روش های متعددی پیشنهاد شده است، اما اکثر ویژگی های بیش از حد مورد استفاده قرار می گیرند و نتایج نامناسب تولید می کنند. در حال حاضر، ویژگی های بر اساس ساختارهای پیش بینی شده ثانویه استخراج می شوند. در ابتدا توالی ساختار ثانویه پیش بینی شده توسط دو نمایندگی بازی هرج و مرج به دو سری زمانی نمایش داده می شود. سپس، ماتریس عدد بازگشتی از هر سری زمانی محاسبه می شود. ماتریس عود با ماتریس مجاورت یک شبکه پیچیده شناسایی می شود و اندازه گیری ها برای توصیف شبکه های پیچیده به این ماتریس های عود مجدد اعمال می شود. برای یک توالی پروتئینی داده شده، در مجموع 24 ویژگی مشخصه را می توان محاسبه کرد و این به الگوریتم تحلیل تجزیه تحلیل فیشر برای طبقه بندی داده می شود. برای بررسی روش پیشنهادی، دو مورد از مجموعه داده های معیار شباهت کم، طراحی و آزمایش شده است. مقایسه نتایج حاصل از روشهای موجود نشان میدهد که رویکرد مطالعه حاضر، عملکرد مناسبی را برای پیش بینی ساختارهای ساختاری پروتئین فراهم میکند.
موضوعات مرتبط
علوم زیستی و بیوفناوری علوم کشاورزی و بیولوژیک علوم کشاورزی و بیولوژیک (عمومی)
چکیده انگلیسی
Protein sequences are divided into four structural classes. The determination of class is a challenging and beneficial task in the bioinformatics field. Several methods have been proposed to this end, but most utilize too many features and produce unsuitable results. In the present, features are extracted based on the predicted secondary structures. At first, predicted secondary structure sequences are mapped into two time series by the chaos game representation. Then, a recurrence matrix is calculated from each of the time series. The recurrence matrix is identified with the adjacency matrix of a complex network and measures are applied for the characterization of complex networks to these recurrence matrixes. For a given protein sequence, a total of 24 characteristic features can be calculated and these are fed into Fisher's discriminated analysis algorithm for classification. To examine the proposed method, two widely used low similarity benchmark datasets design and test its performance. A comparison with the results of existing methods shows that the current study's approach provides a satisfactory performance for protein structural class prediction.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Theoretical Biology - Volume 404, 7 September 2016, Pages 375-382
نویسندگان
, , ,