کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4752624 1416278 2017 14 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Optimal hybrid sequencing and assembly: Feasibility conditions for accurate genome reconstruction and cost minimization strategy
ترجمه فارسی عنوان
توالی و هم ترازی ترکیبی مطلوب: شرایط امکان سنجی برای بازسازی دقیق ژنوم و استراتژی کمینه سازی هزینه
کلمات کلیدی
مونتاژ، ترتیب دهی، بازسازی کل ژنوم،
ترجمه چکیده
پیشرفت های اخیر در تکنولوژی توالی ژنوم با توان بالا، مطالعه سیستماتیک ژنوم های مختلف را با ایجاد توالی کامل ژنوم مقرون به صرفه انجام داده است. توالی های مدرن تعداد زیادی از اجزای توالی کوچک به نام خوانده می شود، که در آن طول خواندن و هزینه توالی بر پایه به تکنولوژی مورد استفاده بستگی دارد. تا به امروز، بسیاری از الگوریتم های مونتاژ ژنوم هیبریدی توسعه داده شده اند که می توانند از منابع متعدد خواندن برای بازسازی ژنوم اصلی استفاده کنند. با این حال، بررسی دقیق شرایط امکان پذیر برای بازسازی کامل ژنوم و استراتژی توالی مطلوب برای به حداقل رساندن هزینه توالی به طور چشمگیری از دست رفته است. یکی از جنبه های مهم توالی و ترتیب ترکیبی این است که شرایط امکان پذیری بازسازی ژنوم می تواند توسط ترکیب های مختلفی از منابع قابل خواندن در دسترس باشد و امکان بهینه سازی ترکیب منابع برای به حداقل رساندن هزینه توالی در حالی که اطمینان از بازسازی ژنوم دقیق است. در این مقاله، شرایط برای بازسازی کل ژنوم را از منابع مختلف خواندن در یک سطح اطمینان داده شده به دست می آوریم و همچنین استراتژی بهینه برای ترکیب خواندن از منابع مختلف به منظور به حداقل رساندن هزینه توالی کامل به ارمغان می آورد. ما نشان می دهیم که خواندن مطلوب، که به طور همزمان امکان پذیری شرایط بازسازی ژنوم را به حداقل می رساند و هزینه توالی را به حداقل می رساند، می تواند به طور موثر با بهینه سازی گسسته محدود شود. از طریق ارزیابی های گسترده بر اساس چندین ژنوم و مجموعه های مختلف خواندن، ما شرایط شرایط مشتق شده را بررسی می کنیم و عملکرد توالی ترتیب ترکیبی پیشنهاد شده و استراتژی مونتاژ را نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی شیمی بیو مهندسی (مهندسی زیستی)
چکیده انگلیسی
Recent advances in high-throughput genome sequencing technologies have enabled the systematic study of various genomes by making whole genome sequencing affordable. Modern sequencers generate a huge number of small sequence fragments called reads, where the read length and the per-base sequencing cost depend on the technology used. To date, many hybrid genome assembly algorithms have been developed that can take reads from multiple read sources to reconstruct the original genome. However, rigorous investigation of the feasibility conditions for complete genome reconstruction and the optimal sequencing strategy for minimizing the sequencing cost has been conspicuously missing. An important aspect of hybrid sequencing and assembly is that the feasibility conditions for genome reconstruction can be satisfied by different combinations of the available read sources, opening up the possibility of optimally combining the sources to minimize the sequencing cost while ensuring accurate genome reconstruction. In this paper, we derive the conditions for whole genome reconstruction from multiple read sources at a given confidence level and also introduce the optimal strategy for combining reads from different sources to minimize the overall sequencing cost. We show that the optimal read set, which simultaneously satisfies the feasibility conditions for genome reconstruction and minimizes the sequencing cost, can be effectively predicted through constrained discrete optimization. Through extensive evaluations based on several genomes and different read sets, we verify the derived feasibility conditions and demonstrate the performance of the proposed optimal hybrid sequencing and assembly strategy.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Biology and Chemistry - Volume 69, August 2017, Pages 153-163
نویسندگان
, , , ,