Yeni nesil sekanslama teknolojilerinin yaygınlaşması ve biyolojik verilerin çoğalması ile beraber DNA ve protein dizi hizalama algoritmalarının daha yüksek performans ile calıştırılmasına olan ihtiyaç artmıştır. Bu çalışma iki iyi bilinen, Needleman-Wunsch ve Smith-Waterman, DNA ve Protein dizi hizalama algoritmalarının Python programlama dilinde farklı derlenme stratejilerinin sistematik kıyaslamasıdır. Sıkça kullanılan Biopython’un ikili hizalama modülü ile kendi yazdığımız yazılımın farklı derleme yaklaşımlarının performans farkının kıyaslanması amaçlanmıştır. Sonuçlar Numba’nın just-in-time derleme yönteminin PyPy ve Cython derleme yöntemleri ya da Biopython modülüne kıyasla genel olarak daha yüksek performans gösterdiğini ortaya koymuştur. Bu çalışmanın geniş çapta dizi hizalama gerektiren yazılım protipleme çalışmalarında verimliliği arttıracağı düşünülmektedir.
With the development of next generation sequencing technologies, the requirement of higher performance from DNA and Protein sequence alignment algorithms has become even greater. This work is a systematic comparison of different compilation strategies for two common DNA or Protein sequence alignment algorithms, Needleman-Wunsch and Smith-Waterman, using Python programming language. It aims to investigate the performance benefits of already widely used Biopython’s pairwise alignment module versus different compilation approaches of an in-house software. It is shown that using Numba just-in-time compiler provide greater performance overall in comparison to PyPy and Cython compilers or the Biopython module. This work may increase the efficiency of software prototyping where large-scale sequence alignment is necessary.
Primary Language | English |
---|---|
Subjects | Bioinformatic Methods Development, Sequence Analysis |
Journal Section | Natural Sciences |
Authors | |
Publication Date | December 30, 2024 |
Submission Date | July 6, 2024 |
Acceptance Date | December 3, 2024 |
Published in Issue | Year 2024Volume: 45 Issue: 4 |