Research Article
BibTex RIS Cite

PDB Dosyalarının Analizi ve İki Protein Arasındaki Benzerliği Hesaplama

Year 2022, Volume: 5 Issue: 2, 29 - 35, 25.12.2022

Abstract

Biyolojik yapıları incelemek protein mühendisliği, ilaç dizaynı ve üretimi gibi birçok geniş uygulama ağı için kritik bir işlemdir. PDB (Protein Veri Bankası) dosya formatı, proteinler gibi biyolojik moleküllerin tanımlandırılması, kimliklendirilmesi için kullanılmakta olan en elverişli ve popüler bir uzantıdır/formattır. Yazı tabanı yapısında olan bu formatta, satırlar belirli bir molekülü veya atomu belirtmektedir ve atomun ismi, kalıntısının ismi, bağlı olduğu zinciri ve koordinatları gibi teknik detaylarını içerir. Bu dosyalardan çeşitli detaylar ayıklayarak anlamlandırabilmek için çeşitli uygulamalar ve aracılar geliştirilmiştir. Geliştirilen bu araçlar, moleküler oluşumların incelenmesini ve dizaynını zor olmaktan çıkartır. Bu teknik uygulamalara örnek olarak ProDy ve BioJava gibi paketler gösterilebilir. Fakat bahsi geçen paketlerin yeni uygulamalara entegre olması kolay olmayabilir ve genellikle moleküler bazda simüle edilmelerinin incelenmesi hedefinde büyük kod tabanlarına entegredir. Ayrıca koordinatları güncelleştirme/değiştirme ve manipüle etme tekniklerinden yoksundurlar. PDB uzantılı dosyaları veritabanına çekebilen ve ayrıştırma işlemi, manipüle etme gibi kullanımları kolaylaştırarak sunan Python paketi pdb2sql kullanılmıştır. Farklı çözümler açısından bakılırsa, manuel olarak SQL kodu yazmak bir veritabanına sorgu çekmek için kullanılan en yaygın çözümlerdendir. Fakat SQL komut ve sorguları alanın dışında kalan çalışmacılar için zorlayıcı ve kafa karıştırıcı olup, SQL dilinin teknik olarak kullanılmasına engel teşkil etmektedir. Tam burada pdb2sql, son kullanıcılara basit Python tekniklerini kullanımı açısından aracı olarak SQL sorgularına kolaylık sağlar. Bununla birlikte makalede kullanılmış olan teknik ile SQL sorgularının olumlu ve etkili taraflarından yararlanılır ve SQL sorgu zorluklarına da çözüm olmuş olur. Buna ek olarak, biyolojik ve moleküler yapıları orijin ekseni etrafında döndürmek, arayüz ve teknik bilgilerine müdahale etmek ve iki protein arasındaki yapı benzeşmesini incelemek için pdb2sql içerisinde birkaç tipte güvenilir sınıflar da oluşturulmuş ve kullanılmaktadır. Sonuç olarak Python paketi olan pdb2sql; hafif ve çok yönlülüğüyle birlikte, modifiye ve dizayn edilmesi ve entegrasyon işlemleri kolay bir PDB uzantılı dosya işleme aracıdır.

References

  • Muhammad Radifar , Nunung Yuniarti, Enade Perdana Istyastono, PyPLIF: Python- based Protein-Ligand Interaction Fingerprinting, (2013).
  • Nicolas Renaud, Yong Jung, Vasant Honavar, Cunliang Geng, Alexandre M.J.J. Bonvin, Li C. Xue , iScore: An MPI supported software for ranking protein–protein docking, (2020).
  • Documentation of Pdb2sql
  • Nicolas Renaud, Cunliang Geng, The pdb2sql Python Package: Parsing, Manipulation and Analysis of PDB Files (2020).
  • M. Réau, Nicolas Renaud, C. Xue, J. Bonvin, DeepRank-GNN: A Graph Neural Network Framework to Learn Patterns in Protein-Protein Interfaces (2021).
  • Nicolas Renaud, Cunliang Geng, Sonja Georgievska, Francesco Ambrosetti, Lars Ridder, Dario F., DeepRank: a deep learning framework for data mining 3D protein-protein interfaces (2021).
  • Yanyan Lan, Liang Pang, Jiafeng Guo, Jun Xu, Jingfang Xu, Xueqi Cheng, DeepRank: A New Deep Architecture for Relevance Ranking in Information Retrieval (2017)
  • Ming Chen, Xiuze Zhou, DeepRank: Learning to rank with neural networks for recommendation (2020).
  • Raaiha Humayun Kabir, Bisma Pervaiz, Tayyeba Muhammad Khan, Adnan Ul-Hasan, Raheel Nawaz & Faisal Shafait, DeepRank: Adapting Neural Tensor Networks for Ranking the Recommendations (2019).
  • J. L. Sussman, D. Lin, J. Jiang, N. O. Manning, J. Prilusky, O. Ritter and E. E. Abola, Protein Data Bank (PDB): Database of Three-Dimensional Structural Information of Biological Macromolecules (1998).
  • Helen Berman, Kim Henrick, Haruki Nakamura, John L. Markley, The worldwide Protein Data Bank (wwPDB): ensuring a single, uniform archive of PDB data (2006).
  • Stephen K. Burley, Helen M. Berman, GerardJ.Kleywegt, John L. Markley, Haruki Nakamura & Sameer Velankar, Protein Data Bank (PDB): The Single Global Macromolecular Structure Archive (2017).
  • Stephen K. Burley, Charmi Bhikadiya, Chunxiao Bi, RCSB Protein Data Bank: Celebrating 50 years of the PDB with new tools for understanding and visualizing biological macromolecules in 3D (2021).

Analysis of PDB Files and Calculating Similarity Between Two Proteins

Year 2022, Volume: 5 Issue: 2, 29 - 35, 25.12.2022

Abstract

Examining biological structures is a critical process for many broad applications, such as protein engineering, drug design and production. The PDB (Protein Data Bank) file format is the most convenient and popular extension/format in use for the identification, identification of biological molecules such as proteins. In this format, which has a typeface structure, lines indicate a particular molecule or atom and contain technical details such as the name of the atom, the name of its residue, the chain to which it is attached, and its coordinates. Various applications and intermediaries have been developed to extract various details from these files and make sense of them. These developed tools make the study and design of molecular formations difficult. Examples of these technical applications are packages such as ProDy and BioJava. However, these packages may not be easy to integrate into new applications and are often integrated into large codebases for the purpose of examining their simulation on a molecular basis. They also lack techniques for updating/changing and manipulating coordinates. The Python package pdb2sql is used, which can pull files with the PDB extension into the database and present them by making them easier to parse and manipulate. In terms of different solutions, manually writing SQL code is one of the most common solutions used to query a database. However, SQL commands and queries are challenging and confusing for those outside the field and hinder the technical use of the SQL language. Right here, pdb2sql provides end users with SQL queries as an intermediary to use simple Python techniques. However, with the technique used in the article, the positive and effective sides of SQL queries are utilized and it will also be a solution to SQL query difficulties. In addition, several types of reliable classes have been created and used in pdb2sql to rotate biological and molecular structures around their axis of origin, interfere with interface and technical information, and examine structure affinity between two proteins. The result is the Python package pdb2sql; It is a PDB extension file manipulation tool that is lightweight and versatile, easy to modify, design and integrate.

References

  • Muhammad Radifar , Nunung Yuniarti, Enade Perdana Istyastono, PyPLIF: Python- based Protein-Ligand Interaction Fingerprinting, (2013).
  • Nicolas Renaud, Yong Jung, Vasant Honavar, Cunliang Geng, Alexandre M.J.J. Bonvin, Li C. Xue , iScore: An MPI supported software for ranking protein–protein docking, (2020).
  • Documentation of Pdb2sql
  • Nicolas Renaud, Cunliang Geng, The pdb2sql Python Package: Parsing, Manipulation and Analysis of PDB Files (2020).
  • M. Réau, Nicolas Renaud, C. Xue, J. Bonvin, DeepRank-GNN: A Graph Neural Network Framework to Learn Patterns in Protein-Protein Interfaces (2021).
  • Nicolas Renaud, Cunliang Geng, Sonja Georgievska, Francesco Ambrosetti, Lars Ridder, Dario F., DeepRank: a deep learning framework for data mining 3D protein-protein interfaces (2021).
  • Yanyan Lan, Liang Pang, Jiafeng Guo, Jun Xu, Jingfang Xu, Xueqi Cheng, DeepRank: A New Deep Architecture for Relevance Ranking in Information Retrieval (2017)
  • Ming Chen, Xiuze Zhou, DeepRank: Learning to rank with neural networks for recommendation (2020).
  • Raaiha Humayun Kabir, Bisma Pervaiz, Tayyeba Muhammad Khan, Adnan Ul-Hasan, Raheel Nawaz & Faisal Shafait, DeepRank: Adapting Neural Tensor Networks for Ranking the Recommendations (2019).
  • J. L. Sussman, D. Lin, J. Jiang, N. O. Manning, J. Prilusky, O. Ritter and E. E. Abola, Protein Data Bank (PDB): Database of Three-Dimensional Structural Information of Biological Macromolecules (1998).
  • Helen Berman, Kim Henrick, Haruki Nakamura, John L. Markley, The worldwide Protein Data Bank (wwPDB): ensuring a single, uniform archive of PDB data (2006).
  • Stephen K. Burley, Helen M. Berman, GerardJ.Kleywegt, John L. Markley, Haruki Nakamura & Sameer Velankar, Protein Data Bank (PDB): The Single Global Macromolecular Structure Archive (2017).
  • Stephen K. Burley, Charmi Bhikadiya, Chunxiao Bi, RCSB Protein Data Bank: Celebrating 50 years of the PDB with new tools for understanding and visualizing biological macromolecules in 3D (2021).
There are 13 citations in total.

Details

Primary Language English
Subjects Engineering
Journal Section Articles
Authors

Emre Yıldırım 0000-0002-9375-982X

Volkan Altuntaş 0000-0003-3144-8724

Publication Date December 25, 2022
Published in Issue Year 2022 Volume: 5 Issue: 2

Cite

APA Yıldırım, E., & Altuntaş, V. (2022). Analysis of PDB Files and Calculating Similarity Between Two Proteins. Veri Bilimi, 5(2), 29-35.



Dergimizin Tarandığı Dizinler (İndeksler)


Academic Resource Index

logo.png

journalseeker.researchbib.com

Google Scholar

scholar_logo_64dp.png

ASOS Index

asos-index.png

Rooting Index

logo.png

www.rootindexing.com

The JournalTOCs Index

journal-tocs-logo.jpg?w=584

www.journaltocs.ac.uk

General Impact Factor (GIF) Index

images?q=tbn%3AANd9GcQ0CrEQm4bHBnwh4XJv9I3ZCdHgQarj_qLyPTkGpeoRRmNh10eC

generalif.com

Directory of Research Journals Indexing

DRJI_Logo.jpg

olddrji.lbp.world/indexedJournals.aspx

I2OR Index

8c492a0a466f9b2cd59ec89595639a5c?AccessKeyId=245B99561176BAE11FEB&disposition=0&alloworigin=1

http://www.i2or.com/8.html



logo.png