Bio informatika merupakan ilmu
terapan yang lahir dari perkembangan teknologi informasi dibidang molekular.
Pembahasan dibidang bioinformatik ini tidak terlepas dari perkembangan biologi
molekular modern, salah satunya peningkatan pemahaman manusia dalam bidang genomic
yang terdapat dalam molekul DNA.
Kemampuan untuk memahami dan
memanipulasi kode genetik DNA ini sangat didukung oleh teknologi informasi
melalui perkembangan hardware dan soffware. Baik pihak pabrikan sofware dan
harware maupun pihak ketiga dalam produksi perangkat lunak. Salah satu
contohnya dapat dilihat pada upaya Celera Genomics, perusahaan bioteknologi
Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang secara
maksimal memanfaatkan teknologi informasi sehingga bisa melakukan pekerjaannya
dalam waktu yang singkat (hanya beberapa tahun).
Perkembangan teknologi DNA
rekombinan memainkan peranan penting dalam lahirnya bioinformatika. Teknologi
DNA rekombinan memunculkan suatu pengetahuan baru dalam rekayasa genetika
organisme yang dikenala bioteknologi. Perkembangan bioteknologi dari
bioteknologi tradisional ke bioteknologi modren salah satunya ditandainya
dengan kemampuan manusia dalam melakukan analisis DNA organisme, sekuensing DNA
dan manipulasi DNA.
Sekuensing DNA satu organisme,
misalnya suatu virus memiliki kurang lebih 5.000 nukleotida atau molekul DNA
atau sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh pada tahun
1977. Kemudia Sekuen seluruh DNA manusia terdiri dari 3 milyar nukleotida yang
menyusun 100.000 gen dapat dipetakan dalam waktu 3 tahun, walaupun semua ini
belum terlalu lengkap. Saat ini terdapat milyaran data nukleotida yang
tersimpan dalam database DNA, GenBank di AS yang didirikan tahun 1982.
Bioinformatika ialah ilmu yang mempelajari penerapan teknik komputasi untuk mengelola dan menganalisis
informasi hayati. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah
biologi, terutama yang terkait dengan penggunaan sekuens DNA dan asam
amino. Contoh
topik utama bidang ini meliputi pangkalan
data untuk
mengelola informasi hayati, penyejajaran sekuens (sequence alignment),
prediksi struktur untuk meramalkan struktur protein atau pun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.
Bioinformatika pertamakali
dikemukakan pada pertengahan 1980an untuk mengacu kepada penerapan ilmu
komputer dalam bidang biologi. Meskipun
demikian, penerapan bidang-bidang dalam bioinformatika seperti pembuatan
pangkalan data dan pengembangan algoritma untuk analisis sekuens biologi telah dilakukan sejak tahun 1960an.
Kemajuan teknik biologi
molekuler dalam
mengungkap sekuens biologi protein (sejak awal 1950an) dan asam
nukleat (sejak
1960an) mengawali perkembangan pangkalan data dan teknik analisis sekuens
biologi. Pangkalan data sekuens protein mulai dikembangkan pada tahun 1960an di
Amerika Serikat, sementara pangkalan data sekuens DNA dikembangkan
pada akhir 1970an di Amerika Serikat dan Jerman pada Laboratorium Biologi Molekuler
Eropa (European Molecular Biology
Laboratory).
Penemuan teknik sekuensing DNA yang lebih cepat pada
pertengahan 1970an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang
dapat diungkapkan pada 1980an dan 1990an. Hal ini menjadi salah satu pembuka
jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan kebutuhan akan
pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya
bioinformatika.
Perkembangan jaringan internet juga mendukung berkembangnya
bioinformatika. Pangkalan data bioinformatika yang terhubungkan melalui
internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke dalam
pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan
analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui internet
memudahkan ilmuwan dalam mengakses program-program tersebut dan kemudian
memudahkan pengembangannya.
Pangkalan
Data sekuens
biologi dapat berupa pangkalan data primer untuk menyimpan sekuens primer asam
nukleat dan protein, pangkalan data sekunder untuk
menyimpan motif sekuens protein, dan pangkalan data struktur untuk menyimpan
data struktur protein dan asam nukleat.
Pangkalan data utama untuk sekuens
asam nukleat saat ini adalah GenBank (Amerika Serikat), EMBL (the European Molecular Biology
Laboratory, Eropa), dan DDBJ (DNA Data Bank of Japan, Jepang). Ketiga pangkalan data tersebut
bekerja sama dan bertukar data secara harian untuk menjaga keluasan cakupan
masing-masing pangkalan data. Sumber utama data sekuens asam nukleat adalah
submisi (pengumpulan) langsung dari peneliti individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi sekuens asam
nukleat, entri dalam pangkalan data sekuens asam nukleat pada umumnya
mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan
segala sesuatu yang berkaitan dengan sekuens asam nukleat tersebut.
Selain asam nukleat, beberapa contoh
pangkalan data penting yang menyimpan sekuens primer protein adalah PIR (Protein Information Resource,
Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga pangkalan data
tersebut telah digabungkan dalam UniProt, yang didanai terutama oleh Amerika
Serikat. Entri dalam UniProt mengandung informasi tentang sekuens protein, nama
organisme sumber protein, pustaka yang berkaitan, dan komentar yang pada umumnya
berisi penjelasan mengenai fungsi protein tersebut.
Perangkat bioinformatika yang
berkaitan erat dengan penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment Search
Tool). Penelusuran BLAST (BLAST search) pada pangkalan data sekuens
memungkinkan ilmuwan untuk mencari sekuens baik asam nukleat maupun protein
yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya
untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan
hasil sekuensing atau untuk memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari kerja BLAST adalah
penyejajaran sekuens.
PDB (Protein Data Bank, Bank
Data Protein) ialah pangkalan data tunggal yang menyimpan model struktur tiga
dimensi protein dan asam
nukleat hasil
penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR, dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom dalam protein atau pun asam
nukleat.
Tidak ada komentar:
Posting Komentar