Bioinformatika merupakan ilmu terapan yang lahir dari
perkembangan teknologi informasi dibidang molekular. Pembahasan dibidang
bioinformatik ini tidak terlepas dari perkembangan biologi molekular modern,
salah satunya peningkatan pemahaman manusia dalam bidang genomic yang terdapat
dalam molekul DNA.
Kemampuan untuk memahami dan memanipulasi kode genetik
DNA ini sangat didukung oleh teknologi informasi melalui perkembangan hardware
dan soffware. Baik pihak pabrikan sofware dan harware maupun pihak ketiga dalam
produksi perangkat lunak. Salah satu contohnya dapat dilihat pada upaya Celera
Genomics, perusahaan bioteknologi Amerika Serikat yang melakukan pembacaan
sekuen genom manusia yang secara maksimal memanfaatkan teknologi informasi
sehingga bisa melakukan pekerjaannya dalam waktu yang singkat (hanya beberapa
tahun).
Perkembangan teknologi DNA rekombinan memainkan
peranan penting dalam lahirnya bioinformatika. Teknologi DNA rekombinan
memunculkan suatu pengetahuan baru dalam rekayasa genetika organisme yang
dikenala bioteknologi. Perkembangan bioteknologi dari bioteknologi tradisional
ke bioteknologi modren salah satunya ditandainya dengan kemampuan manusia dalam
melakukan analisis DNA organisme, sekuensing DNA dan manipulasi DNA.
Sekuensing DNA satu organisme, misalnya suatu virus
memiliki kurang lebih 5.000 nukleotida atau molekul DNA atau sekitar 11 gen,
yang telah berhasil dibaca secara menyeluruh pada tahun 1977. Kemudia Sekuen
seluruh DNA manusia terdiri dari 3 milyar nukleotida yang menyusun 100.000 gen
dapat dipetakan dalam waktu 3 tahun, walaupun semua ini belum terlalu lengkap.
Saat ini terdapat milyaran data nukleotida yang tersimpan dalam database DNA,
GenBank di AS yang didirikan tahun 1982.
Bioinformatika ialah ilmu yang mempelajari penerapan
teknik komputasi untuk mengelola dan menganalisis informasi hayati. Bidang ini
mencakup penerapan metode-metode matematika, statistika, dan informatika untuk
memecahkan masalah-masalah biologi, terutama yang terkait dengan penggunaan
sekuens DNA dan asam amino. Contoh topik utama bidang ini meliputi pangkalan
data untuk mengelola informasi hayati, penyejajaran sekuens (sequence
alignment), prediksi struktur untuk meramalkan struktur protein atau pun
struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.
Bioinformatika pertamakali dikemukakan pada
pertengahan 1980an untuk mengacu kepada penerapan ilmu komputer dalam bidang
biologi. Meskipun demikian, penerapan bidang-bidang dalam bioinformatika
seperti pembuatan pangkalan data dan pengembangan algoritma untuk analisis
sekuens biologi telah dilakukan sejak tahun 1960an.
Kemajuan teknik biologi molekuler dalam mengungkap
sekuens biologi protein (sejak awal 1950an) dan asam nukleat (sejak 1960an)
mengawali perkembangan pangkalan data dan teknik analisis sekuens biologi.
Pangkalan data sekuens protein mulai dikembangkan pada tahun 1960an di Amerika
Serikat, sementara pangkalan data sekuens DNA dikembangkan pada akhir 1970an di
Amerika Serikat dan Jerman pada Laboratorium Biologi Molekuler Eropa (European
Molecular Biology Laboratory).
Penemuan teknik sekuensing DNA yang lebih cepat pada
pertengahan 1970an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang
dapat diungkapkan pada 1980an dan 1990an. Hal ini menjadi salah satu pembuka
jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan kebutuhan akan
pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya
bioinformatika.
Perkembangan jaringan internet juga mendukung
berkembangnya bioinformatika. Pangkalan data bioinformatika yang terhubungkan
melalui internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke
dalam pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan
analisis. Selain itu, penyebaran program-program aplikasi bioinformatika
melalui internet memudahkan ilmuwan dalam mengakses program-program tersebut
dan kemudian memudahkan pengembangannya.
Pangkalan Data sekuens biologi dapat berupa pangkalan
data primer untuk menyimpan sekuens primer asam nukleat dan protein, pangkalan
data sekunder untuk menyimpan motif sekuens protein, dan pangkalan data
struktur untuk menyimpan data struktur protein dan asam nukleat.
Pangkalan data utama untuk sekuens asam nukleat saat
ini adalah GenBank (Amerika Serikat), EMBL (the European Molecular Biology
Laboratory, Eropa), dan DDBJ (DNA Data Bank of Japan, Jepang). Ketiga pangkalan
data tersebut bekerja sama dan bertukar data secara harian untuk menjaga
keluasan cakupan masing-masing pangkalan data. Sumber utama data sekuens asam
nukleat adalah submisi (pengumpulan) langsung dari peneliti individual, proyek
sekuensing genom, dan pendaftaran paten. Selain berisi sekuens asam nukleat,
entri dalam pangkalan data sekuens asam nukleat pada umumnya mengandung
informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam
nukleat tersebut, dan segala sesuatu yang berkaitan dengan sekuens asam nukleat
tersebut.
Selain asam nukleat, beberapa contoh pangkalan data
penting yang menyimpan sekuens primer protein adalah PIR (Protein Information
Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga
pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai terutama
oleh Amerika Serikat. Entri dalam UniProt mengandung informasi tentang sekuens
protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar
yang pada umumnya berisi penjelasan mengenai fungsi protein tersebut.
Perangkat bioinformatika yang berkaitan erat dengan
penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment
Search Tool). Penelusuran BLAST (BLAST search) pada pangkalan data sekuens
memungkinkan ilmuwan untuk mencari sekuens baik asam nukleat maupun protein
yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya
untuk menemukan gen sejenis pada beberapa organisme atau untuk memeriksa
keabsahan hasil sekuensing atau untuk memeriksa fungsi gen hasil sekuensing.
Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank, Bank Data
Protein) ialah pangkalan data tunggal yang menyimpan model struktur tiga
dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi
sinar-X, spektroskopi NMR, dan mikroskopi elektron). PDB menyimpan data
struktur sebagai koordinat tiga dimensi yang menggambarkan posisi atom-atom
dalam protein atau pun asam nukleat.