IMPLEMENTASI PACKAGE BIOCONDUCTOR PADA SOFTWARE R UNTUK OLAH DATA HASIL GENOTYPING BY SEQUENCING PADA TANAMAN CABAI (Capsicum annuum)
Abstract
Penelitian ini menerapkan package dari Bioconductor pada software R dalam menangani data sekuens DNA cabai yang disimpan dengan format fastq. Data tersebut akan dicari lokasi SNPs dengan cara alignment data fastq dengan referensi genom cabai Zunla yang disimpan dalam format fasta. Sebelumnya terlebih dahulu digunakan package ShortRead dan Rqc untuk melihat kualitas data sekuens DNA yang dihasilkan oleh mesin sekuensing. Hasil sekuens dapat dikatakan sempurna karena nilainya mendekati 100%. Selanjutnya dilakukan alignment data fastq dan fasta yang hasilnya disimpan dalam sam file dengan bantuan package Rbowtie. Kemudian data dalam format sam dikonversi menjadi bam dengan menggunakan package Rsamtools. Hasilnya yaitu dari dua belas data yang dimiliki, data bam A2_142804-1_1 memiliki jumlah lokasi sekuens DNA terbanyak yang didalamnya mengandung SNPs, yaitu sebanyak 95.349 ranges.
Collections
- Statistics [900]