Ano ang Pagkakaiba sa pagitan ng FASTA at FASTQ

Talaan ng mga Nilalaman:

Ano ang Pagkakaiba sa pagitan ng FASTA at FASTQ
Ano ang Pagkakaiba sa pagitan ng FASTA at FASTQ

Video: Ano ang Pagkakaiba sa pagitan ng FASTA at FASTQ

Video: Ano ang Pagkakaiba sa pagitan ng FASTA at FASTQ
Video: ALAMIN: Mga pagkakaiba sa pagitan ng Frigate at Destroyer | RisingPH tv 2024, Hulyo
Anonim

Ang pangunahing pagkakaiba sa pagitan ng FASTA at FASTQ ay ang FASTA ay isang text-based na format na nag-iimbak lamang ng mga nucleotide o protein sequence, habang ang FASTQ ay isang text-based na format na nag-iimbak ng parehong sequence at nauugnay na mga value ng kalidad ng sequence.

Ang Bioinformatics ay isang field na gumagamit ng iba't ibang software upang suriin at maunawaan ang biological data, lalo na kapag kumplikado at malaki ang set ng data. Pinagsasama ng field na ito ang biology, chemistry, physics, computer science, information engineering, mathematics, at statistics para suriin at bigyang-kahulugan ang biological data. Ang FASTA at FASTQ ay dalawang sequence representation formats sa larangan ng bioinformatics upang ihanay at pag-aralan ang mga sequence. Sa katunayan, ang FASTQ ay isang sequence file format na nagpapalawak sa FASTA na format na may kakayahang mag-imbak ng sequence na kalidad.

Ano ang FASTA?

Ang FASTA ay isang alignment software para sa DNA at protein sequence. Ang FASTA software ay gumagamit ng FASTA na format. Ito ay isang text-based na format na kumakatawan sa alinman sa mga nucleotide sequence o amino acid (protein) sequence. Dito, ang mga solong letrang code ay kumakatawan sa parehong mga pagkakasunud-sunod na ito. Ang FASTA ay isang mahalagang kasangkapan sa larangan ng bioinformatics at biochemistry. Nagbibigay-daan ang format na ito para sa mga pangalan ng sequence at komento na mauna sa mga sequence.

FASTA vs FASTQ sa Tabular Form
FASTA vs FASTQ sa Tabular Form

Figure 01: FASTA Sequence

Ang format na ito ay nagmula sa FASTA software at ipinakilala nina David J. Lipmann at William R. Pearson noong 1985. Ang FASTA tool ay nagkaroon ng maraming pagbabago sa paglipas ng panahon, at ang pinakabagong bersyon ay binubuo ng mga programa para sa protina:protein, DNA:DNA, protein:translated DNA (na may mga frameshift) at inayos o hindi nakaayos na mga paghahanap sa peptide. Ang FASTA ay nagbabasa ng isang ibinigay na nucleotide o amino acid sequence at naghahanap ng kaukulang sequence database sa pamamagitan ng paggamit ng lokal na sequence alignment upang makahanap ng mga tugma ng mga katulad na sequence ng database.

Ano ang FASTQ?

Ang FASTQ ay isang alignment software na ginagamit sa larangan ng bioinformatics, na nag-iimbak ng parehong biological sequence (karaniwan ay nucleotide sequence) at ang mga katumbas nitong marka ng kalidad. Ang FASTQ ay orihinal na binuo upang i-bundle ang isang FASTA na naka-format na sequence at ang nauugnay na data ng kalidad ng Wellcome Trust Sanger Institute. Sa pag-unlad sa larangan ng bioinformatics, ang FASTQ ay naging de facto na pamantayan para sa pag-iimbak ng output ng maraming high-throughput na mga instrumento sa sequencing.

Ang FASTQ na format ay gumagamit ng apat na magkakaibang linya bawat sequence. Ang Linya 1 ay nagsisimula sa @ character at sinusundan ng isang pagkakakilanlan ng pagkakasunud-sunod (katulad ng isang linya ng pamagat ng FASTA). Ang Linya 2 ay binubuo ng mga hilaw na sequence letter. Sa linya 3, ang sequence ay nagsisimula sa isang '+' na character at opsyonal na sinusundan ng parehong sequence identifier. Ini-encode ng Linya 4 ang mga value ng kalidad para sa sequence sa line 2 at dapat na binubuo ng parehong bilang ng mga simbolo tulad ng mga titik sa sequence.

Ano ang Pagkakatulad sa pagitan ng FASTA at FASTQ?

  • Ang FASTA at FASTQ ay mga tool sa pag-align.
  • Sila ay dalawang sequence representation format.
  • Parehong nauugnay sa larangan ng bioinformatics.
  • Parehong FAST at FASTQ ay mahalagang tool para sa mga layunin ng pag-iimbak at pagkakasunud-sunod.
  • Ang FASTQ ay isang extension ng FASTA format na may kakayahang mag-imbak ng kalidad ng sequence.

Ano ang Pagkakaiba sa pagitan ng FASTA at FASTQ?

Ang FASTA ay isang text-based na format na nag-iimbak lamang ng mga nucleotide o mga sequence ng protina, habang ang FASTQ ay isang text-based na format na nag-iimbak ng parehong sequence at nauugnay na mga value ng kalidad ng sequence. Kaya, ito ang pangunahing pagkakaiba sa pagitan ng FASTA at FASTQ. Bukod dito, ang FASTA ay nag-iimbak ng mga fragment ng sequence pagkatapos ma-map, habang ang FASTQ ay nag-iimbak ng mga sequence fragment bago ang pagma-map. Bukod pa rito, isa pang pagkakaiba sa pagitan ng FASTA at FASTQ ay ang FASTA ay binubuo ng isang linya para sa paglalarawan, at ang FASTAQ ay binubuo ng apat na linya.

Ipinapakita ng infographic sa ibaba ang mga pagkakaiba sa pagitan ng FASTA at FASTQ sa tabular form para sa magkatabi na paghahambing.

Buod – FASTA vs FASTQ

Bioinformatics ay gumagamit ng iba't ibang format ng mga sequence gaya ng FASTA at FASTQ, atbp. Ang FASTA ay nag-iimbak ng mga sequence fragment pagkatapos mai-mapa habang ang FASTQ ay nag-iimbak ng mga sequence fragment bago ang pagmamapa. Ang FASTA ay isang alignment software para sa DNA at sequence ng protina. Binubuo ito ng mga programa para sa protein:protein, DNA:DNA, protein:translated DNA (na may mga frameshifts), at inorder o unordered peptide searches. Ang FASTQ ay isang alignment software na ginagamit sa larangan ng bioinformatics at nag-iimbak ng parehong biological sequence (karaniwan ay nucleotide sequence) at ang mga kaukulang marka ng kalidad nito. Ang FASTA ay binubuo ng isang linya ng paglalarawan, at ang FASTQ ay binubuo ng apat na linya. Kaya, ito ay nagbubuod sa pagkakaiba sa pagitan ng FASTA at FASTQ.

Inirerekumendang: