Wstępna charakterystyka bakteriofaga Serratia φOS10/Wstęp/Analiza bioinformatyczna genomów fagowych/BLAST

Z Wikibooks, biblioteki wolnych podręczników.

BLAST (ang. Basic Local Alignment Search Tool) jest programem, który w oparciu o algorytm Needleman’a-Wunsch’a porównuje zaimplementowaną przez użytkownika sekwencję nukleotydową lub białkową (sekwencja zapytania, ang. QUERY) z sekwencjami nukleotydowymi lub białkowymi zdeponowanymi w bazie NCBI (ang. SUBJECT). Wyniki wyszukiwania są wyświetlane w formie listy rekordów z bazy NCBI, dla których ma miejsce największe podobieństwo sekwencji nukleotydowych, jej pokrycie oraz „wartość E” (ang. e-value, expected value). Podobieństwo wyrażane jest w formie parametru SCORE (skr. S), którego wartość zależy od: przyjętej macierzy podstawieniowej (ang. substitution matrix) [Henikoff & Henikoff, 1992], od ilości kolejnych identycznych nukleotydów między sekwencją badaną a rekordem z bazy oraz od ilości kar za przerwy w ciągłości między tymi sekwencjami (karą nazywa się tu pewną wartość odejmowaną od sumy punktów przyznanych za identyczności między sekwencją badaną, a rekordem z bazy). Pokrycie jest wartością procentową, która wyraża odsetek fragmentów badanej sekwencji, dla których znaleziono przyporządkowanie do rekordu. Wartość E jest współczynnikiem zawierającym się w przedziale od 0 do 1 i wyraża prawdopodobieństwo, z jakim badana sekwencja została przyporządkowana do rekordu przez przypadek. Umownie przyjmuje się, że aby przypisanie do rekordu było istotne statystycznie, e-wartość nie może przekroczyć wartości 5 * 10-2. W wyborze odpowiedniego rekordu z listy dąży się do tego, aby wartość E była jak najmniejsza. Wartość E oblicza się według wzoru E = K*m*n*e– λ S [Altschul & Gish, 1996], gdzie:

  • K i λ są wartościami stałymi dla przyjętej macierzy podstawieniowej
  • m i n to długości sekwencji zapytania i sekwencji z bazy
  • e to liczba Eulera
  • S to wartość SCORE

Blast N (ang. Nucleotide Basic Local Alignment Search Tool) jest wariantem programu BLAST, który w oparciu o algorytm Needleman’a-Wunsch’a porównuje zaimplementowaną przez użytkownika sekwencję nukleotydową (QUERY) z sekwencjami nukleotydowymi zdeponowanymi w bazie NCBI. Program BLAST N wykorzystuje się do wyszukiwania sekwencji wykazujących homologię z badaną sekwencją [Altschul i in., 1990].
Blast P (ang. Protein Basic Local Alignment Search Tool) bazuje na tych samych parametrach co BLAST N, z jednym wyjątkiem – w sekwencji aminokwasowej do dyspozycji jest więcej liter (20 podstawowych aminokwasów) niż w sekwencji nukleotydowej (4 nukleotydy). Niektóre aminokwasy wykazują wzajemne podobieństwo strukturalne, w związku z czym podczas dopasowania sekwencji zapytania do rekordu z bazy przypisuje się temu podobieństwu wartość liczbową (ang. SCORE) na podstawie wybranej macierzy podstawieniowej (np. BLOSUM62) [Henikoff & Henikoff, 1992].
Blast X jest wariantem programu BLAST, służącym do dopasowywania wybranych sekwencji nukleotydowych z rekordami w bazie białek NCBI [Altschul i in., 1997; Johnson i in., 2008]. BLAST X wykorzystano w niniejszej pracy do dopasowania z rekordami bazy białek NCBI tych fragmentów sekwencji genomu badanego faga, które były homologiczne z sekwencjami genomów innych znanych fagów Serratia.


Tekst udostępniony jest na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0.
Dodatkowe informacje o autorach i źródle znajdują się na stronie dyskusji.