Wstępna charakterystyka bakteriofaga Serratia φOS10/Wyniki i dyskusja/Analiza bioinformatyczna/Adnotacja otwartych ramek odczytu w genomie bakteriofaga φOS10

Z Wikibooks, biblioteki wolnych podręczników.

Na drodze analizy bioinformatycznej z użyciem programów BLAST P oraz HMMER przeprowadzono adnotację ORFów, co umożliwiło poznanie potencjalnych funkcji domniemanych produktów białkowych:

ORF 3 – potencjalne białko o długości 214 aa, będące produktem tej ORF, wykryto podobieństwo tego białka do białka strukturalnego ogonka faga Rhodobacter RcSaxon (e = 7 * 10-28) (Gene Bank AKY02713.1). Białko to uczestniczy w etapie składania wirusowych cząstek potomnych i jest niezbędne do wytworzenia funkcjonalnego ogonka [Bollivar i in., 2016] (Podrozdział 1.4);

ORF 4 – koduje potencjalne białko funkcji helikazy DEAD/DEAH (e = 3 * 10-10) długości 46 aa o prawdopodobnej (Gene Bank WP_092963283.1), białko to posiada motyw palca cynkowego typu C2H2 (pfam PF00096.26), który jest identyfikowany m.in. u regulatorów transkrypcji [Rohozková i in., 2014];

ORF 5 – domniemany produkt tej ORF o długości 84 aa na podstawie podobieństwa sekwencji aminokwasowych dopasowano do podjednostki theta polimerazy III DNA (e = 8 * 10-62) (Gene Bank WP_115059749.1; pfam PF06440.11). Podjednostka θ jest jedną z 3 podjednostek tworzących heterodimer polimerazy III DNA razem z podjednostkami α i ε [Slater i in., 1994];

ORF 6 – prawdopodobny produkt tego genu o długości 174 aa wykazuje podobieństwo do białka Phage shock protein B (e = 7 * 10-93) (Gene Bank WP_063919321.1; pfam PF06667.12), którego gen go kodujący zidentyfikowano w genomie Serratia sp. YD25. Ekspresja białek z grupy Psp (ang. phage shock protein) zachodzi pod wpływem czynników stresowych takich jak: szok cieplny, obecność etanolu w otoczeniu, szok osmotyczny lub infekcja fagowa [Brissette i in., 1991];

ORF 7 – potencjalny produkt białkowy o długości 176 aa powstający na drodze ekspresji ORF 7, wykazuje podobieństwo do domeny lizozymu faga Pectobacterium ZF40 (e = 2 * 10-107) (Gene Bank YP_007006943.1; pfam PF00959.19);

ORF 8 – przypuszczalny produkt białkowy ma długość 98 aa, który wykazuje podobieństwo do białka holiny grupy II (e = 1 * 10-06) (Gene Bank WP_016857351.1) zawierającego domenę właściwą dla bakteriofagowych holin z rodziny HP1 (pfam PF16080.5). Mechanizm działania tego białka polega na formowaniu porów w strukturze błony komórkowej gospodarza, dzięki czemu możliwe jest dotarcie fagowego lizozymu do ściany komórkowej [Esposito i in., 1996]. Oba te białka kodowane są przez geny zlokalizowane blisko siebie (w tym przypadku są to następujące po sobie ORF 7 i ORF 8);

ORF 9 – w jego domniemanym produkcie białkowym o długości 124 aa wykryto podobieństwo do lipoproteiny RcsF (e = 4 * 10-91) (Gene Bank WP_115058997.1; pfam PF16358.5);

ORF 10 – hipotetyczne białko kodowane przez tą ORF ma długość 234 aa. Wykazuje podobieństwo do białka antyterminatora (e = 3 * 10-169) (Gene Bank WP_115059758.1; pfam PF03589.13) kodowanego w genomie S. proteamaculans. Mechanizm działania antyterminatora bazuje na interakcji tego białka z polimerazą RNA, co prowadzi do pominięcia sekwencji terminatora i dalszej transkrypcji [Roberts i in., 1998];

ORF 11 – potencjalne białko kodowane przez tą ORF ma długość 118 aa. Białko wykazuje podobieństwo do endodeoksyrybonukleazy RusA (e = 8 * 10-90) (Gene Bank WP_060431945.1) kodowanej przez S. marcescens, Białko o takiej funkcji jest u organizmów komórkowych zaangażowane w naprawę chromosomalnego DNA na drodze rekombinacji homologicznej [Rafferty i in., 2003]. Jak wspomniano w Podrozdziale 1.3 fagi wykazują mozaikową budowę genomu, Jest to możliwe dzięki fagowym rekombinazom przeprowadzającym wymianę modułów funkcjonalnych;

ORF 13 – potencjalne białko o długości 340 aa będące produktem ORF 13 wykazuje podobieństwo do białka wiążącego DNA (e = 0,0) (Gene Bank AGQ28749.1) kodowanego przez S. liquefaciens ATCC 27592;

ORF 15 – hipotetyczne białko będące produktem tej ORF ma długość 246 aa. W sekwencji aminokwasowej tego białka wykryto podobieństwo do domeny KilA-N (e = 0,0) (Gene Bank WP_116690625.1; pfam PF04383.13) kodowanego przez S. liquefaciens;

ORF 18 – białko to będące przypuszczalnym produktem ORF 18 ma długość 50 aa. Na podstawie analizy sekwencji aminokwasowych za pomocą programu BLAST P wykryto podobieństwo białka do regulatora transkrypcji z rodziny białek XRE (ang. xenobiotic responsive element) (e = 7 * 10-37) (Gene Bank WP_115059771.1) kodowanego przez S. proteamaculans. Białka z tej grupy indukowane są pod wpływem substancji ksenobiotycznych [Matsushita i in., 1993];

ORF 19 – białko to będące prawdopodobnym produktem ORF 19 ma długość 246 aa. Podobnie jak w przypadku ORF 18, na podstawie analizy programem BLAST P wykryto podobieństwo jego sekwencji aminokwasowych do regulatora transkrypcji z rodziny białek XRE (e = 0,0) (Gene Bank WP_115059773.1). U domniemanego produktu ORF 19 zidentyfikowano też domenę HTH wiążącą DNA typu Cro/C1 (e = 2,4 * 10-05) (pfam PF13443.6) – białko to jest więc najprawdopodobniej przełącznikiem uczestniczącym w decyzji o wejściu w cykl lityczny lub lizogenny [Echols i in., 1973];

ORF 20 – domniemany produkt tej ORF o długości 87 aa wykazuje podobieństwo do białka o funkcji glikozylotransferazy (e = 1 * 10-08) (Gene Bank KJS90102.1). Znaczenie tego białka w cyklu infekcyjnym nie jest bliżej poznane;

ORF 21 – hipotetyczne białko o długości 69 aa wykazuje podobieństwo do białka pełniącego funkcję lizyno-2,3-aminomutazy (e = 2 * 10-43) (Gene Bank WP_037419410.1) kodowanego przez Serratia grimesii. Zadaniem tego typu białek jest transport grupy aminowej z pozycji α w pozycję β cząsteczki lizyny [Lepore i in., 2005];

ORF 26 – przypuszczalny produkt białkowy tej ORF ma długość 280 aa i wykazuje podobieństwo do białka partycyjnego ParB (e = 0,0) (Gene Bank WP_012006454.1) kodowanego przez S. proteamaculans;

ORF 27 – domniemany produkt białkowy ORF 27 ma długość 156 aa, wykazuje podobieństwo do białka włókienek ogonka (e = 1 * 10-25) (Gene Bank NP_037722.1) kodowanego przez faga Escherichia HK97. Włókienka ogonka rozpoznają na powierzchni bakterii specyficzne receptory [Krasnykh i in., 2001];

ORF 28 – przypuszczalne białko będące produktem tej ORF ma długość 215 aa. wykazuje podobieństwo do domeny ASCH (e = 4 * 10-91) (Gene Bank WP_101456383.1 kodowanego przez S. marcescens), która występuje u białek procesujących RNA [Iyer i in., 2005];

ORF 29 – domniemany produkt ORF 29 o długości 73 aa wykazuje podobieństwo do białka chaperonowego DnaJ uczestniczącego w prawidłowym fałdowaniu białek (e = 4 * 10-50) (Gene Bank WP_085115658.1) [Cyr i in., 1994];

ORF 32 – przypuszczalny produkt białkowy kodowany przez tą ORF ma długość 160 aa i wykazuje podobieństwo do białka replikacyjnego (e = 2 * 10-06) (Gene Bank YP_009167807.1). Mechanizm replikacji omówiono w Podrozdziale 1.4;

ORF 33 – domniemany produkt białkowy o długości 63 aa będący produktem ORF 33 dopasowano na podstawie podobieństwa sekwencji aminokwasowych do białka z rodziny ead/Ea22-podobnych. Przedstawiciele tej rodziny są białkami wczesnymi replikacji bakteriofagów λ oraz P22 [ncbi.nlm.nih.gov] (e = 4 * 10-12) (Gene Bank WP_052475410.1);

ORF 34 – białko będące potencjalnym produktem ORF 34 ma długość 178 aa, w oparciu o podobieństwo sekwencji aminokwasowych dopasowano je do białek z rodziny ead/Ea22podobnych (patrz ORF 33) (e = 1 * 10-32) (Gene Bank WP_112347612.1; pfam PF13935.6);

ORF 36 – w domniemanym produkcie białkowym o długości 233 aa kodowanym przez tą ORF odnotowano podobieństwo sekwencji aminokwasowej do domeny odpowiedzialnej za rozpoznawanie uszkodzeń w DNA występującą w helikazach z grupy B (e = 2 * 10-16) (Gene Bank KDZ03155.1; pfam PF18458.1) [Seki i in., 1988];

ORF 41 – hipotetyczne białko o długości 60 aa kodowane przez tą ORF dopasowano w oparciu o podobieństwo sekwencji aminokwasowych do białek z rodziny regulatorów transkrypcji ANR (e = 2 * 10-44) (GeneBank WP_112347617.1);

ORF 42 – produkt tej ORF został doświadczalnie scharakteryzowany. Jego długość wynosi 220 aa. Wykryto u niego (Gene Bank WP_046372823.1; pfam PF05063.14) podobieństwo do domeny MT-A70 (e = 4 * 10-164) obecnej w białkach z rodziny metylotransferaz (MTaz) S-adenozylo-L-metionino-zależnych (supfam 53335). U wirusów prokariotycznych wykryte białko może przeprowadzać modyfikacje adenin w genomie fagowym, dzięki czemu niemożliwe staje się rozpoznanie specyficznych sekwencji przez enzymy restrykcyjne gospodarza [Wilson i in., 1991], nie wyklucza się jednak innej funkcji poznanej MTazy. Gen badanego białka sklonowano, a następnie ustalono, że badane białko jest w pełni funkcjonalną MTazą DNA o specyficzności GATC [Radlińska, dane nieopublikowane]. Taką samą specyficzność ma MTaza typu Dam w rodzaju Serratia [Ostendorf i in., 1999]. MTaza Dam Serratia i ORF42 nie wykazują podobieństwa sekwencji aminokwasowej;

ORF 43 – domniemane białko będące produktem ORF 43 ma długość 387 aa i wykazuje podobieństwo do białka z rodziny integraz fagowych (e = 0,0) (Gene Bank WP_037419381.1; pfam PF00589.22) kodowanego przez S. grimesii, zawiera rdzeń katalityczny integraz fagów lambda-podobnych (supfam 56350). Integrazy fagów lambda-podobnych należą do grupy rekombinaz tyrozynowych, które za pośrednictwem aktywnej katalitycznie tyrozyny przeprowadzają cięcie rozpoznanej sekwencji attB w chromosomie gospodarza oraz sekwencji attP w genomie fagowym, co prowadzi do miejscowo specyficznej rekombinacji między obydwoma sekwencjami i w konsekwencji do wejścia bakteriofaga w stan lizogenii (Podrozdział 1.5.1). Do swojej aktywności zazwyczaj wymagają białek pomocniczych kodowanych na chromosomie bakteryjnym lub w genomie fagowym; białka te biorą też udział w wycięciu profaga [Groth & Calos, 2004];

ORF 45 – przypuszczalny produkt białkowy tej ORF ma długość 793 aa i jest najdłuższym domniemanym białkiem spośród wszystkich rozpatrywanych w niniejszej pracy. Analiza jego sekwencji aminokwasowej z użyciem programu BLAST P wskazuje na podobieństwo do endolizyny ogonka bakteriofaga SageFayge infekującego bakterie z rodzaju Bacillus (e = 1 * 10-04) (Gene Bank YP_009280906.1);

ORF 46 – domniemane białko kodowane przez ORF 46 ma długość 57 aa i wykazuje podobieństwo do syntetaz lizylo-tRNA klasy I (e = 5 * 10-32) (Gene Bank EYU16219.1). Białka z tej rodziny przyłączają cząsteczki aminokwasu lizyny tRNA tworząc amino-acylotRNA wykorzystywane później w syntezie białek na rybosomach [Onesti i in., 1995];

ORF 47 – przypuszczalny produkt białkowy tego genu ma długość 90 aa. Na podstawie analizy bioinformatycznej wykazano jego podobieństwo do regulatorów transkrypcji (e = 2 * 10-64) (Gene Bank WP_072269370.1), rozpoznano w nim domenę represora lambdapodobnego wiążącą DNA (EC 1.10.260.40);

ORF 48 – hipotetyczne białko kodowane na ORF nr 48 o długości 376 aa dopasowano w oparciu o podobieństwo sekwencji aminokwasowych do białka będącego acetylotransferazą (e = 0,0) (Gene Bank WP_072269371.1). Białko acetylotransferaza należy do rodziny acetylotransferaz (pfam PF01757.22);

ORF 49 – przypuszczalny produkt białkowy o długości 162 aa wykazuje podobieństwo do białka ogonka (e = 8 * 10-36) (Gene Bank RAN85254.1). W obrębie sekwencji aminokwasowej tego białka odnotowano podobieństwo do domeny pektynoesterazy (EC 3.1.1.11). Potencjalną funkcją tego białka może być hydroliza struktur ściany komórkowej w trakcie penetracji;

ORF 51 – domniemane białko będące produktem tego genu jest długości 382 aa. Na podstawie podobieństwa sekwencji aminokwasowej tego białka dopasowano je do białka budującego płytkę podstawową (ang. baseplate) (e = 0,0) (Gene Bank WP_062790438.1). Jest to struktura stanowiąca zakończenie ogonka, która bezpośrednio styka się z powierzchnią infekowanej bakterii. Uczestniczy ona w rozpoznaniu komórki gospodarza, adsorpcji, transdukcji sygnału o prawidłowym zaadsorbowaniu do komórki oraz we wstrzyknięciu genomu wirusowego do komórki [Kostyuchenko i in., 2003];

ORF 52 – hipotetyczny produkt białkowy tej ORF o długości 145 aa dopasowano w oparciu o podobieństwo sekwencji aminokwasowych do białka strukturalnego ogonka (e = 3 * 10-23) (Gene Bank WP_000424732.1) o bliżej nieokreślonej funkcji;

ORF 53 – domniemane białko będące produktem tej ORF ma długość 196 aa. Sekwencja aminokwasowa tego białka wykazuje podobieństwo do sekwencji białka budującego płytkę podstawową (ang. baseplate) (e = 2 * 10-132) (Gene Bank SMB46877.1) (patrz ORF 51);

ORF 54 – hipotetyczne białko będące produktem tej ORF ma długość 356 aa. Białko to w oparciu o podobieństwo sekwencji aminokwasowych zostało dopasowane do białka strukturalnego ogonka (e = 0,0) (Gene Bank WP_085118850.1) o bliżej nieokreślonej funkcji;

ORF 55 – produkt białkowy tej ORF ma długość 467 aa. Na podstawie podobieństwa sekwencji aminokwasowej tego białka dopasowano je do rodziny białek cyrkulujących DNA (e = 0,0) (Gene Bank KMQ87046.1). Ich rolą jest nadanie kolistej struktury genomowi bakteriofaga i wraz z innymi genami wczesnymi ulega ekspresji niedługo po wprowadzeniu do komórki gospodarza. W tym procesie przeprowadzanym przez białka z tej rodziny dochodzi do ligacji końców genomu (u niektórych bakteriofagów zachodzi to w sekwencji cos) [Novick i in., 2010];

ORF 56 – jej potencjalny produkt ma długość 639 aa, zaś jego sekwencja wykazuje podobieństwo do domeny litycznej transglikozylazy (e = 0,0) (GeneBank WP_107228138.1). Białko to najprawdopodobniej może uczestniczyć w lizie komórki na drodze degradacji peptydoglikanu.

ORF 57 – produkt tej ORF o długości 96 aa, wykryto w nim podobieństwo do fagowych białek składania (e = 7 * 10-71) (Gene Bank WP_062790456.1) posiada domenę chaperonową fagowego białka E (pfam PF10109.9). Białko to uczestniczy w prawidłowym fałdowaniu monomerów białkowych tworzących ogonek u bakteriofagów z rodziny Myoviridae [pfam.xfam.org];

ORF 58 – potencjalny produkt białkowy tej ORF o długości 122 aa wykazuje podobieństwo sekwencji aminokwasowych do białka strukturalnego ogonka (e = 1 * 10-92) (Gene Bank WP_062790459.1) o bliżej nieokreślonej funkcji;

ORF 59 – potencjalny produkt ORF 59 jest białkiem fagowym o długości 501 aa (e = 0,0) (Gene Bank WP_085118840.1). W sekwencji aminokwasowej tego potencjalnego białka odnotowano podobieństwo do 3 domen, które mogą w tym białku występować. Domeny te występują w białkach budujących pochewkę ogonka (pfam PF17481.2, PF04984.14 i PF17482.2);

ORF 61 – jej hipotetyczny produkt białkowy o długości 180 aa dopasowano według podobieństwa sekwencji aminokwasowej do białka pomocniczego wiążącego ATP (e = 2 * 10-129) (Gene Bank WP_107228160.1);

ORF 62 – domniemane białko będące produktem tej ORF to ma długość 114 aa i wykazuje podobieństwo sekwencji aminokwasowej do białka pełniącego funkcję adaptorową – umożliwia przyłączenie ogonka do główki (e = 7 * 10-10) (Gene Bank YP_009213476.1);

ORF 63 – białko to o długości 140 aa jest hipotetycznym produktem ORF 63, na podstawie analizy bioinformatycznej podobieństwa sekwencji aminokwasowej tego białka dopasowano je do białka kapsydu (e = 2 * 10-56) (Gene Bank WP_040264829.1; pfam PF12226.8);

ORF 64 – białko to o długości 349 aa, będące potencjalnym produktem ORF 64, dopasowano w oparciu o podobieństwo sekwencji aminokwasowej do białka kapsydu (e = 0,0) (Gene Bank WP_115601857.1; pfam PF03864.15);

ORF 65 – produkt białkowy tej ORF o długości 133 aa dopasowano na podstawie podobieństwa sekwencji aminokwasowych do białka dekorującego główkę (e = 7 * 10-94) (Gene Bank WP_060425447.1; pfam PF02924.14);

ORF 67 – przypuszczalne białko stanowiące produkt ORF 67 ma długość 286 aa, zaś na drodze analizy podobieństwa sekwencji aminokwasowej tego białka dopasowano je do białka peptydazy z rodziny S49 (e = 0,0) (Gene Bank WP_006708310.1) o aktywności hydratazy 2-enoilo-CoA (EC 3.90.226.10). Białko to najprawdopodobniej uczestniczy w dojrzewaniu kapsydu poprzez degradację białek rusztowania wewnątrz prokapsydu umożliwiając wprowadzenie przez kompleks terminazy genomu do główki kapsydu [Cerritelli i in., 2003; Johnson, 2010];

ORF 68 – jej hipotetyczny produkt białkowy o długości 526 aa wykazuje podobieństwo (ustalone w oparciu o analizę z użyciem programu BLAST P) sekwencji aminokwasowej do sekwencji białka portalowego z rodziny białek bakteriofagów lambda podobnych (e = 0,0) (Gene Bank WP_040262924.1; pfam PF05136.13). Białko to uczestniczy w pakowaniu genomu do prokapsydu, stanowi kanał prowadzący do wnętrza prokapsydu i umożliwia przyłączenie się kompleksowi terminazy, po czym następuje translokacja genomu do prokapsydu [Fujisawa & Morita, 1997] (Podrozdział 1.4);

ORF 69 – domniemane białko kodowane na tej ORF ma długość 87 aa. Analiza sekwencji aminokwasowej z użyciem programu BLAST P wskazuje, iż jest to białko podobne do białka uczestniczącego w przyłączeniu ogonka do główki (ang. head-tail joining protein) (e = 1 * 10-52) (Gene Bank WP_105396969.1; pfam PF02831.15);

ORF 70 – domniemany produkt białkowy ORF 70 to ma długość 659 aa, zaś jego sekwencja aminokwasowa wykazuje podobieństwo do sekwencji aminokwasowej białka będącego dużą podjednostką terminazy (e = 0,0) (Gene Bank WP_060425444.1). Wraz z małą podjednostką, duża podjednostka tworzy kompleks terminazy – gdzie: mała podjednostka terminazy rozpoznaje na nici replikowanego genomu sekwencje cos, zaś duża podjednostka w połączeniu z małą podjednostką łączy się z białkiem portalowym, przeprowadza translokację genomu do główki prokapsydu oraz odcina w miejscu cos zapakowany genom od konkatameru; po czym przyłącza się do kolejnej, niewypełnionej jeszcze główki fagowej [Sun i in., 2010] (Podrozdział 1.4);

ORF 71 – domniemany produkt ORF 71 o długości 199 aa wykazuje podobieństwo sekwencji aminokwasowej do małej podjednostki terminazy (e = 4 * 10-06) (Gene Bank ATS93173.1), której funkcję opisano powyżej (patrz ORF 70);

Nie udało się przewidzieć funkcji produktów ORFów o numerach: 1, 2, 12, 14, 16 17, 22, 23, 24, 25, 31, 35, 37, 39 , 40, 44, 50, 60 i 66.


Tekst udostępniony jest na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0.
Dodatkowe informacje o autorach i źródle znajdują się na stronie dyskusji.