Wstępna charakterystyka bakteriofaga Serratia φOS10/Wyniki i dyskusja

5. Wyniki i dyskusja

5.1 Uzyskanie czystych kultur fagowych z próbki środowiskowej metodą szalek dwuwarstwowych i określenie ich morfologii

W celu uzyskania pojedynczych łysinek stosowano metodę szalek dwuwarstwowych opisaną w Podrozdziale 4.1 oraz jako gospodarzy używano szczepy Serratia spp. OS10 i W54. Uzyskane łysinki, na szalkach z ich policzalną ilością, porównano pod kątem ich morfologii, a wybrane nazwano od „Ł1” do „Ł10”. Niejednolita morfologia sugerowała, że w testowanej próbce znajdują się co najmniej dwa różne fagi (Tabela 8).

Tabela 8. Opis morfologii wyizolowanych łysinek.

Nazwa	Opis morfologii	gospodarz
Ł1	Mała, ø=0,5mm	OS10
Ł2	Duża, ø=1mm, mętna w środku, okrągła	OS10
Ł3	Duża, ø=0,9mm, okrągła z jednym rożkiem	OS10
Ł4	Duża, ø=0,9mm, lekko owalna, mętna w środku, przejrzysta na obwodzie	W54
Ł5	Mała, ø=0,2mm, okrągła, przejrzysta	OS10
Ł6	Mała, ø=0,5mm, kwadratowa, przejrzysta	W54
Ł7	Średnia, ø=0,8mm, 5-kątna, mętna w środku, przejrzysta na krawędzi	W54
Ł8	Duża, ø=0,9mm, okrągła, cała mętna	OS10
Ł9	Mała, ø=0,4mm, okrągła, duży przejrzysty obwód, mały mętny środek	OS10
Ł10	Mała, ø=0,5mm, okrągła, przejrzysta w pełni	OS10

Zwrócono uwagę, że większość łysinek, niezależnie od wielkości, była mętna, zaś wokół krawędzi łysinki Ł9 zaobserwowano wyraźnie przejrzystą strefę. Ten fakt stał się pierwszą przesłanką do postawienia hipotezy, iż w badanej próbce obecne były bakteriofagi łagodne. Materiał z kilku pojedynczych łysinek różniących się morfologią posłużył do namnożenia i izolacji cząstek fagowych (metoda opisana w Podrozdziale 4.2). Uzyskane zawiesiny były następnie mianowane (Podrozdział 4.1) z wykorzystaniem tych samych co wcześniej (patrz wyżej) gospodarzy.

5.2 Analiza restrykcyjna izolatów DNA z badanych czystych kultur fagowych

Z zawiesin cząstek fagowych Ł1, Ł2, Ł3, Ł5, Ł9, Ł10, Ł11, Ł12 oraz Ł13 izolowano DNA zgodnie z metodą opisaną w Podrozdziale 4.3. Otrzymane próbki badano z użyciem aparatu Nano-Drop (Podrozdział 3.9). Na otrzymanych wykresach widoczny był charakterystyczny pik dla długości fali λ = 250 nm, co jest typowe dla DNA. Pozytywny rezultat izolacji genomu fagowego zgodnie z procedurą opisaną w Podrozdziale 4.3 potwierdził, że bakteriofag φOS10 jest bakteriofagiem o materiale genetycznym DNA – gdyby materiałem genetycznym był RNA, doszłoby w tych warunkach doświadczalnych do degradacji, gdyż wykorzystane odczynniki nie są wolne od RNaz. Dla określenia formy DNA, z jakiej zbudowany jest genom, wykonywano elektroforezę genomu nieciętego enzymami restrykcyjnymi (Rycina 17A). Badany genom nie jest ssDNA, ponieważ genomy bakteriofagów ssDNA nigdy nie przekraczają długości 11 knt – nawet w sytuacji, gdyby genom ssDNA osiągał taką długość, to podczas elektroforezy migrowałby o wiele szybciej od dsDNA o identycznej długości, więc uzyskany prążek nie wychodziłby poza skalę wyznaczaną przez migrujący równolegle marker wielkości. W związku z tym, badanym materiałem genetycznym musiał być dsDNA. Ten sam rezultat uzyskano też dla pozostałych próbek.

Rycina 17. Elektroforegram genomowego DNA φOS10 (Ł3). Długość genomu przekracza 10 kbp (A); Elektroforegram rozdziału DNA fagowego po cięciu enzymem Hinc II (B).

W oparciu o określone wcześniej stężenia poszczególnych próbek DNA, poddano je cięciu enzymem restrykcyjnym Hinc II, a następnie wykonano rozdział elektroforetyczny zgodnie z metodą opisaną w Podrozdziale 4.5 (Rycina 17B). Zauważono, że układ prążków był identyczny w każdym torze, co pozwoliło na wniosek, że każda z czystych kultur była tym samym rodzajem faga. Do dalszej analizy wybrano czystą kulturę nazwaną Ł3 ze względu na najwyższe miano tej zawiesiny (Podrozdział 5.1). Badanego bakteriofaga nazwano φOS10.

5.3 Analiza bioinformatyczna

Identyfikacja ORFów w genomie bakteriofaga φOS10 została przeprowadzona z użyciem programu RAST [Decewicz & Radlińska, dane nieopublikowane], a ich adnotację wykonywano w ramach niniejszej pracy programami: Artemis, BLAST P oraz HMMER (Podrozdział 4.17.2).

5.3.1 Analiza genomu bakteriofaga φOS10

Genom φOS10 miał długość 45 027 nt – wielkość ta jest typowa dla przedstawicieli rzędu Caudovirales, jednak wśród innych dotychczas zsekwencjonowanych bakteriofagów infekujących bakterie z rodzaju Serratia jest to długość stosunkowo niewielka: genomy zsekwencjonowanych bakteriofagów Serratia osiągają długości od 39 216 bp (bakteriofag 2050H2, Gene Bank MF285620.1) do 357 154 bp (bakteriofag BF, Gene Bank NC_041917.1), gdzie średnia długość genomu wynosiła 139 444 bp, a mediana 158 616 bp. Zestawienie wszystkich genomów bakteriofagów przedstawiono w Podrozdziale 1.7. Udział poszczególnych zasad azotowych w nici wiodącej zsekwencjonowanego genomu φOS10 przedstawiono w Tabeli 9.

Tabela 9. Zestawienie ilościowe udziału zasad azotowych w genomie φOS10 oraz zawartość par CG.

Zasada	Zawartość [%]	Ilość [nt]
A	23,87%	10750
T	24,52%	11040
G	24,58%	11068
C	27,03%	12169
% GC	51,61%

Zawartość par GC jest mniejsza niż w przypadku genomów bakterii z rodzaju Serratia, które do tej pory zsekwencjonowano np. w szczepie Serratia marcescens subsp. marcescens Db11 wynosi 59,5% [Iguchi i in., 2014]; w szczepie Serratia liquefaciens ATCC 27592 wynosi 55,3% [Nicholson i in., 2013]; zaś w szczepie Serratia proteamaculans 568 wynosi 54,9% [Grkovic i in., 1995]. Sekwencję genomu φOS10 przyrównano z użyciem narzędzia BLAST N do sekwencji genomów innych bakteriofagów infekujących Serratia. Wykryto podobieństwo sekwencji nukleotydowej bakteriofaga φOS10 jedynie do dwóch spośród 20 poznanych i zsekwencjonowanych wcześniej fagów Serratia (Rycina 18):

do bakteriofaga Parlo (Gene Bank MK618715.1) w dwóch segmentach (o długości 381 nt, gdzie e = 2 * 10 - 133; oraz o długości 42 nt, gdzie e = 1 * 10 - 12), co stanowi w sumie 0,67% długości genomu bakteriofaga Parlo;
do bakteriofaga η (Gene Bank NC_021563.1) w czterech segmentach (o długości 96 nt, gdzie e = 2 * 10 ^{- 33}; o długości 98 nt, gdzie e = 2 * 10 ^{- 27}; o długości 35 nt, gdzie e = 3 * 10 ^{- 11} i o długości 32 nt, gdzie e = 1 * 10 ^{- 9}), co stanowi w sumie 0,61% długości genomu bakteriofaga η.

> Eta_1 NC_021563.1 (13351-13446)
caccgagctgcgggaggccaaatgaaagagcgcccagtgattttcaacggtgagatggttcgcgccatcctcgac
ggacgcaagacgcagacacgc
> Eta_2 NC_021563.1 (13942-14039)
tccatttacggggaagaaagctggagcgctaatccctgggtatgggtgatcgagtttcgtcgtgtgggaggtgcg
tgatgccagcaaatgaactgaag
> Eta_3 NC_021563.1 (13035-13069)
tgaaggctgagcgcgatgcgctggctgtggagaat
> Eta_4 NC_021563.1 (15953-15984)
ggcttcaccgtagagggggatgagtagatggc
> Parlo_1 MK618715.1 (16408-16788)
ggctaaccgggaggcgcagccggtgtatcaatgccgcttcttcactaccgatattgacggaaaacaaatcggtga
gtggcaggatatggataaagggttctatgaccaatacgacccacactgccgccgcgttttgttcaccgccccgcc
tgcgctaggagtgccggatggggttatgccaggcggtctaggctactcatcagcgctacctgagtttgaaagcaa
cgacagcgataaggttgttggatatcactgctttatcagcggtcaaactcgaagcgtggaaagccaagagcaggc
gtatgccgacgccaaggctgtaattaacgcctaccgcgccgcaatgctggctcaacccgtaagccagggttacaa
gttacc
> Parlo_2 MK618715.1 (15944-15984)
cgcgccgctggcttcaccgtagagggggatgagtagatggc

Rycina 18 Sekwencje nukleotydowe segmentów genomu φOS10 wykazujące podobieństwo do genomów bakteriofagów η i Parlo.

Sekwencje przedstawione na Rycinie 18 zbadano z użyciem narzędzia BLAST X, w wyniku czego udało się zadnotować jedynie sekwencje:

Parlo_1, którą dopasowano do hipotetycznego białka bakteriofaga Parlo (e = 2 * 10 ^{- 77}) (Gene Bank QBQ72186.1);
Eta_1, którą dopasowano do hipotetycznego białka S. marcescens (e = 8 * 10 ^{- 11}) (Gene Bank TQI84827.1);
Eta_2, którą dopasowano do białka „restriction alleviation protein” z rodziny białek Lar, należącego do S. marcescens (e = 1 * 10 ^{- 8}) (Gene Bank WP_080431124.1). Białko to odpowiedzialne jest za modulację systemów restrykcji i modyfikacji [King & Murray, 1995].

We względu na niskie wartości pokrycia (0,67% dla bakteriofaga Parlo i 0,61% dla bakteriofaga η) nie można uznać tych bakteriofagów za spokrewnione z bakteriofagiem φOS10 – podobieństwo tych sekwencji jest najprawdopodobniej przypadkowe lub spowodowane nabyciem ich na drodze zdarzeń rekombinacyjnych. Powyższe wyniki wykluczają jakiekolwiek istotne podobieństwo genomu bakteriofaga φOS10 do innych dotychczasowo zsekwencjonowanych bakteriofagów Serratia oraz jakichkolwiek innych zsekwencjonowanych bakteriofagów, w związku z czym jest on unikatowy i stanowi ważny wkład w wiedzę o bakteriofagach Serratia. Genom φOS10 przeanalizowano z użyciem programu ARAGORN [Laslett i in., 2004] pod kątem obecności genów kodujących tRNA (Podrozdział 4.17.5), nie znaleziono w genomie sekwencji kodujących tRNA.
W genomie φOS10 zidentyfikowano 71 otwartych ramek odczytu (ORF) o wielkości co najmniej 50 nt. Najmniejszy z nich (ORF 14) ma długość 122 nt, a największy (ORF 45) ma długość 2381 nt. Średnia długość ORF wynosi około 583 nt. Zidentyfikowane ORFy stanowią 91,86% zsekwencjonowanego genomu. ORFy zawarte są zarówno na nici wiodącej i nici komplementarnej, z czego 43 ORFy znajdują się na nici wiodącej, a 28 ORFów znajduje się na nici komplementarnej. Adnotację genomu φOS10 wykonywano z wykorzystaniem programu Artemis, w którym możliwa jest wizualizacja ORFów (Rycina 19). Każdej ORF nadano numery porządkowe od 1 do 71.

Rycina 19. Analiza bioinformatyczna z użyciem programu Artemis.

Dla każdej ORF zaznaczonej w sekwencji nukleotydowej wygenerowano z pomocą programu Artemis sekwencje białek przez nie kodowanych, dla których następnie z użyciem programu BLAST P wyszukiwano w bazach UniProt oraz NCBI rekordów o największym pokryciu, największej identyczności sekwencji oraz najmniejszej „E-wartości” (Podrozdziały 1.6.3 i 4.17). Wyniki adnotacji zestawiono w Tabeli 10. Domniemany produkt białkowy jednej ze zidentyfikowanych ORF został zaadnotowany jako integraza, co stanowiło następną przesłankę do postawienia hipotezy, że bakteriofag φOS10 jest łagodny (pierwszą były mętne łysinki, Podrozdział 5.1). Innymi przypuszczalnymi produktami białkowymi ORFów były między innymi białko portalowe (ORF 68) i terminaza (ORF 70). Nie udało się dopasować do białek o znanych funkcjach domniemanych produktów białkowych 19 ORFów spośród 71 zidentyfikowanych (co stanowi około 27%). Rezultat ten jest satysfakcjonujący zważywszy na fakt, że w innych przypadkach odsetek ORFów o niezidentyfikowanej funkcji może wynosić 33% [Dziewit i in., 2014] lub nawet 60% [Santos i in., 2011]. Przy przewidywaniu funkcji białek fagowych bardzo pomocna jest lokalizacja kodujących je ORFów, gdyż genomy wirusów mają budowę modułową, jak wspomniano w podrozdziale. 1.3. W związku z tym położenie ORFu o nieznanej funkcji, w otoczeniu ORFów, którym przypisuje się określone funkcje, jest wskazówką co do prawdopodobnej funkcji jej produktu białkowego. Należy podkreślić, że funkcje przypisane produktom zidentyfikowanych ORFów są tylko przypuszczalne, potwierdzenie tych funkcji wymaga testów eksperymentalnych. Obok przeszukania programem BLAST P jeszcze innym sposobem przewidywania funkcji białek jest dopasowanie ich sekwencji aminokwasowych do sekwencji domen białek, których funkcje określono eksperymentalnie. W niniejszej pracy wykorzystano do tego celu program HMMER (Podrozdział 1.6.4).

Tabela 10. Zestawienie wyników adnotacji ORFów faga φOS10. Nazwy wszystkich domniemanych funkcji białek zapisano w języku angielskim, ze względu na brak polskich odpowiedników dla nazw niektórych białek.

ORF	Region kodujący (bp)	Orientacja	Wielkość białka (aa)	Prawdopodobna funkcja (motywy i domeny)	Największe podobieństwo (program BLAST P)
ORF	Region kodujący (bp)	Orientacja	Wielkość białka (aa)	Prawdopodobna funkcja (motywy i domeny)	Procent identyczności (aminkwasyaminokwasy^§) (koordynaty motywu)	e-value	Organizm	Numer w GenBank (numer pfam) (numer EC) (numer supfam)
1	77-301	←	74	hypothetical protein	38/68(56%)	3 * 10^-18	Serratia marcescens	WP_072264995.1
2	280-525	←	81	hypothetical protein (Protein of unknown function)	61/81(75%)	4 * 10^-33	Serratia marcescens	WP_118892208.1 (PF11684.8)
3	550-1194	←	214	minor tail protein (coiled-coil motive)	67/212(32%)	7 * 10^-28	Rhodobacter phage RcSaxon	AKY02713.1
4	1236-1376	←	46	DEAD/DEAH box helicase (Zinc finger, C2H2 type)	14/31(45%)	3 * 10^-10	Roseomonas stagni	WP_092963283.1 (PF00096.26)
5	1373-1627	←	84	DNA polymerase III subunit theta (DNA polymerase III, theta subunit)	82/84(98%)	8 * 10^-62	Serratia proteamaculans	WP_115059749.1 (PF06440.11)
6	2037-2561	←	174	DUF2570 domain-containing protein (Phage shock protein B)	123/166(74%)	7 * 10^-93	Serratia sp. YD25	WP_063919321.1 (PF06667.12)
7	2558-3088	←	176	putative lysis protein (Phage lysozyme)	136/175(78%)	2 * 10^-107	Pectobacterium phage ZF40	YP_007006943.1 (PF00959.19)
8	3090-3386	←	98	phage 21-like group II holin (Bacteriophage holin family HP1)	15/50(30%)	1 * 10^-06	Bacteriophage APSE-7	WP_016857351.1 (PF16080.5)
9	3554-3928	←	124	hypothetical protein (RcsF lipoprotein)	117/124(94%)	4 * 10^-91	Serratia proteamaculans	WP_115058997.1 (PF16358.5)
10	4225-4929	←	234	antitermination protein (Antitermination protein)	218/234(93%)	3 * 10^-169	Serratia proteamaculans	WP_115059758.1 (PF03589.13)
11	4926-5282	←	118	RusA family crossover junction endodeoxyribonuclease (Endodeoxyribonuclease RusA)	117/118(99%)	8 * 10^-90	Serratia marcescens	WP_060431945.1 (PF05866.11)
12	5279-6253	←	324	DUF968 domain-containing protein (Protein of unknown function DUF968)	318/324(98%)	0,0	Serratia proteamaculans	WP_115059762.1 (PF06147.11)
13	6250-7272	←	340	DNA-binding protein (Conserved phage Cterminus Phg_2220_C)	313/339(92%)	0,0	Serratia liquefaciens ATCC 27592	AGQ28749.1 (PF09524.10)
14	7269-7391	←	40	DUF4222 domaincontaining protein (Domain of unknown function DUF4222)	39/40(98%)	3 * 10^-29	Serratia liquefaciens	WP_116690624.1 (PF13973.6)
15	7441-8181	←	246	KilA-N domain-containing protein (KilA-N domain)	240/245(98%)	0,0	Serratia liquefaciens	WP_116690625.1 (PF04383.13)
16	8196-8468	←	90	hypothetical protein	88/90(98%)	6 * 10^-68	Serratia liquefaciens	WP_116690626.1
17	8477-8791	←	104	hypothetical protein	98/104(94%)	4 * 10^-72	Serratia proteamaculans	WP_115059769.1
18	8809-8961	←	50	XRE family transcriptional regulator	49/50(98%)	7 * 10^-37	Serratia proteamaculans	WP_115059771.1
19	9156-9896	→	246	XRE family transcriptional regulator (Cro/C1-type HTH DNA-binding domain)	245/246(99%) (18-78)	0,0	Serratia proteamaculans	WP_115059773.1 (PF13443.6)
20	10433-10696	→	87	glycosyl transferase family 1, partial (Putative pyruvate format-lyase activating enzyme DUF1786)	18/40(45%)	1 * 10^-08	Desulfosporosinus sp. BICA1-9	KJS90102.1 (PF08735.10)
21	10714-10923	→	69	lysine-2,3-aminomutase, EmpB	57/69(83%)	2 * 10^-43	Serratia grimesii	WP_037419410.1
22	10953-11081	→	42	hypothetical protein HMPREF1564_3580 (Helical box domain of E3 ubiquitin-protein ligase HECW1)	28/38(74%)	1 * 10^-19	Providencia alcalifaciens R90-1475	EUD08463.1 (PF18436.1)
23	11487-11699	→	70	hypothetical protein (Ribosomal protein L33)	67/70(96%)	2 * 10^-52	Serratia proteamaculans	WP_115059007.1 (PF00471.20)
24	11693-11836	→	47	hypothetical protein M495_10455 (transmembrane motive)	47/47(100%)	8 * 10^-36	Serratia liquefaciens ATCC 27592	AGQ30852.1
25	11839-12075	→	78	hypothetical protein	78/78(100%)	1 * 10^-60	Serratia liquefaciens	WP_116690632.1
26	12079-12921	→	280	chromosome partitioning protein ParB (Crp-like helix-turnhelix domain)	274/280(98%)	0,0	Serratia proteamaculans	WP_012006454.1 (PF13545.6)
27	12905-13375	→	156	Gp37 (tail fiber protein)	49/113(43%)	1 * 10^-25	Escherichia virus HK97	NP_037722.1
28	13372-14019	→	215	hypothetical protein (ASCH domain)	145/214(68%)	4 * 10^-91	Serratia marcescens	WP_101456383.1 (PF04266.14)
29	14019-14240	→	73	molecular chaperone DnaJ (Restriction alleviation protein Lar)	64/70(91%)	4 * 10^-50	Serratia proteamaculans	WP_085115658.1 (PF14354.6)
30	14233-14496	→	87	hypothetical protein	73/87(84%)	3 * 10^-17	Serratia marcescens	WP_141958176.1
31	14489-14758	→	89	hypothetical protein	72/89(81%)	4 * 10^-51	Serratia marcescens	WP_060429489.1
32	14777-15259	→	160	putative phage replication protein	17/48(35%)	2 * 10^-06	Lactobacillus phage phiPYB5	YP_009167807.1
33	15259-15450	→	63	hypothetical protein BVG97_16260 ead/Ea22-like family protein	52/59(88%) 32/66(48%)	3 * 10^-38 4 * 10^-12	Serratia marcescens Serratia marcescens	ASL89067.1 WP_052475410.1
34	15443-15979	→	178	ead/Ea22-like family protein (Ead/Ea22-like protein)	48/57(84%)	1 * 10^-32	Serratia quinivorans	WP_112347612.1 (PF13935.6)
35	15980-16234	→	84	hypothetical protein	78/84(93%)	1 * 10^-62	Serratia plymuthica	WP_064798928.1
36	16244-16945	→	233	putative pmgU (Xeroderma pigmentosum group Bhelicase damage recognition domain)	25/43(58%)	2 * 10^-16	Escherichia coli 2-474-04_S4_C2	KDZ03155.1 (PF18458.1)
37	16991-17260	→	89	uncharacterised protein	87/89(98%)	1 * 10^-66	Serratia marcescens	SAY41700.1
38	17276-17494	→	72	hypothetical protein (Ribonuclease R winged-helix domain)	66/69(96%)	5 * 10^-49	Serratia sp.	WP_046372826.1 (PF08461.10)
39	17514-17723	→	69	hypothetical protein	68/69(99%)	6 * 10^-53	Serratia liquefaciens	WP_116691155.1
40	17726-18106	→	126	hypothetical protein	125/126(99%)	2 * 10^-98	Serratia liquefaciens	WP_116690638.1
41	18122-18304	→	60	ANR family transcriptional regulator	59/60(98%)	2 * 10^-44	Serratia quinivorans	WP_112347617.1
42	18307-18969	→	220	DNA methyltransferase (MT-A70) (S-adenosyl-Lmethionine-dependent methyltransferases)	208/220(95%)	4 * 10^-164	Serratia liquefaciens	WP_046372823.1 (PF05063.14) (53335)
43	19351-20514	→	387	site-specific integrase (Phage integrase family) (Lambda integrase-like, catalytic core)	375/387(97%)	0,0	Serratia grimesii	WP_037419381.1 (PF00589.22) (56350)
44	20794-21699	←	301	hypothetical protein	262/301(87%)	0,0	Serratia marcescens	WP_060706314.1
45	21700-24081	←	793	tail lysin	83 to 176 25/95(26%) 154 to 220 19/76(25%) 295 to 306 6/12(50%) 1155 to 1219 20/71(28%) 560 to 567 5/8(63%)	1 * 10^-04	Bacillus phage SageFayge	YP_009280906.1
46	24191-24364	→	57	lysyl-tRNA synthetase, class I (transmembrane domain)	43/56(77%)	5 * 10^-32	Photorhabdus luminescens BA1	EYU16219.1
47	24402-24674	→	90	transcriptional regulator (lambda repressor-like DNA-binding domains)	84/90(93%)	2 * 10^-64	Serratia marcescens	WP_072269370.1 (1.10.260.40)
48	24684-25814	→	376	Acyltransferase (Acyltransferase family)	339/376(90%)	0,0	Serratia marcescens	WP_072269371.1 (PF01757.22)
49	25845-26333	←	162	phage tail protein, partial (Pectinesterase domain)	51/62(82%)	8 * 10^-36	Bacillus sp. SRB_28	RAN85254.1 (EC 3.1.1.11)
50	26377-27051	←	224	DUF2313 domain-containing protein (DUF2313)	211/224(94%)	2 * 10^-165	Serratia marcescens	WP_060441827.1 (PF10076.9)
51	27048-28196	←	382	baseplate J/gp47 family protein (Baseplate J-like protein)	368/382(96%)	0,0	Serratia sp. C-1	WP_062790438.1 (PF04865.14)
52	28200-28637	←	145	putative tail protein (Phage protein GP46)	19 to 98 43/82(52%) 119 to 136 8/18(44%) 53 to 66 4/14(29%)	3 * 10^-23	Enterobacteria phage SfI	WP_000424732.1 (PF07409.12)
53	28634-29224	←	196	Phage baseplate assembly protein V (Bacteriophage Mu Gp45 protein) (Phage spike trimer) (Acetyl-CoAcarboxylase domain)	182/196(93%) (19 to 117) (126 to 163) (83 to 145)	2 * 10^-132	Serratia proteamaculans	SMB46877.1 (PF06890.12) (PF18715.1) (EC 6.4.1.2)
54	29224-30294	←	356	phage tail protein (Phage late control gene D protein GPD)	345/356(97%)	0,0	Serratia proteamaculans	WP_085118850.1 (PF05954.11)
55	30291-31694	←	467	dna circulation family protein (DNA circularisation protein N-terminus)	421/467(90%)	0,0	Lasius niger	KMQ87046.1 (PF07157.12)
56	31731-33650	←	639	lytic transglycosylase domain-containing protein (MSP7-like protein C-terminal domain)	385/655(59%)	0,0	Serratia sp. Nf2	WP_107228138.1 (PF12948.7)
57	33772-34062	←	96	phage tail assembly protein (Phage tail assembly chaperone proteins, E, or 41 or 14)	92/96(96%)	7 * 10^-71	Serratia sp. C-1	WP_062790456.1 (PF10109.9)
58	34064-34432	←	122	phage tail protein (Phage tail tube protein)	122/122(100%)	1 * 10^-92	Serratia sp. C-1	WP_062790459.1 (PF10618.9)
59	34442-35947	←	501	phage tail protein (Phage tail sheath protein beta-sandwich domain) (Phage tail sheath protein subtilisin-like domain) (Phage tail sheath C-terminal domain)	474/501(95%) (99 - 246) (210 - 373) (381 - 495)	0,0	Serratia proteamaculans	WP_085118840.1 (PF17481.2) (PF04984.14) (PF17482.2)
60	35944-36138	←	64	DUF2635 domain-containing protein (DUF2635)	59/64(92%) (3 - 48)	4 * 10^-44	Serratia sp. C-1	WP_062790465.1 (PF10948.8)
61	36143-36685	←	180	ATP-binding protein (coiled-coil motive)	167/180(93%) (76 - 110)	2 * 10^-129	Serratia sp. Nf2	WP_107228160.1
62	36682-37026	←	114	head-to-tail joining protein (Phage tail proteins domain)	34/104(33%)	7 * 10^-10	Rhodobacter phage RcRhea	YP_009213476.1 (EC 2.40.10.180)
63	37026-37448	←	140	hypothetical protein (putative capsid protein)	109/140(78%)	2 * 10^-56	Serratia symbiotica	WP_040264829.1 (PF12226.8)
64	37450-38499	←	349	major capsid protein (Phage major capsid	322/349(92%)	0,0	Citrobacter freundii	WP_115601857.1 (PF03864.15) (3.15.30.10) (3.30.1930.10) (3.15.30.10)
65	38603-39004	←	133	head decoration protein (Bacteriophage lambda head decoration protein D)	123/133(92%)	7 * 10^-94	Serratia marcescens	WP_060425447.1 (PF02924.14)
66	39004-39603	←	199	Uncharacterised protein	168/201(84%)	3 * 10^-89	Serratia marcescens	CVA09345.1
67	39607-40467	←	286	S49 family peptidase (2-enoyl-CoA Hydratase)	272/285(95%)	0,0	Serratia symbiotica	WP_006708310.1 (3.90.226.10)
68	40464-42044	←	526	phage portal protein (Phage portal protein, lambda family)	503/526(96%)	0,0	Serratia symbiotica	WP_040262924.1 (PF05136.13)
69	42110-42373	←	87	phage head-tail adapter protein (Head-to-tail joining protein W)	72/87(83%)	1 * 10^-52	Photorhabdus luminescens	WP_105396969.1 (PF02831.15)
70	42382-44361	←	659	phage terminase large subunit family protein (Phage terminase large subunit GpA)	635/659(96%)	0,0	Serratia marcescens	WP_060425444.1 (PF05876.12)
71	44333-44932	←	199	terminase small subunit (Homeodomain-like domain)	50/201(25%)	4 * 10^-06	Synechococcus phage S-LBS1	ATS93173.1 (PF13384.6)

Za pomocą narzędzia BLAST P udało się określić możliwe funkcje aż 54 ORFów. Dalsza analiza, bazująca na obecności domen białkowych i ukrytych modeli Markowa, umożliwiła określenie potencjalnych funkcji dla kolejnych 7 ORFów [Söding, 2004].

5.3.2 Adnotacja otwartych ramek odczytu w genomie bakteriofaga φOS10

Na drodze analizy bioinformatycznej z użyciem programów BLAST P oraz HMMER przeprowadzono adnotację ORFów, co umożliwiło poznanie potencjalnych funkcji domniemanych produktów białkowych:

ORF 3 – potencjalne białko o długości 214 aa, będące produktem tej ORF, wykryto podobieństwo tego białka do białka strukturalnego ogonka faga Rhodobacter RcSaxon (e = 7 * 10^-28) (Gene Bank AKY02713.1). Białko to uczestniczy w etapie składania wirusowych cząstek potomnych i jest niezbędne do wytworzenia funkcjonalnego ogonka [Bollivar i in., 2016] (Podrozdział 1.4);

ORF 4 – koduje potencjalne białko funkcji helikazy DEAD/DEAH (e = 3 * 10^-10) długości 46 aa o prawdopodobnej (Gene Bank WP_092963283.1), białko to posiada motyw palca cynkowego typu C2H2 (pfam PF00096.26), który jest identyfikowany m.in. u regulatorów transkrypcji [Rohozková i in., 2014];

ORF 5 – domniemany produkt tej ORF o długości 84 aa na podstawie podobieństwa sekwencji aminokwasowych dopasowano do podjednostki theta polimerazy III DNA (e = 8 * 10^-62) (Gene Bank WP_115059749.1; pfam PF06440.11). Podjednostka θ jest jedną z 3 podjednostek tworzących heterodimer polimerazy III DNA razem z podjednostkami α i ε [Slater i in., 1994];

ORF 6 – prawdopodobny produkt tego genu o długości 174 aa wykazuje podobieństwo do białka Phage shock protein B (e = 7 * 10^-93) (Gene Bank WP_063919321.1; pfam PF06667.12), którego gen go kodujący zidentyfikowano w genomie Serratia sp. YD25. Ekspresja białek z grupy Psp (ang. phage shock protein) zachodzi pod wpływem czynników stresowych takich jak: szok cieplny, obecność etanolu w otoczeniu, szok osmotyczny lub infekcja fagowa [Brissette i in., 1991];

ORF 7 – potencjalny produkt białkowy o długości 176 aa powstający na drodze ekspresji ORF 7, wykazuje podobieństwo do domeny lizozymu faga Pectobacterium ZF40 (e = 2 * 10^-107) (Gene Bank YP_007006943.1; pfam PF00959.19);

ORF 8 – przypuszczalny produkt białkowy ma długość 98 aa, który wykazuje podobieństwo do białka holiny grupy II (e = 1 * 10^-06) (Gene Bank WP_016857351.1) zawierającego domenę właściwą dla bakteriofagowych holin z rodziny HP1 (pfam PF16080.5). Mechanizm działania tego białka polega na formowaniu porów w strukturze błony komórkowej gospodarza, dzięki czemu możliwe jest dotarcie fagowego lizozymu do ściany komórkowej [Esposito i in., 1996]. Oba te białka kodowane są przez geny zlokalizowane blisko siebie (w tym przypadku są to następujące po sobie ORF 7 i ORF 8);

ORF 9 – w jego domniemanym produkcie białkowym o długości 124 aa wykryto podobieństwo do lipoproteiny RcsF (e = 4 * 10^-91) (Gene Bank WP_115058997.1; pfam PF16358.5);

ORF 10 – hipotetyczne białko kodowane przez tą ORF ma długość 234 aa. Wykazuje podobieństwo do białka antyterminatora (e = 3 * 10-169) (Gene Bank WP_115059758.1; pfam PF03589.13) kodowanego w genomie S. proteamaculans. Mechanizm działania antyterminatora bazuje na interakcji tego białka z polimerazą RNA, co prowadzi do pominięcia sekwencji terminatora i dalszej transkrypcji [Roberts i in., 1998];

ORF 11 – potencjalne białko kodowane przez tą ORF ma długość 118 aa. Białko wykazuje podobieństwo do endodeoksyrybonukleazy RusA (e = 8 * 10^-90) (Gene Bank WP_060431945.1) kodowanej przez S. marcescens, Białko o takiej funkcji jest u organizmów komórkowych zaangażowane w naprawę chromosomalnego DNA na drodze rekombinacji homologicznej [Rafferty i in., 2003]. Jak wspomniano w Podrozdziale 1.3 fagi wykazują mozaikową budowę genomu, Jest to możliwe dzięki fagowym rekombinazom przeprowadzającym wymianę modułów funkcjonalnych;

ORF 13 – potencjalne białko o długości 340 aa będące produktem ORF 13 wykazuje podobieństwo do białka wiążącego DNA (e = 0,0) (Gene Bank AGQ28749.1) kodowanego przez S. liquefaciens ATCC 27592;

ORF 15 – hipotetyczne białko będące produktem tej ORF ma długość 246 aa. W sekwencji aminokwasowej tego białka wykryto podobieństwo do domeny KilA-N (e = 0,0) (Gene Bank WP_116690625.1; pfam PF04383.13) kodowanego przez S. liquefaciens;

ORF 18 – białko to będące przypuszczalnym produktem ORF 18 ma długość 50 aa. Na podstawie analizy sekwencji aminokwasowych za pomocą programu BLAST P wykryto podobieństwo białka do regulatora transkrypcji z rodziny białek XRE (ang. xenobiotic responsive element) (e = 7 * 10^-37) (Gene Bank WP_115059771.1) kodowanego przez S. proteamaculans. Białka z tej grupy indukowane są pod wpływem substancji ksenobiotycznych [Matsushita i in., 1993];

ORF 19 – białko to będące prawdopodobnym produktem ORF 19 ma długość 246 aa. Podobnie jak w przypadku ORF 18, na podstawie analizy programem BLAST P wykryto podobieństwo jego sekwencji aminokwasowych do regulatora transkrypcji z rodziny białek XRE (e = 0,0) (Gene Bank WP_115059773.1). U domniemanego produktu ORF 19 zidentyfikowano też domenę HTH wiążącą DNA typu Cro/C1 (e = 2,4 * 10^-05) (pfam PF13443.6) – białko to jest więc najprawdopodobniej przełącznikiem uczestniczącym w decyzji o wejściu w cykl lityczny lub lizogenny [Echols i in., 1973];

ORF 20 – domniemany produkt tej ORF o długości 87 aa wykazuje podobieństwo do białka o funkcji glikozylotransferazy (e = 1 * 10^-08) (Gene Bank KJS90102.1). Znaczenie tego białka w cyklu infekcyjnym nie jest bliżej poznane;

ORF 21 – hipotetyczne białko o długości 69 aa wykazuje podobieństwo do białka pełniącego funkcję lizyno-2,3-aminomutazy (e = 2 * 10^-43) (Gene Bank WP_037419410.1) kodowanego przez Serratia grimesii. Zadaniem tego typu białek jest transport grupy aminowej z pozycji α w pozycję β cząsteczki lizyny [Lepore i in., 2005];

ORF 26 – przypuszczalny produkt białkowy tej ORF ma długość 280 aa i wykazuje podobieństwo do białka partycyjnego ParB (e = 0,0) (Gene Bank WP_012006454.1) kodowanego przez S. proteamaculans;

ORF 27 – domniemany produkt białkowy ORF 27 ma długość 156 aa, wykazuje podobieństwo do białka włókienek ogonka (e = 1 * 10-25) (Gene Bank NP_037722.1) kodowanego przez faga Escherichia HK97. Włókienka ogonka rozpoznają na powierzchni bakterii specyficzne receptory [Krasnykh i in., 2001];

ORF 28 – przypuszczalne białko będące produktem tej ORF ma długość 215 aa. wykazuje podobieństwo do domeny ASCH (e = 4 * 10-91) (Gene Bank WP_101456383.1 kodowanego przez S. marcescens), która występuje u białek procesujących RNA [Iyer i in., 2005];

ORF 29 – domniemany produkt ORF 29 o długości 73 aa wykazuje podobieństwo do białka chaperonowego DnaJ uczestniczącego w prawidłowym fałdowaniu białek (e = 4 * 10-50) (Gene Bank WP_085115658.1) [Cyr i in., 1994];

ORF 32 – przypuszczalny produkt białkowy kodowany przez tą ORF ma długość 160 aa i wykazuje podobieństwo do białka replikacyjnego (e = 2 * 10^-06) (Gene Bank YP_009167807.1). Mechanizm replikacji omówiono w Podrozdziale 1.4;

ORF 33 – domniemany produkt białkowy o długości 63 aa będący produktem ORF 33 dopasowano na podstawie podobieństwa sekwencji aminokwasowych do białka z rodziny ead/Ea22-podobnych. Przedstawiciele tej rodziny są białkami wczesnymi replikacji bakteriofagów λ oraz P22 [ncbi.nlm.nih.gov] (e = 4 * 10^-12) (Gene Bank WP_052475410.1);

ORF 34 – białko będące potencjalnym produktem ORF 34 ma długość 178 aa, w oparciu o podobieństwo sekwencji aminokwasowych dopasowano je do białek z rodziny ead/Ea22podobnych (patrz ORF 33) (e = 1 * 10^-32) (Gene Bank WP_112347612.1; pfam PF13935.6);

ORF 36 – w domniemanym produkcie białkowym o długości 233 aa kodowanym przez tą ORF odnotowano podobieństwo sekwencji aminokwasowej do domeny odpowiedzialnej za rozpoznawanie uszkodzeń w DNA występującą w helikazach z grupy B (e = 2 * 10^-16) (Gene Bank KDZ03155.1; pfam PF18458.1) [Seki i in., 1988];

ORF 41 – hipotetyczne białko o długości 60 aa kodowane przez tą ORF dopasowano w oparciu o podobieństwo sekwencji aminokwasowych do białek z rodziny regulatorów transkrypcji ANR (e = 2 * 10^-44) (GeneBank WP_112347617.1);

ORF 42 – produkt tej ORF został doświadczalnie scharakteryzowany. Jego długość wynosi 220 aa. Wykryto u niego (Gene Bank WP_046372823.1; pfam PF05063.14) podobieństwo do domeny MT-A70 (e = 4 * 10^-164) obecnej w białkach z rodziny metylotransferaz (MTaz) S-adenozylo-L-metionino-zależnych (supfam 53335). U wirusów prokariotycznych wykryte białko może przeprowadzać modyfikacje adenin w genomie fagowym, dzięki czemu niemożliwe staje się rozpoznanie specyficznych sekwencji przez enzymy restrykcyjne gospodarza [Wilson i in., 1991], nie wyklucza się jednak innej funkcji poznanej MTazy. Gen badanego białka sklonowano, a następnie ustalono, że badane białko jest w pełni funkcjonalną MTazą DNA o specyficzności GATC [Radlińska, dane nieopublikowane]. Taką samą specyficzność ma MTaza typu Dam w rodzaju Serratia [Ostendorf i in., 1999]. MTaza Dam Serratia i ORF42 nie wykazują podobieństwa sekwencji aminokwasowej;

ORF 43 – domniemane białko będące produktem ORF 43 ma długość 387 aa i wykazuje podobieństwo do białka z rodziny integraz fagowych (e = 0,0) (Gene Bank WP_037419381.1; pfam PF00589.22) kodowanego przez S. grimesii, zawiera rdzeń katalityczny integraz fagów lambda-podobnych (supfam 56350). Integrazy fagów lambda-podobnych należą do grupy rekombinaz tyrozynowych, które za pośrednictwem aktywnej katalitycznie tyrozyny przeprowadzają cięcie rozpoznanej sekwencji attB w chromosomie gospodarza oraz sekwencji attP w genomie fagowym, co prowadzi do miejscowo specyficznej rekombinacji między obydwoma sekwencjami i w konsekwencji do wejścia bakteriofaga w stan lizogenii (Podrozdział 1.5.1). Do swojej aktywności zazwyczaj wymagają białek pomocniczych kodowanych na chromosomie bakteryjnym lub w genomie fagowym; białka te biorą też udział w wycięciu profaga [Groth & Calos, 2004];

ORF 45 – przypuszczalny produkt białkowy tej ORF ma długość 793 aa i jest najdłuższym domniemanym białkiem spośród wszystkich rozpatrywanych w niniejszej pracy. Analiza jego sekwencji aminokwasowej z użyciem programu BLAST P wskazuje na podobieństwo do endolizyny ogonka bakteriofaga SageFayge infekującego bakterie z rodzaju Bacillus (e = 1 * 10^-04) (Gene Bank YP_009280906.1);

ORF 46 – domniemane białko kodowane przez ORF 46 ma długość 57 aa i wykazuje podobieństwo do syntetaz lizylo-tRNA klasy I (e = 5 * 10^-32) (Gene Bank EYU16219.1). Białka z tej rodziny przyłączają cząsteczki aminokwasu lizyny tRNA tworząc amino-acylotRNA wykorzystywane później w syntezie białek na rybosomach [Onesti i in., 1995];

ORF 47 – przypuszczalny produkt białkowy tego genu ma długość 90 aa. Na podstawie analizy bioinformatycznej wykazano jego podobieństwo do regulatorów transkrypcji (e = 2 * 10^-64) (Gene Bank WP_072269370.1), rozpoznano w nim domenę represora lambdapodobnego wiążącą DNA (EC 1.10.260.40);

ORF 48 – hipotetyczne białko kodowane na ORF nr 48 o długości 376 aa dopasowano w oparciu o podobieństwo sekwencji aminokwasowych do białka będącego acetylotransferazą (e = 0,0) (Gene Bank WP_072269371.1). Białko acetylotransferaza należy do rodziny acetylotransferaz (pfam PF01757.22);

ORF 49 – przypuszczalny produkt białkowy o długości 162 aa wykazuje podobieństwo do białka ogonka (e = 8 * 10^-36) (Gene Bank RAN85254.1). W obrębie sekwencji aminokwasowej tego białka odnotowano podobieństwo do domeny pektynoesterazy (EC 3.1.1.11). Potencjalną funkcją tego białka może być hydroliza struktur ściany komórkowej w trakcie penetracji;

ORF 51 – domniemane białko będące produktem tego genu jest długości 382 aa. Na podstawie podobieństwa sekwencji aminokwasowej tego białka dopasowano je do białka budującego płytkę podstawową (ang. baseplate) (e = 0,0) (Gene Bank WP_062790438.1). Jest to struktura stanowiąca zakończenie ogonka, która bezpośrednio styka się z powierzchnią infekowanej bakterii. Uczestniczy ona w rozpoznaniu komórki gospodarza, adsorpcji, transdukcji sygnału o prawidłowym zaadsorbowaniu do komórki oraz we wstrzyknięciu genomu wirusowego do komórki [Kostyuchenko i in., 2003];

ORF 52 – hipotetyczny produkt białkowy tej ORF o długości 145 aa dopasowano w oparciu o podobieństwo sekwencji aminokwasowych do białka strukturalnego ogonka (e = 3 * 10^-23) (Gene Bank WP_000424732.1) o bliżej nieokreślonej funkcji;

ORF 53 – domniemane białko będące produktem tej ORF ma długość 196 aa. Sekwencja aminokwasowa tego białka wykazuje podobieństwo do sekwencji białka budującego płytkę podstawową (ang. baseplate) (e = 2 * 10^-132) (Gene Bank SMB46877.1) (patrz ORF 51);

ORF 54 – hipotetyczne białko będące produktem tej ORF ma długość 356 aa. Białko to w oparciu o podobieństwo sekwencji aminokwasowych zostało dopasowane do białka strukturalnego ogonka (e = 0,0) (Gene Bank WP_085118850.1) o bliżej nieokreślonej funkcji;

ORF 55 – produkt białkowy tej ORF ma długość 467 aa. Na podstawie podobieństwa sekwencji aminokwasowej tego białka dopasowano je do rodziny białek cyrkulujących DNA (e = 0,0) (Gene Bank KMQ87046.1). Ich rolą jest nadanie kolistej struktury genomowi bakteriofaga i wraz z innymi genami wczesnymi ulega ekspresji niedługo po wprowadzeniu do komórki gospodarza. W tym procesie przeprowadzanym przez białka z tej rodziny dochodzi do ligacji końców genomu (u niektórych bakteriofagów zachodzi to w sekwencji cos) [Novick i in., 2010];

ORF 56 – jej potencjalny produkt ma długość 639 aa, zaś jego sekwencja wykazuje podobieństwo do domeny litycznej transglikozylazy (e = 0,0) (GeneBank WP_107228138.1). Białko to najprawdopodobniej może uczestniczyć w lizie komórki na drodze degradacji peptydoglikanu.

ORF 57 – produkt tej ORF o długości 96 aa, wykryto w nim podobieństwo do fagowych białek składania (e = 7 * 10^-71) (Gene Bank WP_062790456.1) posiada domenę chaperonową fagowego białka E (pfam PF10109.9). Białko to uczestniczy w prawidłowym fałdowaniu monomerów białkowych tworzących ogonek u bakteriofagów z rodziny Myoviridae [pfam.xfam.org];

ORF 58 – potencjalny produkt białkowy tej ORF o długości 122 aa wykazuje podobieństwo sekwencji aminokwasowych do białka strukturalnego ogonka (e = 1 * 10^-92) (Gene Bank WP_062790459.1) o bliżej nieokreślonej funkcji;

ORF 59 – potencjalny produkt ORF 59 jest białkiem fagowym o długości 501 aa (e = 0,0) (Gene Bank WP_085118840.1). W sekwencji aminokwasowej tego potencjalnego białka odnotowano podobieństwo do 3 domen, które mogą w tym białku występować. Domeny te występują w białkach budujących pochewkę ogonka (pfam PF17481.2, PF04984.14 i PF17482.2);

ORF 61 – jej hipotetyczny produkt białkowy o długości 180 aa dopasowano według podobieństwa sekwencji aminokwasowej do białka pomocniczego wiążącego ATP (e = 2 * 10^-129) (Gene Bank WP_107228160.1);

ORF 62 – domniemane białko będące produktem tej ORF to ma długość 114 aa i wykazuje podobieństwo sekwencji aminokwasowej do białka pełniącego funkcję adaptorową – umożliwia przyłączenie ogonka do główki (e = 7 * 10^-10) (Gene Bank YP_009213476.1);

ORF 63 – białko to o długości 140 aa jest hipotetycznym produktem ORF 63, na podstawie analizy bioinformatycznej podobieństwa sekwencji aminokwasowej tego białka dopasowano je do białka kapsydu (e = 2 * 10^-56) (Gene Bank WP_040264829.1; pfam PF12226.8);

ORF 64 – białko to o długości 349 aa, będące potencjalnym produktem ORF 64, dopasowano w oparciu o podobieństwo sekwencji aminokwasowej do białka kapsydu (e = 0,0) (Gene Bank WP_115601857.1; pfam PF03864.15);

ORF 65 – produkt białkowy tej ORF o długości 133 aa dopasowano na podstawie podobieństwa sekwencji aminokwasowych do białka dekorującego główkę (e = 7 * 10^-94) (Gene Bank WP_060425447.1; pfam PF02924.14);

ORF 67 – przypuszczalne białko stanowiące produkt ORF 67 ma długość 286 aa, zaś na drodze analizy podobieństwa sekwencji aminokwasowej tego białka dopasowano je do białka peptydazy z rodziny S49 (e = 0,0) (Gene Bank WP_006708310.1) o aktywności hydratazy 2-enoilo-CoA (EC 3.90.226.10). Białko to najprawdopodobniej uczestniczy w dojrzewaniu kapsydu poprzez degradację białek rusztowania wewnątrz prokapsydu umożliwiając wprowadzenie przez kompleks terminazy genomu do główki kapsydu [Cerritelli i in., 2003; Johnson, 2010];

ORF 68 – jej hipotetyczny produkt białkowy o długości 526 aa wykazuje podobieństwo (ustalone w oparciu o analizę z użyciem programu BLAST P) sekwencji aminokwasowej do sekwencji białka portalowego z rodziny białek bakteriofagów lambda podobnych (e = 0,0) (Gene Bank WP_040262924.1; pfam PF05136.13). Białko to uczestniczy w pakowaniu genomu do prokapsydu, stanowi kanał prowadzący do wnętrza prokapsydu i umożliwia przyłączenie się kompleksowi terminazy, po czym następuje translokacja genomu do prokapsydu [Fujisawa & Morita, 1997] (Podrozdział 1.4);

ORF 69 – domniemane białko kodowane na tej ORF ma długość 87 aa. Analiza sekwencji aminokwasowej z użyciem programu BLAST P wskazuje, iż jest to białko podobne do białka uczestniczącego w przyłączeniu ogonka do główki (ang. head-tail joining protein) (e = 1 * 10^-52) (Gene Bank WP_105396969.1; pfam PF02831.15);

ORF 70 – domniemany produkt białkowy ORF 70 to ma długość 659 aa, zaś jego sekwencja aminokwasowa wykazuje podobieństwo do sekwencji aminokwasowej białka będącego dużą podjednostką terminazy (e = 0,0) (Gene Bank WP_060425444.1). Wraz z małą podjednostką, duża podjednostka tworzy kompleks terminazy – gdzie: mała podjednostka terminazy rozpoznaje na nici replikowanego genomu sekwencje cos, zaś duża podjednostka w połączeniu z małą podjednostką łączy się z białkiem portalowym, przeprowadza translokację genomu do główki prokapsydu oraz odcina w miejscu cos zapakowany genom od konkatameru; po czym przyłącza się do kolejnej, niewypełnionej jeszcze główki fagowej [Sun i in., 2010] (Podrozdział 1.4);

ORF 71 – domniemany produkt ORF 71 o długości 199 aa wykazuje podobieństwo sekwencji aminokwasowej do małej podjednostki terminazy (e = 4 * 10^-06) (Gene Bank ATS93173.1), której funkcję opisano powyżej (patrz ORF 70);

Nie udało się przewidzieć funkcji produktów ORFów o numerach: 1, 2, 12, 14, 16 17, 22, 23, 24, 25, 31, 35, 37, 39 , 40, 44, 50, 60 i 66.

5.3.3 Określenie przynależności taksonomicznej

Uzyskany plik FASTA białek φOS10 zaimplementowano do programu VIRFAM (Podrozdziały 1.6.6 i 4.17.3), skąd otrzymano przyporządkowanie φOS10 do rodziny. Program VIRFAM przypisał φOS10 do rodziny Myoviridae (Rycina 20); niemniej jak wspomniano w Podrozdziale 1.2, w ciągu ostatnich kilkunastu miesięcy ustanowiono 2 nowe rodziny w rzędzie Caudovirales (tj. Ackermannviridae i Herelleviridae) o wielu cechach przypisywanym dotychczas tylko rodzinie Myoviridae; w związku z czym aktualnie dostępne programy bioinformatyczne mogą przypisywać badane bakteriofagi do rodziny Myoviridae, podczas gdy przypisanie powinno nastąpić do rodziny Ackermannviridae lub Herelleviridae. Przyporządkowanie φOS10 do rodziny Myoviridae nie jest w pełni uprawnione i wymaga kolejnego podejścia, gdy dostępne programy bioinformatyczne zostaną zaktualizowane.

Rycina 20. Umiejscowienie bakteriofaga ϕOS10 na drzewie podobieństwa przedstawicieli Caudovirales. [Virfam.org].

5.4 Określenie sekwencji cos

Podczas analizy wyników sekwencjonowania zaobserwowano, że kontig zawierał na początku i na końcu tą samą sekwencję GCGCGCAATGCC (Rycina 21), co mogło być sekwencją cos odczytaną dla obu końców genomu niezależnie (taka możliwość istnieje tylko wówczas gdy terminaza, przecinając sekwencję cos, generuje jednoniciowe „lepkie” końce 5’), albo sekwencją powtórzoną w genomie lub po prostu pomyłką wygenerowaną przez program podczas składania kontigu.

Plik:Rycina 21 Wstępna charakterystyka bakteriofaga Serratia φOS10.png

Rycina 21. Wyniki sekwencjonowania genomu φOS10. Na obu ramionach genomu widoczna jest sekwencja GCGCGCAATGCC [Decewicz & Radlińska, dane nieopublikowane].

Argumentem przemawiającym za tą pierwszą możliwością było przypisanie funkcji produktowi pierwszego genu (mała podjednostka terminazy), znajdującego się na prawym ramieniu kontigu. Jak wspomniano w Podrozdziale 1.5.1, w przypadku występowania sekwencji cos jej położenie w genomie jest konserwowane i znajduje się w regionie niekodującym, tuż przed genem kodującym małą podjednostkę terminazy. Aby określić faktyczną sekwencję końców genomowego DNA φOS10, a zatem wykluczyć pomyłkę wygenerowaną przez program do składania kontigu, wykonano następujący eksperyment. Genomowy DNA φOS10 przecięto enzymem Nco I (jedno z miejsc dla Nco I znajduje się w odległości 1967 bp od prawego końca). Następnie użyto Fragment Klenowa Polimerazy I, aby usunąć „lepkie” końce uzyskanych fragmentów restrykcyjnych, a następnie fragment o wielkości 1967 bp reizolowano z żelu (Rycina 22).

Rycina 22. Fragment prawego ramienia genomu φOS10 reizolowany z żelu.

Zakładając, że końce liniowego genomu φOS10 zawierają jednoniciowe odcinki (są „lepkie”), wspomniany fragment DNA zawierał „lepki” koniec po cięciu Nco I oraz „lepki” koniec po cięciu terminazą, które zostały następnie wypełnione przez enzym Fragment Klenowa Polimerazy I. Ten odcinek DNA sklonowano w wektorze pUC19 strawionym uprzednio enzymem Sma I i oddano do sekwencjonowania. Sekwencję prawego ramienia po zastosowaniu Fragmentu Klenowa przedstawia Rycina 23.

5’CATGGCTCATTGGTTTCCAGAT[…]CAACTATCGATCTGCGTCTTGCGCCGCGCGTTACGG 3’
3’GTACCGAGTAACCAAAGGTCTA[…]GTTGATAGCTAGACGCAGAACGCGGCGCGCAATGCC 5’

Rycina 23. Sekwencja prawego ramienia genomu φOS10 po zastosowaniu Fragmentu Klenowa Polimerazy I. Kolorem czerwonym dopisano sekwencję wygenerowaną przez Fragment Klenowa.

Natomiast, aby sprawdzić czy sekwencja GCGCGCAATGCC występuje tylko raz (albo czy jest zduplikowana) w genomie φOS10 – przeprowadzono amplifikację regionu zawierającego tę sekwencję z użyciem starterów, które ją flankują (Podrozdziały 3.3.1 i 4.15) z wykorzystaniem jako matrycy DNA chromosomowy wyizolowany z lizogena tj. szczepu Serratia sp. OS10L (opis uzyskania lizogenia w Podrozdziale 5.5). Uzyskany produkt PCR sklonowano w wektorze pUC19 strawionym uprzednio enzymem Sma I i oddano do sekwencjonowania. Wynik tego eksperymentu wykazał, że sekwencja GCGCGCAATGCC występuje w genomie profaga tylko raz, co pozwala wnioskować, że obecność tej sekwencji na obu końcach kontigu jest produktem specyficznego endonukleolitycznego cięcia DNA przez terminazę. Nić górna w sekwencji GCGCGCAATGCC została przecięta przed pierwszą guaniną na końcu 5’, tak samo jak nić do niej komplementarna. W ten sposób zostały wygenerowane 12 nt jednoniciowe końce. Na Rycinie 24 przedstawiono schemat poglądowy obrazujący sekwencję cos obecną w sekwencji profagowej Serratia sp. OS10L oraz po jej przecięciu w genomie faga OS10.

A)

TCCCTGCACTTTTGTAAAGCACGGGCATTGCGCGCCGCGTTCTGCGTCTAGCTATCAACT
AGGGACGTGAAAACATTTCGTGCCCGTAACGCGCGGCGCAAGACGCAGATCGATAGTTGA

B)
5’ GGCATTGCGCGCCGCGTTCTGCGTCTAGCTATCAACT
3’ GCGCAAGACGCAGATCGATAGTTGA
TCCCTGCACTTTTGTAAAGCACG 3’
AGGGACGTGAAAACATTTCGTGCCCGTAACGCGCG 5’

Rycina 24. Sekwencja cos, zaznaczona kolorem czerwonym. Sekwencja replikowanego genomu przed cięciem z udziałem terminazy oraz w profagu. Strzałkami zaznaczono miejsca cięć (A), po przecięciu zostały wygenerowane jednoniciowe odcinki – tzw. „lepkie” końce 5’ (B) [Radlińska, dane nieopublikowane].

5.5 Weryfikacja zdolności do wejścia w stan lizogenii φOS10

W celu ustalenia czy φOS10 jest fagiem łagodnym, a zatem czy ma zdolność wejścia w stan lizogenii, podjęto próbę uzyskania lizogena. Jako gospodarza wybrano szczep Serratia sp. OS10, na murawkę którego nakroplono po 10 µl porcji rozcieńczeń zawiesiny φOS10: 10 ^{- 1}, 10 ^{- 2}, 10 ^{- 3}, 10 ^{- 4}, 10 ^{- 5}, 10 ^{- 6}. Z centralnej części mętnej łysinki pobrano ezą materiał, a następnie wykonano posiew redukcyjny na podłożu stałym LB. Uzyskane kolonie pasażowano dwukrotnie w celu uzyskania czystej kultury, a następnie poddano testom mającym na celu ustalenie czy bakterie te (Serratia sp. OS10L) są lizogenami faga φOS10. Nocne hodowle potencjalnych lizogenów Serratia sp. OS10L użyto jako gospodarzy w teście szalek dwuwarstwowych (Podrozdział 4.1), gdzie nakraplanym fagiem był φOS10. Dodatkowo rozcieńczenia hodowli Serratia sp. OS10L wykorzystano do nakroplenia szalek dwuwarstwowych zawierających jako gospodarza natywny szczep Serratia sp. OS10. Po około 24-godzinnej inkubacji okazało się, że w miejscach nakropleń testowanego Serratia sp. OS10L na murawkę Serratia sp. OS10 pojawiły się strefy zahamowania wzrostu (lub łysinki, przy wyższych rozcieńczeniach lizogena). Natomiast Serratia sp. OS10L nie był wrażliwy na φOS10. Wynik ten jednoznacznie wskazuje iż bakterie tj. Serratia sp. OS10L, pobrane z mętnej łysinki, są lizogenami φOS10, a badany bakteriofag φOS10 jest łagodny i zdolny do wejścia w stan lizogenii. Uzyskany wynik jest przypuszczalnie rezultatem obecności profaga (tu φOS10), który nie dopuszcza do zajścia superinfekcji tj. koinfencji lizogena tym samym lub pokrewnym fagiem (mechanizm oporności na superinfekcję opisano w Podrozdziale 1.5.1). Na poziomie molekularnym zjawisko to związane jest ze stałą produkcją białka represorowego, kodowanego przez profaga, który może zablokować możliwość wejścia w cykl lityczny także faga-intruza. Gdyby w miejscach nakropleń hodowli potencjalnego lizogena na murawkę szczepu wrażliwego nie pojawiły się strefy zahamowania wzrostu, oznaczałoby to, że „potencjalny lizogen” jest w rzeczywistości szczepem opornym na infekcję badanym bakteriofagiem, o oporności uzyskanej w sposób spontaniczny – np. na drodze wintegrowania się do chromosomu komórki gospodarza samego genu represora, po czym doszło do degradacji reszty genomu fagowego w cytoplazmie komórki [Labrie i in., 2010], albo z powodu utraty receptora dla danego wirusa.

5.6 Badanie kinetyki adsorpcji bakteriofaga φOS10 do gospodarza

Badanie wykonano zgodnie z opisem przedstawionym w Podrozdziale 4.18. Uśrednione wartości adsorpcji w zależności od czasu prezentuje Tabela 11. Wyniki opracowane w programie Libre Office Calc (Podrozdział 3.10), podano w formie diagramu słupkowego przedstawionego na Rycinie 25.

Tabela 11. Zależność adsorpcji cząstek fagowych do komórek gospodarza od czasu. Trzy próby biologiczne, wynik uśredniony.

minuta	Adsorpcja
	dla próby	średnia
1	I: 95,82%	95,31%
	II: 95,82%
	III: 94,30%
2,5	I: 96,58%	96,83%
	II: 97,53%
	III: 96,39%
5	I: 99,24%	99,18%
	II: 98,69%
	III: 99,62%
10	I: 98,90%	99,03%
	II: 98,99%
	III: 99,20%
15	I: 99,43%	99,19%
	II: 99,05%
	III: 99,09%
20	I: 99,64%	99,61%
	II: 99,43%
	III: 99,77%
25	I: 99,66%	99,46%
	II: 99,22%
	III: 99,51%
30	I: 99,73%	99,33%
	II: 99,47%
	III: 98,78%

Rycina 25. Wykres zależności odsetku zaadsorbowanych cząstek wirusowych od czasu. Wykres wykonany w oparciu o wartości uśrednione z Tabeli 11.

Analiza wyników nasuwa wniosek, iż adsorpcja bakteriofaga φOS10 jest bardzo wydajna – już po pierwszej minucie od zmieszania zawiesiny cząstek fagowych z mieszaniną szczepu wrażliwego zaadsorbowało się do komórek gospodarza ponad 95% cząstek fagowych. Dla porównania u bakteriofaga φAB2 wartość ta bywa znacznie mniejsza – osiągnięcie adsorpcji na poziomie 95% trwało w jego przypadku około 4 minut, zaś w ciągu pierwszej minuty adsorbowało mniej niż 75% cząstek infekcyjnych faga [Lin i in., 2010]. Tak duża wydajność adsorpcji pozwoliła pominąć odwirowywanie niezaadsorbowanych cząstek fagowych przy kolejnych pomiarach w późniejszym badaniu jednego etapu replikacji faga (Podrozdział 5.7).

5.7 Badanie jednego etapu replikacji (ang. One-Step Growth) faga φOS10

5.7.1 Badania pilotażowe

Procedura zastosowana w niniejszej pracy bazowała na metodyce Kropińskiego [Kropiński, 2018] z pewnymi modyfikacjami. Modyfikacje opisano w Podrozdziale 4.19.3 Do serii badań wykorzystano szczep wrażliwy OS10. Jako optymalne wybrano odmładzanie w stosunku 1:50, trwające w zależności od stanu nocnej hodowli – od 2 do 4 godzin.

5.7.2 Badanie czasu latencji i wielkości wyrzutu fagowego

Po przeprowadzeniu procedury opisanej w Podrozdziale 4.19.3 ustalono, że MOI wynosi 1/283 (≈0,0035), czyli daleko poniżej wartości 1,0 – dzięki czemu, w oparciu o opisany wcześniej rachunek statystyczny, przyjąć można było, iż u ponad 99,82% zainfekowanych komórek infekcja zachodziła z udziałem dokładnie 1 cząstki infekcyjnej. W związku z tym uznano, iż każda łysinka na szalce pochodziła od jednej cząstki infekcyjnej. Na Rycinie 26 przedstawiono szalki z widocznymi łysinkami, których jest odpowiednio mniej przed wysypem cząstek infekcyjnych (szalka A1) oraz odpowiednio więcej po wysypie cząstek infekcyjnych (szalka A11). Czas latencji oraz plon fagowy ustalono w oparciu o czynności opisane w Podrozdziale 4.19.3. Wyniki zebrane w Tabeli 12 zaprezentowano na poniższym wykresie (Rycina 27)

Rycina 26. Szalki z murawką bakterii Serratia sp. OS10: kontroli (K), próby badanej przed wysypem cząstek fagowych (A1) i próby badanej po wysypie cząstek fagowych (A11). Procedura według A. Kropińskiego [Kropiński, 2018, zmienione].

Tabela 12. Wyniki badania jednego etapu replikacji faga.

Numer pomiaru	Czas (min)	Ilość łysinek (A)	PFU/ml (A)	Ilość łysinek (B)	PFU/ml (B)
1	6	83	830
2	21	96	960
3	36	76	760
4	51	71	710
5	66	69	690
6	81	80	800
7	86	92	920
8	91	67	670	8	800
9	96	92	920	11	1100
10	101	101	1010	7	700
11	106	97	970	31	3100
12	111	407	4070	20	2000
13	116	389	3890	22	2200
14	121	554	5540	49	4900
15	126			330	33000
16	131			270	27000
17	136			146	14600
18	141			233	23300
19	146			234	23400
20	151			125	12500

Rycina 27. Wykres zależności miana faga od czasu, zaznaczone poziomy plateau x₁ i x₂ oraz czas latencji T_L.

Plon fagowy, czyli średnia ilość cząstek fagowych uwalniających się z jednej zainfekowanej komórki, obliczono jako stosunek miana dla górnego plateau do miana dolnego plateau (Rycina 28).

\alpha ={\frac {\overline {x_{2}}}{\overline {x_{1}}}}={\frac {23350{\frac {PFU}{ml}}}{840{\frac {PFU}{ml}}}}=27,7976...\approx 28

Rycina 28. Wyliczenie plonu fagowego.

Wartość otrzymana w obliczeniach z Ryciny 15 wymagała weryfikacji, ponieważ obliczono ją w oparciu o górne plateau, które dla 2 pomiarów nie osiągnęło istotności statystycznej. W związku z tym wykonano drugie podejście, tym razem jednak zwiększając ilość pomiarów, aby przy tych samych warunkach osiągnąć stabilne górne plateau. W rezultacie uzyskano 3 niewspółliniowe wykresy: dla kolby A, kolby B i kolby C (Rycina 29).

Rycina 29. Wykres zależności plonu fagowego od czasu pomiaru.

Jako przyczynę powstania niewspółliniowych wykresów uznać można dotychczasowe wykorzystywanie kolb B i C jako kolejnych rozcieńczeń zawartości kolby A. Jest to technika obarczona dużym błędem, ponieważ potencjalne błędy w pipetowaniu są utrwalane w następnych pomiarach. Ponieważ w żadnym z dwóch powtórzeń nie uzyskano istotnego statystycznie plateau po wysypie cząstek fagowych (ang. burst), następne 2 podejścia wykonano z wprowadzeniem modyfikacji opisanymi w Podrozdziale 4.19.3. Na każdej szalce wykonano po 2 powtórzenia z uwzględnieniem rozcieńczeń (Rycina 30). Wyniki zestawiono w formie Tabeli 13, a następnie zobrazowano w formie wykresu (Rycina 31).

Rycina 30. Szalki z murawką bakterii Serratia sp. OS10 dla: próby badanej przed wysypem cząstek fagowych (A4) i próby badanej po wysypie cząstek fagowych (A17). Procedura zmodyfikowana.

Tabela 13. Wyniki badania jednego etapu replikacji faga po modyfikacjach.

Numer pomiaru	Czas (min)	10 ⁰		10 ^- 1		10 ^- 2		10 ^- 3
		powt.	średnia	powt.	średnia	powt.	średnia	powt.	średnia
A1	5	I: 27	26,9	I: 3	3,24	I: 0	-0,03	I: 0	0
		II: 32		II: 4		II: 0		II: 0
A2	10	I: 31	31,2	I: 2	2,42	I: 1	0,49	I: 0	0
		II: 33		II: 3		II: 0		II: 0
A3	15	I: 30	25,35	I: 4	3,44	I: 1	0,49	I: 0	0
		II: 22		II: 3		II: 0		II: 0
A4	30	I: 23	22,65	I: 4	2,87	I: 2	0,99	I: 0	0
		II: 25		II: 2		II: 0		II: 0
A5	45	I: 28	25,15	I: 3	2	I: 0	-0,01	I: 0	0
		II: 25		II: 1		II: 0		II: 0
A6	60	I: 37	31,15	I: 1	2,5	I: 0	-0,01	I: 0	0
		II: 28		II: 4		II: 0		II: 0
A7	75	I: 31	24,15	I: 0	1,5	I: 2	0,99	I: 0	0
		II: 20		II: 3		II: 0		II: 0
A8	85	I: 31	26,65	I: 8	5,5	I: 0	-0,01	I: 0	0
		II: 25		II: 3		II: 0		II: 0
A9	90	I: 34	29,65	I: 4	5	I: 0	0,49	I: 0	0
		II: 28		II: 6		II: 1		II: 0
A10	95	I: 39	28,15	I: 1	1	I: 0	-0,01	I: 0	0
		II: 20		II: 1		II: 0		II: 0
A11	100	I: 50	44,65	I: 4	3,5	I: 0	-0,01	I: 0	0
		II: 42		II: 3		II: 0		II: 0
A12	105	I: 83	73,65	I: 40	22	I: 2	0,97	I: 0	0
		II: 67		II: 4		II: 0		II: 0
A13	110	I: 45	52,15	I: 4	4,5	I: 0	-0,01	I: 0	0
		II: 62		II: 5		II: 0		II: 0
A14	120	I: 113	150,15	I: 13	21	I: 0	0,49	I: 0	0
		II: 190		II: 29		II: 1		II: 0
A15	130	I: 131	145,65	I: 104	85	I: 2	4,49	I: 0	0
		II: 163		II: 66		II: 7		II: 0

Rycina 31. Wykres zależności plonu fagowego od czasu pomiaru.

W oparciu o uzyskane wyniki ustalono, że w wyniku infekcji jedną cząstką fagową powstaje średnio od 28 do 40 cząstek fagowych. Jest to wynik dość dokładny, odnosząc go do analogicznych badań, w których plon fagowy podaje się jako przybliżenie do wielokrotności liczby 100 [Lin i in., 2010]. Czasu latencji nie dało się dokładnie ustalić. Wiadomo jednak, że wynosi od 105 do 120 minut. Czas ten podano w formie przedziału, a nie dokładnej wartości, ze względu na kilka okoliczności:

Wysyp cząstek fagowych niejednokrotnie rozpoczynał się w różnych momentach dla różnych rozcieńczeń w ramach tej samej próby biologicznej.
Przy zachowaniu tych samych warunków eksperymentu komórki mogły cechować się innym stanem fizjologicznym, co wpływa na szybkość cyklu infekcyjnego.
Warunki prowadzenia eksperymentu umożliwiały pobór prób z niemniejszą częstotliwością niż jeden pobór co 5 minut.

Wynik cechuje się podobną (lub też niewiele większą) dokładnością względem analogicznych badań uzyskanych dla innych bakteriofagów [Daugelavičius i in., 2007]. Badanie przeprowadzone według zmodyfikowanej procedury odbyło się w jednym powtórzeniu. W związku z tym, dla większego uwiarygodnienia wyników należałoby wykonać kolejne powtórzenia tej procedury.

5.8 Proponowane kierunki dalszych badań

Czynności opisane w niniejszej pracy stanowią wstępny etap badań. W ramach następnych kroków można by przeprowadzić:

analizę morfologii wirionów z użyciem transmisyjnej mikroskopii elektronowej, co pozwoli określić parametry przestrzenne cząstki infekcyjnej (przybliżoną średnicę główki i długość ogonka) dla porównania ich z innymi bakteriofagami Serratia;
analizę proteomiczną białek kapsydu, zsekwencjonowanie ich metodą tandemowej spektrometrii mas [Hunt i in., 1986] i zadnotowanie sekwencji aminokwasowych do odpowiednich miejsc w genomie z użyciem narzędzia tBLAST N, dzięki czemu zweryfikowana będzie lokalizacja genów kodujących białka kapsydu w genomie φOS10, a ORFy kodujące domniemane białka kapsydów zostaną scharakteryzowane.

Tekst udostępniony jest na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0.
Dodatkowe informacje o autorach i źródle znajdują się na stronie dyskusji.