In silico genome analysis and molecular typing of Clostridium perfringens

Abdel-Glil, Mostafa Youssef GND

Main objectives of the thesis: 1. In silico investigation of the genomic variability, phylogenetic relatedness and virulence assessment of C. perfringens by means of comparative genome analysis employing publically available genomic data. 2. Isolation, characterization and genotyping of C. perfringens strains from healthy and diseased poultry collected from different farms and slaughterhouses in Egypt. 3. Development and application of a core genome-based multilocus sequence typing system for C. perfringens. 1. In silico analysis of the genomic variability, phylogenetic relatedness and virulence genes of C. perfringens The Gram-positive anaerobic spore forming bacterium C. perfringens is able to produce a large number of toxins by which it can cause various defined diseases in different hosts. With the aim to investigate its genomic diversity the publically available genome sequence data of 76 C. perfringens strains from diverse ecological, geographical and temporal niches were analyzed. Data analysis included 30 complete genomes which were composed of a circular chromosome (2.9 to 3.5Mbp) and up to six extrachromosomal elements. A substantial degree of genomic variability was detected in respect to episome content, chromosome size and mobile elements. Insertion sequences were identified and revealed abundance of their occurrence in certain genomes. Comparative alignment of complete genomes displayed a considerable degree of conservation in the order of genes in each chromosome except for three (out of the 30) genomes. The analyzed 76 C. perfringens strains were divided into three different phylogroups (I - III). Phylogroup I consisted of human food poisoning strains with chromosomal cpe as well as a Darmbrand (enteritis necroticans) strain. This phylogroup is characterized by a significant enrichment in mobile elements, relative small genome size and marked loss of chromosomal genes. Phylogroup I strains lack also two putative iron uptake systems as well as the pfoA gene. The genomic features of this phylogroup I (abundance of IS elements and genome reduction) provide indications that these strains adapt to a certain habitat causing human foodborne illnesses. Also, the absence of certain virulence genes (iron uptake systems and PFO) indicates the strains’ adaptation to less competitive environment (food) for replication. The loss of chromosomal genes in phylogroup I was in contrast to phylogroup II, in which the genome size indicates the addition of new genetic material. Phylogroup II strains carry also an additional putative iron uptake operon and an additional copy of the pfoA gene. Strains of this phylogroup were frequently reported in different animal hosts (equine and canine) in which they can cause enteric lesions. In sum, this study provides new insights into genomic variability and phylogenetic structure of C. perfringens. Phylogroup I (chromosomal cpe and Darmbrand strains) appears to be exposed to certain evolutionary mechanisms and displays characteristics that indicate speciation of these strains 2. Characterization and typing of C. perfringens isolates from healthy and diseased poultry in Egypt To investigate the diversity of poultry strains of C. perfringens isolated from Egypt, 54 birds from 27 farms suspected for necrotic enteritis (NE) as well as 50 healthy birds (10 ducks, 40 chickens) from eight slaughterhouses were sampled. C. perfringens was isolated from birds suspected of NE in 14 different farms (n = 51 isolates) as well as from apparently healthy poultry at slaughterhouses (n = 83 isolates). The C. perfringens isolates from suspected NE cases in Egypt were of toxin type A and netB negative, despite fact that NetB toxin was reported to play an important role in NE pathogenesis. The beta2 toxin gene was detected in both diseased and non-diseased birds. Ten isolates from five healthy ducks that did not produce the typical dual hemolysis on blood agar were identified. In addition, seven isolates from two cases suspected for NE were detected with an insertion of 834bp DNA segment within the amplicon of alpha toxin gene. The inserted DNA segment was identical to group II intron. C. perfringens strains that carry the group II intron were reported previously in Japan, Italy and Denmark. Interestingly, the insertion was detected so far within chicken isolates only. Additionally, a pilot investigation based on classical MLST was performed to determine the genetic relatedness of C. perfringens isolated in individual diseased birds. The investigated isolates of two birds (bird no. 1 and no. 2) belong to a single MLST sequence type each (ST45 and ST46) in concordance with various reports that described limited diversity of strains in NE affected birds. However, the isolates from bird no. 3 belonged to three different STs. Comparing MLST data for the 12 strains of this study and MLST data described in prior investigations revealed that the 12 strains were assigned to new STs and do not belong to the previously described “NE-associated” genotypes (ST31, CC-4). 3. Development and application of a core genome-based multilocus sequence typing system for C. perfringens Whole genome sequencing can provide a complete overview on organism genetic information but also represents a powerful molecular epidemiological tool for pathogen subtyping and outbreak investigations. In this study, a cgMLST scheme of 1,450 genes was developed for C. perfringens typing. The developed scheme was applied on a set of 160 genomes. An average of 99.5% of the cgMLST targets was found typeable per each genome. This scheme has a greater discriminatory power than the classical MLSTs methods. In addition, a whole genome based SNP typing was performed. The discriminatory power between the cgMLST and the whole genome SNP typing was comparable. The developed cgMLST scheme was applied using a cluster type (CT) threshold of 60 allelic differences to analyze 87 genomes of poultry strains of C. perfringens. Based on cgMLST results, most CTs comprised isolates derived from a single country only. However, few CTs harbor strains which were isolated in different countries. This could be due to the poultry commercial system which is likely maintained by few companies i.e. few sources worldwide. Compared to isolates from healthy birds and meat samples, a limited diversity was found in the suspected necrotic enteritis (NE) isolates from Egypt, supporting the hypothesis that distinct isolates cause NE. Isolates from diseased birds were found to group with isolates from healthy birds or meat samples highlighting the wide distribution of potentially virulent strains and the multifactorial character of the disease. Additionally, the 160 genomes investigated in this study were divided into four main phylogroups by hierBAPS. Whole genome SNP typing showed a superior applicability to delineate these phylogroups. A minimum SNP difference of ~ 40,000 SNPs was observed between the phylogroups. In sum, a useful cgMLST scheme for C. perfringens was developed that is applicable for broad and standardized epidemiological investigations. On the other hand, whole genome SNP typing can map the affiliation of individual isolates to the main phylogroups of C. perfringens in more detail.

Hauptziele der Arbeit: 1. In silico-Untersuchung der genomischen Variabilität, phylogenetischen Verwandtschaft und Virulenzeinschätzung von C. perfringens mittels vergleichender Genomanalyse unter Verwendung öffentlich zugänglicher genomischer Daten. 2. Isolierung, Charakterisierung und Genotypisierung von C. perfringens Stämmen von gesundem und erkranktem Geflügel, die in verschiedenen landwirtschaftlichen Betrieben und Schlachthöfen in Ägypten gesammelt wurden. 3. Entwicklung und Anwendung eines Core-genom basierten Multilocus-Sequenz-Typisierungssystems für C. perfringens. 1. In silico-Untersuchung der genomischen Variabilität, phylogenetischen Verwandtschaft und Virulenzgene von C. perfringens Das Gram-positive, anaerobe, sporenbildende Bakterium C. perfringens ist in der Lage, eine große Anzahl von Toxinen zu produzieren, wodurch es bei verschiedenen Wirten unterschiedliche definierte Krankheiten verursachen kann. Mit dem Ziel die genomische Vielfalt von C. perfringens zu untersuchen, wurden öffentlich verfügbaren Genomsequenzdaten von 76 Stämmen verschiedener ökologischer, geographischer und zeitlicher Herkunft analysiert. Die Datenanalyse umfasste 30 vollständige Genome, die aus einem ringförmigen Chromosom (2,9 bis 3,5 Mbp) und bis zu sechs extrachromosomalen Elementen bestanden. Ein erhebliches Maß an genomischer Variabilität wurde in Bezug auf Episom, Chromosomengröße und mobile Elemente festgestellt. Insertionssequenzen wurden identifiziert und die Häufung ihres Auftretens in bestimmten Genomen aufgedeckt. Das vergleichende Alignement vollständiger Genome zeigte einen erheblichen Grad an Konservierung in der Anordnung der Gene in jedem Chromosom, mit Ausnahme von drei (von den 30) Genomen. Die analysierten 76 C. perfringens Stämme wurden in drei verschiedene Phylogruppen (I - III) unterteilt. Phylogruppe I bestand aus lebensmittelvergiftenden Stämmen mit chromosomalem cpe sowie einem Darmbrand (Enteritis necroticans) Stamm. Diese Phylogruppe zeichnet sich durch eine signifikante Anreicherung mobiler Elemente, eine relativ kleine Genomgröße und einen deutlichen Verlust chromosomaler Gene aus. Den Phylogruppe I-Stämmen fehlen zwei mutmaßliche Eisen-Aufnahmesysteme sowie das pfoA Gen. Die genomischen Merkmale dieser Phylogruppe I (Fülle von IS-Elementen und Genomreduktion) liefern Hinweise darauf, dass sich diese Stämme an einen bestimmten Lebensraum anpassen, in welchem sie lebensmittelbedingte Krankheiten beim Menschen verursachen. Auch das Fehlen bestimmter Virulenzgene (Eisenaufnahmesysteme und PFO) deutet auf die Anpassung der Stämme an ein weniger kompetitives Umfeld (Lebensmittel) für die Replikation hin. Der Verlust chromosomaler Gene in der Phylogruppe I stand im Gegensatz zur Phylogruppe II, bei der die Genomgröße auf die Hinzugewinnung neuen Erbmaterials hinweist. Phylogruppe II-Stämme enthalten ein zusätzliches mutmaßliches Operon für Eisenaufnahme und eine zusätzliche Kopie des pfoA Gens. Stämme dieser Phylogruppe wurden häufig in verschiedenen Wirten (Pferd und Hund) beobachtet, bei denen sie enterische Läsionen verursachen können. In Summe liefert diese Studie neue Erkenntnisse über die genomische Variabilität und phylogenetische Struktur von C. perfringens. Phylogruppe I (chromosomale cpe- und Darmbrand-Stämme) scheint bestimmten evolutionären Mechanismen ausgesetzt und weist Merkmale auf, die auf eine Artbildung dieser Stämme hinweisen. 2. Charakterisierung und Genotypisierung von C. perfringens Stämmen aus gesundem und erkranktem Geflügel in Ägypten Um die Vielfalt der C. perfringens Geflügelstämme in Ägypten zu untersuchen, wurden 54 Vögel aus 27 Betrieben mit Verdacht auf nekrotische Enteritis (NE), sowie 50 gesunde Vögel (10 Enten, 40 Hühner) aus acht Schlachthöfen untersucht. C. perfringens wurde aus NE-verdächtigen Vögeln von 14 verschiedenen Betrieben isoliert (n = 51 Isolate), sowie aus augenscheinlich gesundem Geflügel in Schlachthöfen (n = 83 Isolate). Die C. perfringens Isolate aus NE-Verdachtsfällen in Ägypten gehörten zum Toxin-Typ A und waren netB negativ, obwohl NetB-Toxin eine wichtige Rolle bei der NE-Pathogenese spielen soll. Das beta2-Toxin-Gen wurde sowohl bei kranken als auch bei gesunden Vögeln nachgewiesen. Zehn Isolate von fünf gesunden Enten, die auf Blutagar nicht die typische Doppelzonen-Hämolyse zeigten, wurden identifiziert. Darüaber hinaus wurde bei sieben Isolaten aus zwei NE-Verdachtsfällen die Insertion eines DNA-Segments von 834 bp im Amplikon des Alpha-Toxin-Gens nachgewiesen. Das inserierte DNA-Segment war identisch mit einem Gruppe II Intron. C. perfringens Stämme, die ein Intron der Gruppe II tragen, wurden zuvor in Japan, Italien und Dänemark gefunden. Interessanterweise wurde die Insertion bisher nur bei Hühnerisolaten nachgewiesen. Zusätzlich wurde eine Pilotuntersuchung basierend auf klassischer MLST durchgeführt, um die genetische Verwandtschaft von C. perfringens bei einzelnen erkrankten Vögeln zu bestimmen. Die untersuchten Isolate von zwei Vögeln (Vogel Nr. 1 und Nr. 2) gehören jeweils zu einem einzigen MLST-Sequenztyp (ST45 und ST46) in Übereinstimmung mit verschiedenen Berichten, die eine begrenzte Vielfalt von Stämmen bei von NE betroffenen Vögeln beschrieben. Allerdings gehörten die Isolate von Vogel Nr. 3 zu drei verschiedenen STs. Der Vergleich der MLST-Daten für die 12 Stämme dieser Studie mit den in früheren Untersuchungen beschriebenen MLST-Daten ergab, dass die 12 Stämme neuen STs zugeordnet wurden und nicht zu den zuvor beschriebenen "NE-assoziierten" Genotypen (ST31, CC-4) gehören. 3. Entwicklung und Anwendung eines Core-genom basierten Multilocus-Sequenz-Typisierungssystems für C. perfringens Die Ganzgenomsequenzierung kann einen vollständigen Überblick über die genetische Information eines Organismus geben, stellt aber auch ein leistungsfähiges molekularepidemiologisches Werkzeug für die Subtypisierung von Krankheitserregern und die Untersuchung von Ausbrüchen dar. In dieser Studie wurde ein cgMLST-Schema mit 1.450 Genen für die Typisierung von C. perfringens entwickelt. Das entwickelte Schema wurde auf ein Set von 160 Genomen angewendet. Durchschnittlich 99,5% der cgMLST-Ziele wurden pro Genom als typisierbar gewertet. Das Schema hat eine größere diskriminatroische Power als die klassischen MLST-Methoden. Darüber hinaus wurde eine Gesamt-Genom basierte SNPTypisierung durchgeführt. Die Trennschärfe zwischen der cgMLST und der Gesamt-Genom SNP-Typisierung war vergleichbar. Das entwickelte cgMLST-Schema wurde mit einem Clustertyp (CT)-Schwellenwert von 60 allelischen Differenzen angewendet, um 87 Genome von Geflügelstämmen von C. perfringens zu analysieren. Basierend auf den cgMLSTErgebnissen enthielten die meisten Clustertypen (CTs) Isolate, die nur aus einem einzigen Land stammen. Andererseits beherbergen nur wenige CTs Stämme, die in verschiedenen Ländern isoliert wurden. Dies könnte auf das Geflügelhandelssystem zurückzuführen sein, das wahrscheinlich von wenigen Unternehmen unterhalten wird, d.h. von wenigen Quellen weltweit. Im Vergleich zu Isolaten von gesunden Vögeln und aus Fleischproben, wurde bei den vermeintlichen nekrotische Enteritis (NE) Isolaten aus Ägypten eine begrenzte Vielfalt festgestellt, was die Hypothese stützt, dass bestimmte Isolate NE verursachen. Isolate von kranken Vögeln wurden mit Isolaten von gesunden Vögeln oder Fleischproben gruppiert, dies unterstreicht den multifaktoriellen Charakter der Krankheit und die weite Verbreitung potenziell virulenter Stämme. Zusätzlich konnten die 160 in dieser Studie untersuchten Genome mittels hierBAPS in vier Hauptphylogruppen eingeteilt werden. Die Gesamt-Genom SNP-Typisierung zeigte eine überlegene Eignung zur Abgrenzung dieser Phylogruppen. Zwischen den Phylogruppen wurde eine minimale SNP-Differenz von ~ 40.000 SNPs beobachtet. In Summe wurde ein gut anwendbares cgMLST-Schema für C. perfringens entwickelt, das für breite und standardisierte epidemiologische Untersuchungen verwendbar ist. Andererseits kann die Gesamt-Genom SNP-Typisierung die Zugehörigkeit einzelner Isolate zu den Hauptphylogruppen von C. perfringens detaillierter abbilden.



