Unterschiede in der genetischen Vielfalt von bakteriellen Erregern in Zusammenhang mit klinisch wichtigen Faktoren, wie der Virulenz und Antibiotikaresistenz, woraufhin die Notwendigkeit, zu identifizieren Cluster von ähnlichen Bakterienstämmen. Jedoch, aktuelle bakterielle clustering und Eingabe Ansätze sind nicht geeignet für real-time-Erreger-surveillance und Ausbruch-Erkennung.
In einer Studie, veröffentlicht heute in der Genom-Forschung, Forscher entwickelten PopPUNK (Bevölkerung Partitionierung Mit Nukleotid – K-mers), a computational tool für die Analyse von Zehntausenden von bakteriellen Genome in einem Durchgang, bis zu 200-Fach schneller als mit bisherigen Methoden. Verwendung von k-mers, kurze DNA-Abschnitte der Länge k, die diese software ermöglicht eine schnelle Abschätzung des Anteils von k-mers in einem Genom, das auch gemeinsam von anderen. Unterschiede in den k-mer Inhalt zwischen den genomen darstellen können änderungen an einzelnen Basen in ähnlichen Ausdehnungen von DNA oder Unterschiede in der gen-Inhalte. Durch die Berechnung dieser Beziehungen in Isolaten, die populationsstruktur einer Art kann effizient geschätzt.
Wichtig ist, PopPUNK gilt ein machine-learning-Verfahren ermöglicht die einfache Identifizierung von neuen Sorten in einer Bevölkerung. Mit einem bereits veröffentlichten Daten der E. coli – Isolate gesammelt, die über einen zehn-Jahres-Studie, PopPUNK war in der Lage, effizient zu klassifizieren, die Prävalenz der verschiedenen Stämme in der Bevölkerung jedes Jahr aus und ermitteln die Entstehung von Antibiotika-Resistenz-Stämme im Laufe der Zeit.