Monografie Open-Access
Veröffentlicht

Exploring and validating statistical reliability in forensic conservation genetics

Safeguarding biological diversity from evolutionary lineages to ecosystems is a major undertaking for humanity. Forensic conservation genetics for the protection of wild flora and fauna aims to provide statistical inference tools and services for the enforcement of local to global conservation and management strategies. This paper reviews statistical criteria that provide insight into and ility of conclusions drawn from statistical inference. The translation of these fundamental criteria into practice is illustrated with applications from evolutionary and forensic genetics, specifically focusing on the inference of geographic origin using population assignment approaches. The key concept that end-users of statistical results (e. g., conservation activists, certification participants, courts and juries evaluating a proposed expert conclusion) need to understand and take into account, is the statistical reliability of an inferred estimate. Its reliability sets a result into an appropriate context, defines the scope (space of applicability) for which it is valid, and thus provides perspective. In statistical terms, this context corresponds to the probability density surfaces of sample, parameter and result spaces. As measures of dispersion (e. g., size, range, variance), the reviewed ancillary statistical criteria convey the structure and characteristics of these surfaces. They make accessible the more insight into reliability, the more their scope is as continuous and wide as possible. Validity (convergence and consistency, measured by precision and accuracy, supplemented by robustness and congruence), efficiency (“speed”) and sufficiency (“power”), as well as, model specification (definition, selection and assessment) and hypothesis falsification quantify how confident one can be in the parameter values, support measures, predictive data and test decisions returned by statistical methods. In this way, statistical reliability forms the subject, process and goal of the statistical validation of reference datasets and inference approaches. This review introduces each ancillary criterion, and discusses general strategies for practical application, as well as, available implementations towards genetic population assignment. It points out the fundamental importance of genome-wide sequence information for reference samples from across the distribution range in non-model organisms. Such reference datasets provide the information-rich genomic data that is required for the development of sufficient and versatile statistical inference approaches. Together they form the prerequisites for arriving at accurate, decisive and reliable tools for conservation, management and law enforcement. The validation of their quality characteristics lays the basis for a widespread practical acceptance and use of such tools also in non-model organisms.

Der Schutz biologischer Vielfalt von evolutionären Linien bis hin zu Ökosystemen ist eines der wichtigsten Unterfangen der Menschheit. Forensische Erhaltungsgenetik zum Schutz wilder Flora und Fauna hat das Ziel Werkzeuge und Dienstleistungen für statistische Schlussfolgerungen zur Ausübung und Durchsetzung von lokalen bis globalen Erhaltungs- und Bewirtschaftungsstrategien bereitzustellen. Die vorliegende Arbeit gibt einen Überblick über statistische Kriterien, welche Einblick in und eine Bewertungsgrundlage für die Verlässlichkeit von Schlussfolgerungen geben, welche auf Grund von statistischen Inferenzverfahren gezogen wurden. Die Überführung dieser grundlegenden Kriterien in die Anwendung wird durch ihren Einsatz in der Evolutions- und Erhaltungsgenetik illustriert, wobei der Fokus speziell auf der Rekonstruktion der geographischen Herkunft durch Zuordnungsverfahren auf Populationsebene liegt. Das Hauptkonzept, welches Endnutzer statistischer Ergebnisse (z. B., eine Expertenaussage abzuwägen habende Naturschutz-AktivistInnen, ZertifizierungsteilnehmerInnen, Gerichte oder die Öffentlichkeit) verstehen und beachten müssen, ist die statistische Verlässlichkeit eines gezogenen Rückschlusses. Die Verlässlichkeit setzt ein Ergebnis in seinen angemessenen Kontext, definiert seinen Gültigkeitsbereich (seinen Anwendungsraum) und gibt ihm somit Perspektive. In statistischen Begriffen ausgedrückt, entspricht dieser Kontext den Wahrscheinlichkeitsoberflächen von Stichproben-, Parameter- und Ergebnisräumen. Als Streuungsmaße (z. B. Stichprobenumfang, Spannweite, Varianz) vermitteln die betrachteten „ancillary“ statistischen Kriterien die Struktur und Charakteristiken dieser Oberflächen. Die Kriterien geben umso mehr Einblick in die Verlässlichkeit, je kontinuierlicher und weiter ihr Gültigkeitsbereich ist. Validität (Konvergenz und Konsistenz, gemessen durch Präzision und Genauigkeit, ergänzt durch Robustheit und Kongruenz), Effizienz („Geschwindigkeit“) und Suffizienz („Power“, Aussagekraft), ebenso wie Modelspezifikation (Modeldefinition, -selektion und -prüfung) und Hypothesenfalsifizierung quantifizieren wie überzeugt man von Parameterwerten, Unterstützungsmaßen, Vorhersagen und Testentscheidungen sein kann, welche durch statistische Verfahren erhalten wurden. Auf diese Art und Weise bildet statistische Verlässlichkeit das Subjekt, den Prozess und das Ziel statistischer Validierung von Referenzdatensätzen und Inferenz-Herangehensweisen. Dieser Überblick stellt jedes der „ancillary“ statistischen Kriterien vor und diskutiert allgemeine Strategien für die praktische Anwendung, wie auch vorhandene Umsetzungen für die genetische Zuordnung von Stichproben zu Populationen. Die grundlegende Bedeutung genomweiter Sequenzinformationen für Referenzstichproben aus dem gesamten Verbreitungsgebiet in Nichtmodellorganismen wird aufgezeigt. Entsprechende Referenzdatensätze stellen die informationsreichen genomischen Daten bereit, welche die Grundlage für die Entwicklung suffizienter und vielseitiger statistischer Inferenzverfahren sind. Zusammen bilden solche Daten und Verfahren die Voraussetzungen dafür, dass genaue, entscheidungskräftige und verlässliche statistische Werkzeuge für die Erhaltung, Bewirtschaftung und die Strafverfolgung erreicht werden können. Die Validierung dieser Qualitätsmerkmale legt die Grundlage für die breite praktische Akzeptanz und den Einsatz solcher Werkzeuge auch für Nichtmodellorganismen.

Vorschau

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Zugriffsstatistik

Gesamt:
Volltextzugriffe:
Metadatenansicht:
12 Monate:
Volltextzugriffe:
Metadatenansicht:

Rechte

Nutzung und Vervielfältigung: