Mehr von Genotypen und Phänotypen

6. Juni 2011 von Bastian Greshake in Biologie

In einem der letzten Blogposts hatte ich ja beschrieben, wie ich versucht habe mit einer Analyse der bekannten Genotypen, die ich von der SNPedia ausgelesen habe, herauszufinden, welche Phänotypen meine Eltern wohl haben dürften. Als kurze Wiederholung zur Methode: Ich habe geschaut an welchen meiner SNPs ich homozygot bin und habe dann geschaut in welchen Fällen bekannt ist, dass die Base die ich an der Stelle trage dominant gegenüber zumindest einer anderen ist.

Als kleines Beispiel zur Wiederholung: Ich trage an Position Rs7837688 den Genotypen GG, der mit einem erhöhten Prostatakrebs-Risiko assoziiert ist. Der Genotyp GT hat das gleiche, erhöhte Risiko wie GG, so viel ist aus den Daten der SNPedia bekannt. Da ich von beiden Elternteilen ein G geerbt habe (zumindest recht wahrscheinlich, die Neumutationsrate ist ja nicht so groß.*) haben beide meiner Elternteile mindestens ein G. Wenn G gegenüber allen anderen 3 Basen dominant wäre, dann wäre klar, dass sie ebenfalls in die Kategorie mit dem erhöhten Risiko gehören würden. Dummerweise sind über die SNPedia in der Regel nur 50 % der möglichen Genotypen, die meine Eltern an dem Punkt tragen können, beschrieben.

In dem Beispiel gibt es z.B. keine Informationen über den Phänotypen für die beiden anderen Varianten, GA und GC, die sie haben können. Es könnte also sein, dass nur GG und GT das erhöhte Prostatakrebs-Risiko tragen, GA und GC aber völlig normal sind. Im Worst Case, wenn die Genotypen auch noch gleichmässig (also je 25 % Wahrscheinlichkeit), verteilt wären und man davon ausgeht, dass nur GT und GG das erhöhte Risiko anzeigen, dann hat man eine Münzwurf-Situation. Mit 50 % Wahrscheinlichkeit hat man selbst ein erhöhtes Risiko, wenn das eigene Kind den Genotypen GG hat, mit 50 % Wahrscheinlichkeit nicht. Das ist relativ schwach, hat jetzt meine Mutter das erhöhte Prostatarisiko, oder doch mein Vater? Macht ja doch schon irgendwie einen Unterschied...

Um diese Fehlerwahrscheinlichkeit in den Griff zu bekommen hab ich deshalb jetzt mal andere Genotypisierungs-Daten angeschaut. Denn erfreulicherweise haben auch andere Menschen ihre Rohdaten veröffentlicht, bei der SNPedia findet man eine Übersicht, über die verfügbaren Daten. Insgesamt konnte ich mir so die Rohdaten von 27 anderen Individuen runter laden.

Denn wie schon gesagt: Die 50/50-Wahrscheinlichkeit stellt sich nur ein, wenn die Allele gleichmässig verteilt sind. In der Realität ist es aber eigentlich selten so, dass alle Allele gleich verteilt und damit gleich wahrscheinlich sind. Das kann auch einer der Gründe sein, wieso die SNPedia bislang keine Phänotypen zu den anderen Genotypen auflistet: Entweder diese kommen gar nicht vor, oder sind so selten, dass sich keine Rückschlüsse daraus ziehen lassen. Was den Vorteil hat: Die Wahrscheinlichkeit, dass ausgerechnet meine Eltern an SNP Rs7837688 die Variante GA bzw. GC haben, die bislang nicht beschrieben ist, ist in dem Fall extrem gering, die Wahrscheinlichkeit für eine korrekte Vorhersage steigt.

Leider ist meine Stichprobe mit 27 anderen Datensätzen jetzt nicht so riesen groß, als das man damit besonders viel vorhersagen könnte. Aber die Ergebnisse sind an sich schon mal nicht schlecht: In keinem der 27 anderen Datensätze konnte ich Genotypen finden, die in der SNPedia bislang nicht gelistet sind. In dem Beispiel: Am SNP x konnte ich nur die Genotypen GG, GT und TT finden, die Allele A und C kommen in der Stichprobe an dem SNP gar nicht vor.

Aufgrund des dann bislang doch recht geringen Stichprobenumfangs hab ich bislang darauf verzichtet eine echte Statistik zu machen. Aber wenn die Stichprobe größer wird, dann kann man auch mal ausrechnen wie das die Wahrscheinlichkeit einer korrekten Vorhersage verändert. Aber das ist dann auch was für einen anderen Blogpost, falls ihr selbst mit den Daten rumspielen wollt: Die Rohdaten, so wie die Scripte zur Analyse finden sich bei GitHub. Und falls ihr Hilfe bei der Verwendung braucht, dann meldet euch gern in den Kommentaren.

* Man trägt wohl mindestens 350 SNPs, die weder in Mutter noch Vater vorkommen sondern durch Neumutation entstanden sind.


4 Kommentare zu “Mehr von Genotypen und Phänotypen”

  1. Michi Antworten | Permalink

    Genotyp

    Der Genotyp ist der gesamte Satz von Genen eines Organismus. Insofern ist es nicht richtig oder zumindest verwirrend, zu sagen "ich trage an Position xxx den Genotyp yyy".

    Außerdem heißt der vierte Fall von 'der Genotyp' 'den Genotyp' und nicht 'den Genotypen'

  2. Sebastian R. Antworten | Permalink

    @Michi

    Es ist schon richtig, wie Bastian es hier sagt, da man den Begriff Genotyp eben auch auf einzelne Basen anwenden kann. Verwirrend mag es sein, aber so sprechen Biologen eben ^^

  3. Joe Dramiga Antworten | Permalink

    SNP/Allel/Haplotyp

    @Sebastian R. Ich finde Michi hat nicht ganz unrecht. Ich würde hier an machen Stellen im Text anstatt von Genotypen auch eher von SNPs oder Allelen sprechen. In Bezug auf die SNPs auf den Chromosomen seiner Eltern und das Prostatakrebsrisiko sollte Bastian sogar besser vom Haplotyp sprechen, da sich Bastians Genom aus den beiden haploiden Genomen in den Keimzellen seiner Eltern zusammensetzt. In seinem Genom ist ja nur eine von vielen Möglichkeiten, die die diploiden Genome seiner Eltern bergen verwirklicht worden.

  4. Bastian Antworten | Permalink

    Genotyp, Phänotyp, Haplotyp

    Wie Sebastian schon sagt, nutzen Biologen den Begriff Genotyp etwas weiter gefasst, als die deutsche Wikipedia das darstellt. In der Englischen Wikipedia findet man auch: «typically, one refers to an individual's genotype with regard to a particular gene of interest and, in polyploid individuals, it refers to what combination of alleles the individual carries».

    In dem Licht ist auch meine Verwendung von Genotyp zu sehen. Den gesamten Satz an Genen könnte man vermutlich besser (je nachdem ob man Nicht-Gene mit betrachtet oder nicht) wohl als Genom oder Exom benennen. Ich hätte mir den deutschen Wiki-Artikel wohl besser mal durchgelesen bevor ich darauf verlinke. :)

    @Joe Ich finde den Begriff Haplotyp hier ebenfalls nicht wirklich angebracht, denn zumindest nach meinem Begriffsverständnis benötigt man für einen Haplotyp immer eine Kombination von Allelen bzw. in diesem Fall SNPs. Dazu hat die deutsche Wikipedia auch ein ganz gutes Beispiel: «Besitzt ein diploider Organismus bezüglich zweier Allele A und B den Genotyp AaBb, so können dem die Haplotypen AB|ab oder Ab|aB zugrunde liegen. Im ersteren Fall besitzt ein Chromosom die Allele A und B, das andere a und b. Im letzteren Fall besitzt ein Chromosom die Allele A und b, das andere a und B.» (http://de.wikipedia.org/wiki/Haplotyp)

    Auf SNPs übertragen: Wenn mein Genotyp an SNP 1 "AT" und an SNP 2 "GC" ist, dann kann ich entweder das A und das G von einem Elternteil und T und C von dem anderen Elternteil bekommen haben, oder aber genauso gut A und C von dem einen und T und G von dem anderen Elternteil bekommen haben. Die Haplotypen wären dann AG|TC, respektive AC|TG.

Einen Kommentar schreiben


× acht = 8