Lerntext: "Vom Gen zum Protein" (pdf)

Roland Heynkes, 2.12.2018

Dieser Selbstlern-Hypertext soll einen Überblick zum besseren Verständnis der Zusammenhänge zwischen Genen, mRNA, Ribosomen und Proteinen geben.

Ob man den Selbstlern-Hypertext wirklich verstanden hat, erkennt man hoffentlich mit Hilfe des zugehörigen Lernmoduls mit Fragen und klausurähnlichen Aufgaben, das auch die selbständige Erarbeitung der nicht ganz leicht verständlichen Übersetzung von Genen in Proteine unterstützen soll. (pdf)

Die roten Blutkörperchen in unserem Blut besitzen keinen Bauplan mehr und können deshalb keine Eiweiße mehr herstellen. Eiweiße sind lange Ketten (Polymere, poly = viele), in denen Aminosäuren genannte Monomere (mono = 1) wie die Perlen einer Perlenkette aneinander gereiht sind.

Monomere, Oligomere und Polymere
Monomere, Oligomere und Polymere aus Buchstaben

Monomer nennt man einen Baustein, eine Untereinheit oder eine Perle, die eine lange Kette bildet. Beispiele für Monomere unter den Biomolekülen sind Aminosäuren und Nukleotide.

Oligomer nennt man eine kurze Kette aus mehreren Monomeren. Beispiele dafür sind Oligonukleotide und die Peptide, die beispielsweise bei der Vorverdauung von Proteinen im Magen entstehen.

Polymer nennt man eine lange Kette aus vielen Monomeren. Beispiele sind Ketten aus vielen Perlen, Proteine aus vielen Aminosäuren oder Nukleinsäuren (DNA oder RNA) aus vielen Nukleotiden.

Roland Heynkes, CC BY-SA-3.0 DE

Anders als eine Halskette sind die Aminosäureketten (Eiweiße) allerdings meistens eng zusammen geknäuelt. Dabei hängen die Form (Struktur) und die Funktion eines Eiweißes von der Reihenfolge der Aminosäuren in der Kette ab. Denn die Reihenfolge der Aminosäure bestimmt, wie sich die Kette (das Protein) zusammenfaltet.

Hühner-Eiweiß Lysozym
Hühnereiweiss-Lysozym

Links sieht man das kleine Enzym Lysozym aus Hühner-Eiweiß. Das von mir mit dem Java-Programm JMol und den hochauflösenden Daten 2VB1 der Protein Data Bank erzeugte Bild zeigt, wie sich die Kette von 129 (zur besseren Unterscheidung) unterschiedlich gefärbten Aminosäuren relativ dicht zusammen ballt.

Roland Heynkes, CC BY-SA-3.0 DE

Um ein Protein synthetisieren zu können, braucht eine Zelle eine Bauanleitung. Solch eine Bauanleitung nennt man Gen. Die Summe aller Gene nennt man Genom oder Bauplan der Zelle bzw. des Lebewesens. Im Gegensatz zum Bauplan eines Hauses oder Flugzeugs besteht allerdings der Bauplan einer Zelle nicht aus Papier, sondern aus DNA. Genau wie die Eiweiße ist auch die DNA ein Polymer, denn DNA besteht aus einer langen Kette von Monomeren, die man Nukleotide nennt.

DNA-Doppelhelix
DNA-Doppelhelix

Rechts oben erkennt man die ringförmigen Desoxyribose-Moleküle und dazwischen je ein Phosphat-Molekül. Sich abwechselnd bilden sie das Rückrat der DNA. Im rechten Winkel dazu stehen die Basen (Nukleobasen). Gestrichelt sieht man die Wasserstoffbrückenbindungen zwischen den Nukleobasen. Sie verbinden die beiden DNA-Stränge der DNA-Doppelhelix.

Roland Heynkes, CC BY-SA-3.0 DE

Auch das folgende animierte gif zeigt die DNA-Doppelhelix.

animiertes Schema der DNA-Doppelhelix
DNA-Doppelhelix
Richard Wheeler, CC BY-SA 3.0
Die Animation erschwert zwar die genaue Betrachtung, vermittelt dafür aber ein intuitives Gefühl für die Struktur der DNA-Doppelhelix. Dabei hilft die Farbcodierung. Kohlenstoff-Atome sind grün dargestellt, Stickstoff blau, Sauerstoff rot, Phosphor orange und Wasserstoff grau. Dadurch wirken im DNA-Rückrat Desoxyribose grünorange und Phosphat rotorange, während dazwischen die Nukleobasen blaugrün gesprenkelt aussehen.

Die Nukleotide entsprechen den Buchstaben unserer Schriftsprache. DNA enthält 4 verschiedene Sorten von Nukleotiden (Desoxyadenosinmonophosphat, Desoxycytidinmonophosphat, Desoxyguanosinmonophosphat und Desoxythymidinmonophosphat). Die Information eines Gens steckt in der Reihenfolge der Nukleotide, so wie sich die Bedeutung eines Wortes aus der Reihenfolge seiner Buchstaben ergibt. Weil der Zucker Desoxyribose und die Phosphat-Gruppe bei allen DNA-Nukleotiden gleich sind und nur das Rückrat der DNA bilden, steckt die Information genauer gesagt in der Reihenfolge der Nukleobasen Adenin, Cytosin, Guanin und Thymin. Diese Namen kann man sich schon leichter merken und zudem mit A, C, G und T abkürzen. Jeweils A und T sowie C und G bilden die unten dargestellten, durch Wasserstoffbrückenbindungen verbundenen Basenpaare.

Basenpaar nennen Biologen Paare, welche die Nukleobasen Adenin (A) und Thymin (T) oder die Nukleobasen Cytosin (C) und Guanin (G) über Wasserstoffbrückenbindungen innerhalb einer oder zwischen zwei Nukleinsäuren bilden.
AT-Basenpaar
anonymer Professor für organische Chemie, CC0 1.0
CG-Basenpaar
anonymer Professor für Organische Chemie, CC0 1.0

Die Reihenfolge der Aminosäuren eines Proteins wird beschrieben (codiert) durch die Reihenfolge der Nukleotide in der DNA. Allerdings gibt es für die 20 verschiedenen Aminosäuren keine 20 verschiedenen Nukleotide, sondern nur vier. Mit nur vier unterschiedlichen Nukleobasen ließen sich nur vier Aminosäuren codieren. Bildet man Kombinationen aus je zwei aufeinander folgenden Nukleobasen, dann sind 42 = 16 Kombinationen möglich (AA, AC, AG, AT, CA, CC, CG, CT, GA, GC, GG, GT, TA, TC, TG und TT). Auch das reicht noch nicht. Um 20 Aminosäuren codieren zu können, müssen Kombinationen von jeweils 3 nebeneinander liegenden Nukleotiden als eine Art Wort gewertet werden. Diese Worte aus jeweils 3 Buchstaben nennt man Basentripletts oder kurz Tripletts (Tri = 3) und davon sind 4 x 4 x 4 = 43 = 64 verschiedene möglich. Daraus folgt, dass die meisten Aminosäuren durch mehrere Tripletts codiert werden. Außerdem gibt es die Tripletts, die Stopp bedeuten. Die sogenannte Codonsonne zeigt die Bedeutung aller Tripletts.

die Codonsonne
Codon-Sonne

Unten in der Codonsonne sieht man, wie die Aminosäure Methionin (Met, M) durch das Triplett AUG codiert wird. Dabei stehen die Buchstaben A, U und G für die Ribonukleotide Adenosin, Uridin und Guanosin

Man nennt diese codierenden Tripletts auch Codons und deshalb die ganze Abbildung Codonsonne.

Die Codons UAA, UAG und UGA heißen Stoppcodons, weil sie zum Abbruch der Proteinbiosynthese führen.

Das Codon AUG für Methionin ist gleichzeitig auch das Startcodon, an dem die Proteinbiosynthese beginnt. Damit legt es auch das Leseraster fest. Denn bei einer Verschiebung um 1 oder 2 Nukleobasen bekäme man völlig andere Tripletts.

Mouagip, Public Domain

Bei noch teilungsfähigen eukaryotischen Zellen befindet sich der Bauplan (das Genom) in Form von DNA Zellkern. Unter anderem damit diese wertvolle DNA den schützenden Zellkern nicht verlassen muss, werden von jedem aktiven Gen des Genoms in einem Transkription genannten Prozess von einem speziellen Enzym (DNA-abhängige RNA-Polymerase) Umschriften (Transkripte = Kopien auf den etwas anderen Informationsträger RNA) gemacht.

Transkription heißt der Vorgang der Produktion eines Transkriptes. Der Unterschied zwischen einer Kopie und einem Transkript besteht darin, dass eine Kopie dem Original gleicht, während ein Transkript aus einem anderen Material, in einer anderen Sprache, mit einem anderen Alphabet oder allgemein in einer anderen Codierung erstellt wird. In der Genetik versteht man darunter die Erstellung eines aus RNA bestehenden Transkriptes im Sinne einer Kopie von einer DNA. Man nennt es Transkript anstatt Kopie, weil das Transkript (die RNA) aus einem etwas anderen Material als das Original (DNA) besteht.
Das der Wikimedia commons entnommene erste Schema zeigt ein Stück entspiralisierte DNA mit getrennten Basenpaaren, wo ein Enzym-Komplex namens DNA-abhängige RNA-Polymerase an einem der beiden DNA-Einzelstränge (dem hier Antisense genannten DNA-Matrizenstrang) einen Transkript genannten und aus RNA bestehenden Gegenstrang produziert.
Schema der Transkription
anonym, The National Human Genome Research Institute, public domain
Das zweite Schema soll schrittweise den Vorgang der Transkription darstellen.
Transkription kopiert aus der Wikipedia
Roland Heynkes, CC BY-SA-4.0

Als sogenannte Boten-RNA (mRNA) transportiert sie die Bauanleitung aus dem Zellkern durch Kernporen ins Cytoplasma. Dort binden jeweils eine große und eine kleine Untereinheit eines Ribosoms an die mRNA. Beginnend am Startcodon AUG und endend an einem Stoppcodon übersetzt das Ribosom in einem Translation genannten Prozess die Nukleotidsequenz der mRNA in die Aminosäure-Sequenz eines Proteins. Dazu wird am Ribosom mit Hilfe sogenannter tRNAs jedes Triplett in eine Aminosäure übersetzt und es entsteht als Genprodukt eine Aminosäure-Kette, also ein Protein. Diese Übersetzung nennt man einfach Translation. Jede mRNA wird von mehreren Ribosomen abgelesen und anschließend abgebaut.

Die Bedeutung (Information) eines Wortes steckt nicht in Informationsträgern wie Papier und Tinte oder in seinen Buchstaben, sondern in der Reihenfolge (Sequenz) der Buchstaben auf dem Papier. Auch genetische Informationen (Erbinformationen) stecken nicht einfach im Material des Biopolymers DNA oder in deren Nukleotide genannten Monomeren. Weil Nukleinsäuren und Proteine im Gegensatz zu Kohlenhydraten unverzweigt sind, steckt bei ihnen die Information einfach in der Sequenz der Monomere. Die Erbinformationen stecken in den Sequenzen der DNA-Nukleotide (genauer: Desoxyribonukleotide). Die DNA ist allerdings eher mit einem Satz oder einem ganzen Buch als mit einem Wort zu vergleichen, weil die Nukleotidsequenz jedes DNA-Moleküls mehrere bis Tausende Rezepte (Gene) für die Herstellung von Eiweißen (Proteinen) oder RNAs enthält.

Menschliche Sprachen haben viele Buchstaben, aber digital speichern wir Texte, Bilder und Filme mit nur 2 unterschiedlichen Zuständen wie 0 und 1, An oder Aus, Loch oder kein Loch. In der DNA gibt es nur 4 verschiedene Sorten von Nukleotiden, deren Namen man mit A, C, G und T abkürzt. Unsere Erbinformationen mit den Bauanleitungen für alle unsere RNAs und Proteine sind also aufgeschrieben (codiert) in der DNA mit einem Alphabet aus nur 4 Buchstaben.

Prinzipiell reichen 4 Buchstaben für die Codierung der Aminosäure-Sequenz eines Proteins durch die Nukleotid-Sequenz einer Nukleinsäure. Allerdings stehen die nur 4 Sorten von Nukleotiden als Monomere der DNA der deutlich größeren Anzahl von 20 unterschiedlichen Aminosäuren als Monomere menschlicher Proteine gegenüber. Um 20 verschiedene Aminosäuren mit nur 4 unterschiedlichen Nukleotiden codieren zu können, müssen jeweils 3 Nukleotide zu einem Codon zusammengefasst werden, denn Codons aus nur 2 Nukleotiden könnten nur 4x4=16 verschiedene Aminosäuren codieren. Das folgende Schema soll leichter nachvollziehbar machen, wie Aminosäuresequenzen durch Nukleotidsequenzen in DNA codiert werden.

Gene codieren Proteine
Gene codieren Proteine

buchunabhängige Lerntexte

meine Biologieseite

Kommentare und Kritik von Fachleuten, Lernenden und deren Eltern sind jederzeit willkommen.

Roland Heynkes, CC BY-SA-4.0

nach oben