< Zurück zum Katalog

Protein kodierende Sequenzen sind DNA-Sequenzen, die in mRNA umgeschrieben werden und in denen die entsprechenden mRNA-Moleküle in eine Polypeptidkette übersetzt werden. Alle drei Nukleotide, die als Codon bezeichnet werden, in einer proteinkodierenden Sequenz kodieren für eine Aminosäure in der Polypeptidkette. In einigen Fällen können verschiedene Chassis ein bestimmtes Codon entweder einer anderen Sequenz zuordnen oder verschiedene Codons mehr oder weniger häufig verwenden. Daher können einige proteincodierende Sequenzen für die Verwendung in einem bestimmten Chassis optimiert sein.

Im Register beginnen proteincodierende Sequenzen mit einem Startcodon (in der Regel ATG) und enden mit einem Stoppcodon (in der Regel mit einem Doppelstoppcodon TAA TAA). Protein-codierende Sequenzen werden oft mit dem Akronym CDS abgekürzt.

Obwohl proteinkodierende Sequenzen oft als Grundbestandteile betrachtet werden, können proteinkodierende Sequenzen selbst aus einer oder mehreren Regionen, den so genannten Proteindomänen, bestehen. Somit kann eine proteincodierende Sequenz entweder als Basisteil oder als zusammengesetzter Teil von zwei oder mehr Proteindomänen eingegeben werden.

  1. Die N-terminale Domäne einer proteincodierenden Sequenz ist in mehrfacher Hinsicht besonders. Erstens enthält sie immer ein Startcodon, das sich in einem angemessenen Abstand von einer ribosomalen Bindungsstelle befindet. Zweitens weisen viele kodierende Regionen am N-Terminus besondere Merkmale auf, wie z. B. Proteinexport-Tags und Lipoprotein-Spaltungs- und Anheftungs-Tags. Diese treten am Anfang einer kodierenden Region auf und werden daher als Head-Domänen bezeichnet.
  2. Eine Proteindomäne ist eine Sequenz von Aminosäuren, die sich relativ unabhängig voneinander falten und die evolutionär als Einheit zwischen verschiedenen Protein-kodierenden Regionen verschoben werden. Die DNA-Sequenz solcher Domänen muss die In-Frame-Translation aufrechterhalten und ist daher ein Vielfaches von drei Basen. Da diese Proteindomänen innerhalb einer Proteincodierungssequenz liegen, werden sie als interne Domänen bezeichnet. Bestimmte interne Domänen haben besondere Funktionen bei der Spaltung oder dem Spleißen von Proteinen und werden als spezielle interne Domänen bezeichnet.
  3. Auch die C-terminale Domäne eines Proteins ist besonders, da sie mindestens ein Stoppcodon enthält. Andere besondere Merkmale, wie z. B. Abbau-Markierungen, müssen sich ebenfalls am äußersten C-Terminus befinden. Auch diese Domänen können nicht funktionieren, wenn sie sich innerhalb einer kodierenden Region befinden, und werden als Tail-Domänen bezeichnet.

Weitere Einzelheiten zu Proteindomänen, einschließlich der Frage, wie Proteindomänen in kodierende Proteinsequenzen eingebaut werden können, finden Sie unter Proteindomänen.

Protein kodierende Sequenzen sollten wie folgt aussehen

GAATTC GCGGCCGC T TCTAG T ACTAGT A GCGGCCG CTGCAG

Hilfe:Protein kodierende Sequenzen/Design

Design: Sind Sie daran interessiert, eine neue Protein-codierende Sequenz zu entwerfen? Hier finden Sie einige Richtlinien, die Ihnen beim Entwurf neuer Protein-codierender Sequenzen helfen.
Hilfe:Protein-codierende Sequenzen

Hilfe: Ein Glossar, FAQ und weiterführende Informationen zu Translationseinheiten, Protein-codierenden Sequenzen und Proteindomänen.

Gebräuchliche Protein-codierende Sequenzen

Protein-codierende Sequenzen/Reporter

Reporter: Reporter sind Proteine, die zur Messung der Genexpression oder anderer intrazellulärer Ereignisse verwendet werden können. Reporter erzeugen im Allgemeinen ein messbares Signal wie Fluoreszenz, Farbe oder Lumineszenz.
Protein kodierende Sequenzen/Transkriptionsregulatoren

Transkriptionsregulatoren: Hier werden Proteine aufgeführt, die an der Aktivierung oder Unterdrückung der Transkription beteiligt sind.
Protein kodierende Sequenzen/Selektionsmarker

Selektionsmarker: Proteine, die Zellen einen Selektionsvorteil oder -nachteil verschaffen, einschließlich Antibiotikaresistenzmarker. Diese proteinkodierenden Sequenzen sind nützlich für die Selektion von Zellen mit einem bestimmten Merkmal, z. B. mit einem Plasmid.

Enzyme

Proteinkodierende Sequenzen/Biosynthese

Biosynthese: Hier werden Enzyme aufgeführt, die an der Produktion oder dem Abbau von Chemikalien und Metaboliten beteiligt sind.
Protein kodierende Sequenzen/DNA-Modifikation

DNA-Modifikation: Enzyme, die bei der DNA-Spaltung, -Exzision, -Integration, -Ligation, dem Umbau des Chromatins und der Replikation eingesetzt werden.
Protein kodierende Sequenzen/Spaltung

Proteasen: Proteasen spalten oder bauen andere Proteine ab. Einige Proteasen können sich sogar selbst spalten.
Protein kodierende Sequenzen/Posttranslationale Modifikation

Posttranslationale Modifikationsenzyme: Einige Enzyme modifizieren andere Proteine posttranslational, indem sie z. B. eine Phophat- oder Methylgruppe hinzufügen oder entfernen.

Sonstige Protein kodierende Sequenzen

Protein kodierende Sequenzen/Membran

Membranproteine: Oberflächendisplaypeptide, Transporter, Kanäle und Pumpen sind hier aufgeführt.
Protein kodierende Sequenzen/Bindung

Rezeptoren und Liganden: Rezeptoren und Liganden, die nicht mit der Zellmembran assoziiert sind.
Protein kodierende Sequenzen/Lyse

Lysis-Proteine: Proteine, die an der Abtötung von Zellen durch Zerstörung der Membran beteiligt sind.