Information

Vorhersage, wie Proteine ​​gespalten werden


Ist es möglich vorherzusagen, wie Proteine, die von mRNA kodiert werden, gespalten werden?

Der Grund, warum ich mich dafür interessiert habe, ist, dass ich einige anfängliche Arbeiten zur Übersetzung der rohen Coronavirus-RNA-Sequenzen durchgeführt habe, die Sie hier sehen können: https://github.com/imranq/coronavirus. Der Hintergrundabschnitt unten enthält weitere Informationen zu meinem Ansatz.

Mit dem "naiven" Ansatz zur Translation von Coronavirus-RNA mit AUG als Startcodon kann ich 7 von 24 Proteinen aus Zhang-Laborsequenzen identifizieren. Ich habe jedoch auch einen String-Matching zwischen meinen Aminosäuresequenzen und den finalen Aminosäuresequenzen von Zhang Lab durchgeführt. Nach diesem Vergleich sehe ich, dass ich 21 von 24 Proteinsequenzen habe, die in ungespaltenen Proteinsequenzen kodiert sind.

Es wäre schön, direkt aus dem mRNA-Strang zu den letzten 24 Proteinen zu gelangen. Bitte helfen Sie. Vielen Dank!

Hintergrund

Hier ist die Reihe von Schritten, die ich verwendet habe, um Coronavirus-RNA in Proteine ​​umzuwandeln.

1. Die rohen RNA-Sequenzen sind hier (vom NIH bezogen): https://github.com/imranq/coronavirus/blob/main/data/rawrna.json 2. Das Skript zum Übersetzen der RNA ist hier (vorausgesetzt, AUG ist das Startcodon): https://github.com/imranq/coronavirus/blob/main/scripts/translate.js Die übersetzten Proteinsequenzen sind hier: https://github.com/imranq/coronavirus/blob/main/data /processed/translatedProteins.json 3. Das Skript, das verwendet wird, um einen Vergleich zwischen den übersetzten Proteinen und den bekannten Proteinsequenzen zu generieren, ist hier (mit der Levenshtein-Distanz als Differenzmetrik): https://github.com/imranq/coronavirus/blob/ main/scripts/compareTranslated.js Die von diesem Skript generierten Daten sind hier https://github.com/imranq/coronavirus/blob/main/data/processed/translatedComparison.json 4. Dann erkennen wir die Spaltung in Proteinen, indem wir einen Schiebevorgang ausführen Fenster über RNA-Segmente zwischen den bekannten und translatierten Proteinen. Das Skript dazu ist hier: https://github.com/imranq/coronavirus/blob/main/scripts/detectCleavage.js 4. Abschließend führen wir die von uns generierten Datensätze aus Translation und Proteinkomplexen zu einem Datensatz zusammen, übersetzte Proteine ​​und Proteinkomplexe, die an bekannte Proteine ​​angepasst sind. Die von diesem Algorithmus generierten Daten befinden sich hier https://github.com/imranq/coronavirus/blob/main/data/processed/mergedProteins.json

Am Ende dieser Pipeline erhalten wir 21 der 24 passenden Proteine ​​direkt aus der RNA.

Verweise:

Hier sind die Papiere / Artikel, die ich recherchiert habe, um diese Frage zu beantworten

Umwandlung von Genomdaten in Proteine

Genetischer Code der Khan Academy: https://www.khanacademy.org/science/ap-biology/gene-expression-and-regulation/translation/a/the-genetic-code-discovery-and-properties

Zhan Lab - SARS CoV 2 - Nukleotid, Kodierungsregion und Proteinsequenzen https://zhanglab.ccmb.med.umich.edu/COVID-19/

Mehr in der Readme hier: https://github.com/imranq/coronavirus/blob/main/README.MD


Google KI löst langjähriges, nahezu unmögliches biologisches Problem

Das DeepMind-Team von Google hat einen Algorithmus für künstliche Intelligenz entwickelt, der anscheinend eine biologische Herausforderung geknackt hat, die so kompliziert ist, dass sie jahrzehntelang fast unmöglich schien.

DeepMind gab am Montag in einem Blogbeitrag bekannt, dass seine Wissenschaftler einen Algorithmus entwickelt haben, AlphaFold 2, der das sogenannte Proteinfaltungsproblem löst: ein ehrgeiziges wissenschaftliches Unterfangen mit dem Ziel, die Form von Proteinen allein aufgrund ihrer Zusammensetzung vorherzusagen. Die Vorhersage der Proteinstruktur verbessert die biomedizinische Wissenschaft erheblich und ermöglicht es Ärzten, neue Behandlungen noch schneller zu entwickeln.


G4. Vorhersage der Membranproteinstruktur

  • Beigetragen von Henry Jakubowski
  • Professor (Chemie) am College of St. Benedict/St. Johns Universität

Bisher haben wir überwiegend globuläre Proteine ​​diskutiert, die in Wasser löslich sind. Proteine ​​werden auch in Verbindung mit Membranen gefunden. In der Natur kommen zwei Hauptklassen von Membranproteinen vor.

  • periphere Membranproteine: wasserlösliche Proteine, die durch elektrostatische Anziehung zwischen geladenen polaren Kopfgruppen der Phospholipide und dem Protein reversibel und nicht-kovalent an die Membran gebunden werden. Diese Proteine ​​können oft durch Zugabe von hohem Salzgehalt von der Membran freigesetzt werden, da sie oft durch elektrostatische Wechselwirkungen zwischen geladenen Phospholipid-Kopfgruppen und polaren/geladenen Gruppen auf der Proteinoberfläche von der Doppelschicht angezogen werden.
  • integrale Membranproteine: fügen sich tatsächlich in die Doppelschicht ein. Diese können von der Membran freigesetzt und durch Zugabe von einkettigen Amphiphilen (Detergenzien), die mit dem integralen Membranprotein eine gemischte Mizelle bilden, effektiv solubilisiert werden. Nichtionische Detergenzien (Trition X-100, Octylglucosid usw.) werden häufig bei der Reinigung von Membranproteinen verwendet. Ionische Detergenzien (wie SDS) lösen nicht nur die integralen Membranproteine, sondern denaturieren sie auch.

Abbildung: Arten von Membranproteinen

In einigen dieser integralen Membranproteine ​​sind große extrazelluläre und intrazelluläre Domänen des Proteins vorhanden, die durch die Intramembranregionen verbunden sind. Die die Membran überspannende Region besteht oft entweder aus einer einzelnen Alpha-Helix oder aus 7 verschiedenen helikalen Regionen, die im Zickzack durch die Membran verlaufen. Diese Transmembransequenzen können leicht durch Hydropathieberechnungen bestimmt werden. Betrachten wir zum Beispiel das integrale Membranrinderprotein Rhodopsin. Seine Sequenz von 348 Aminosäuren (im Einzelbuchstabencode) ist unten gezeigt:

MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLG
GEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLVGWSRYIP
EGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQES
ATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAV
YNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA

Berechnungen der Rhodopsin-Hydropathie-Plots zeigen, dass es sieben Transmembran-Helices enthält, die sich serpentinenartig durch die Membran winden.

Abbildung: Rhodopsin-Hydropathie-Diagramm

Abbildung: sieben Transmembranhelices

Ergebnisse der Rhodopsin-Hydropathie

Nein. N-Klemme Transmembranregion C-Klemme Typ Länge
1 40 LAAYMFLLIMLGFPINFLTLYVT 62 PRIMÄR 23
2 71 PLNYILLNLAVADLFMVFGGFTT 93 SEKUNDÄR 23
3 113 EGFFATLGGEIALWSLVVLAIER 135 SEKUNDÄR 23
4 156 GVAFTWVMALACAAPPLVGWSRY 178 SEKUNDÄR 23
5 207 MFVVHFIIPLIVIFFCYGQLVFT 229 PRIMÄR 23
6 261 FLICWLPYAGVAFYIFTHQGSDF 283 PRIMÄR 23
7 300 VYNPVIYIMMNKQFRNCMVTTLC 322 SEKUNDÄR 23

Zusammenfassend sind Hydropathie-Plots daher nützlich, um vergrabene Regionen in wasserlöslichen Proteinen, Transmembran-Helices in integralen Membranproteinen sowie kurze Abschnitte von polaren/geladenen Aminosäuren zu finden, die Oberflächenschleifen bilden könnten, die von Antikörpern des Immunsystems erkennbar sind. Die in Hydropathie-Plots verwendete Fenstergröße würde offensichtlich die berechneten Ergebnisse beeinflussen. Fenster von 20 Aminosäuren sind nützlich, um Transmembranhelices zu bestimmen, während Fenster von 5-7 Aminosäuren verwendet werden, um oberflächenexponierte hydrophile Stellen zu finden.

Membranproteine ​​können durch Zugabe von einkettigen Amphiphilen (Detergenzien) solubilisiert werden. Die unpolaren Schwänze der Detergenzien wechselwirken mit der hydrophoben Transmembrandomäne des Membranproteins und bilden eine "gemischte" micellartige Struktur. Nichtionische Detergenzien wie Triton X-100 und Octylglucosid werden häufig verwendet, um Membranproteine ​​in ihrem nahezu nativen Zustand zu solubilisieren. Im Gegensatz dazu denaturieren ionische Detergenzien wie Natriumdedecylsulfat (mit einer negativ geladenen Kopfgruppe) Proteine ​​während des Solubilisierungsprozesses. Um Membranproteine ​​in einer nativeren Umgebung zu untersuchen, können Proteine, die durch ein nichtionisches Detergens solubilisiert wurden, in zweischichtige Liposomenstrukturen rekonstituiert werden, indem Methoden ähnlich denen aus Labor 1 verwendet werden, in denen Sie farbstoffverkapselte große unilamellare Vesikel (LUVs) hergestellt haben. Es kann jedoch schwierig sein, die intra- und extrazellulären Domänen von Membranproteinen in Liposomen zu untersuchen, da eine dieser Domänen im Inneren des Liposoms verborgen ist. Eine neuartige Technik, die diese Barriere beseitigt, wurde kürzlich von Sligar entwickelt. Er schuf eine amphiphile Proteinscheibe mit einer Öffnung in der Mitte. Die innere Öffnung ist mit unpolaren Rückständen ausgekleidet, während die äußere Oberfläche der Scheibe polar ist. Wenn die Scheiben zu Phosphipiden hinzugefügt wurden, bildeten sich kleine Doppelschichten im Inneren der Scheibe. Membranproteine ​​wie der adrenerge b-2-Rezeptor könnten in den Nanoscheiben-Doppelschichten rekonstituiert werden, was eine Lösungsmittelexposition sowohl der intrazellulären als auch der extrazellulären Domänen des Rezeptorproteins ermöglicht.


AlphaFold ist aus tiefem Lernen von Schach, Go und Pokerspielen entstanden

Der Erfolg des Proteinfaltungs-Vorhersageprogramms von DeepMind, genannt AlphaFold, ist nicht unerwartet. Andere von DeepMind geschriebene Deep-Learning-Programme haben die weltbesten Schach-, Go- und Pokerspieler zerstört.

Im Jahr 2016 war Stockfish-8, eine Open-Source-Schach-Engine, Weltmeister im Computerschach. Es wertete 70 Millionen Schachstellungen pro Sekunde aus und verfügte über Jahrhunderte angesammelter menschlicher Schachstrategien und jahrzehntelanger Computererfahrung, auf die man zurückgreifen konnte. Es spielte effizient und brutal und besiegte gnadenlos alle seine menschlichen Herausforderer ohne ein bisschen Finesse. Betreten Sie Deep Learning.

Am 7. Dezember 2017 hat Googles Deep-Learning-Schachprogramm AlphaZero Stockfish-8 verprügelt. Die Schachengines spielten 100 Partien, wobei AlphaZero 28 gewann und 72 unentschieden blieb. Es verlor kein einziges Spiel. AlphaZero führte nur 80.000 Berechnungen pro Sekunde durch, im Gegensatz zu den 70 Millionen Berechnungen von Stockfish-8, und es dauerte nur vier Stunden, um Schach von Grund auf neu zu lernen, indem es einige Millionen Mal gegen sich selbst spielte und seine neuronalen Netze nach seinen Erfahrungen optimierte.

AlphaZero hat nichts von Menschen oder von Menschen gespielten Schachspielen gelernt. Es hat sich selbst beigebracht und daraus noch nie dagewesene Strategien abgeleitet. In einem Kommentar im Science-Magazin schrieb der ehemalige Schachweltmeister Garry Kasparov, dass AlphaZero durch das Lernen aus dem Spielen selbst Strategien entwickelt habe, die „die Wahrheit“ des Schachs widerspiegeln, anstatt „die Prioritäten und Vorurteile“ der Programmierer widerzuspiegeln. „Es ist die Verkörperung des Klischees ‚work smarter, not harder‘.“

Wie falten sich Proteine?


Vorhersage einer Proteinstörung anhand der Aminosäuresequenz

Strukturelle Störungen sind für die Funktion von Proteinen in verschiedenen biologischen Prozessen von entscheidender Bedeutung. Es ist daher höchst wünschenswert, den Grad der Ordnung und Unordnung anhand der Aminosäuresequenz vorhersagen zu können. Forscher haben ein Vorhersagewerkzeug entwickelt, indem sie maschinelles Lernen zusammen mit experimentellen NMR-Daten für Hunderte von Proteinen verwenden, das für Strukturstudien und das Verständnis der biologischen Rolle und Regulation von Proteinen mit ungeordneten Regionen nützlich sein soll.

Im letzten Jahrhundert hat Anfinsen zweifelsfrei gezeigt, dass ein Protein zu seiner „nativen“ dreidimensionalen Struktur zurückfinden kann, nachdem es „denaturierenden Bedingungen“ ausgesetzt wurde, in denen die Proteinstruktur entfaltet wird. Die tiefgreifende Schlussfolgerung seiner Experimente war, dass anscheinend die Information, die die Suche zurück zum nativen Zustand steuert, in der Aminosäuresequenz verborgen ist. Thermodynamische Überlegungen führen dann zu einer Sichtweise, bei der der Faltungsprozess wie ein energetisches Abwärtsrollen zum tiefsten Punkt ist – zur einzigartigen nativen Struktur. Diese Erkenntnisse wurden oft mit dem zentralen Dogma der Molekularbiologie verwoben. Somit kodiert ein Gen für eine Aminosäuresequenz und die Sequenz kodiert für eine spezifische Struktur.

Geben Sie intrinsisch ungeordnete Proteine ​​ein.

Der nächste Durchbruch kam mit dem Aufkommen der billigen und schnellen Genomsequenzierung im Zuge des Humangenomprojekts. Nachdem Tausende von Genomen verschiedener Organismen sequenziert waren, machten die Wissenschaftler eine erstaunliche Entdeckung – es gab viele, viele Gene, die für Proteine ​​mit kodierten geringe Komplexität. Mit anderen Worten, diese Proteine ​​enthielten nicht die richtigen Aminosäuren, um sich zu falten, und Experimente bestätigten, dass sie „intrinsisch ungeordnet“ blieben. Außerdem stellte sich heraus, dass im menschlichen Genom mehr als ein Drittel seiner Gene für Proteine ​​kodieren disAuftrag!

Wie erkennt man eine Proteinstörung?

Da ungeordnete Proteine ​​sehr flexibel sind, können sie nicht kristallisiert werden und daher können keine Informationen aus der Röntgenbeugung an Proteinkristallen gewonnen werden – der Ansatz, der für gefaltete Proteine ​​so entscheidend war. Stattdessen müssen diese Proteine ​​in Lösung untersucht werden, und dafür ist die NMR-Spektroskopie (Nuclear Magnetic Resonance) das am besten geeignete Werkzeug. Bei dieser Methode wird für jedes Atom im Molekül eine quantenphysikalische Eigenschaft namens „Spin“ in einem starken Magnetfeld gemessen. Die genauen Präzessionsfrequenzen der Spins hängen von ihrer Umgebung ab, und genau diese Frequenz erlaubt es den Forschern, quantitativ zu messen, inwieweit jede Aminosäure im Protein geordnet oder ungeordnet ist.

In ihrem neuen Paper, das am 8. September 2020 veröffentlicht wurde, haben Dr. Rupashree Dass zusammen mit Associate Professor Frans Mulder und Assistant Professor Jakob Toudahl Nielsen maschinelles Lernen zusammen mit experimentellen NMR-Daten für Hunderte von Proteinen verwendet, um ein neues Bioinformatik-Tool zu bauen, das sie genannt haben ODiNPred. Dieses Bioinformatik-Programm kann anderen Forschern helfen, bestmögliche Vorhersagen darüber zu treffen, welche Regionen ihrer Proteine ​​starr und welche wahrscheinlich flexibel sind. Diese Informationen sind nützlich für Strukturstudien sowie zum Verständnis der biologischen Rolle und Regulation von intrinsisch ungeordneten Proteinen.


Wie gelangen Proteine ​​in die Mitochondrien?

Wenn die innere Membran so undurchlässig ist, wie gelangen dann Proteine?

Die äußere Membran der Mitochondrien enthält das Protein „Porin“. Dies bildet einen wässrigen Kanal, durch den Proteine ​​bis zu 10.000 Dalton passieren und in den Intermembranraum gelangen können. Tatsächlich äquilibrieren die kleinen Moleküle tatsächlich zwischen der äußeren Membran und dem Zytosol. Die meisten Proteine ​​können jedoch nicht in die Matrix gelangen, wenn sie nicht die innere Membran passieren. Diese Membran enthält Cardiolipin, das sie praktisch undurchlässig macht. Dies erfordert besser organisierte und regulierte Transportmechanismen durch die Membran. Eine sehr einfache Ansicht des Prozesses ist in diesem Cartoon dargestellt.

Diese Abbildung stammt von Alberts et al., Molecular Biology of the Cell, Garland Publishing, N.Y. 1994, 3. Auflage

Der Transport durch die mitochondrialen Membranen erfordert die konzertierte Aktion einer Reihe von Translokationsmaschinen. Die Maschinerie in der äußeren Membran heißt Tom-Komplex (TErpresser ÖGebärmutter mEmbrane) und das für die innere Membran heißt Tim-Komplex (TErpresser ichnner mEmbrane). Proteine, die bis zur Matrix gehen müssen, haben ein NH2 spaltbare Signalsequenz (siehe obiger Cartoon).

Die meisten Proteine ​​müssen abgewickelt oder gestreckt werden, um durch die Translokatoren zu gelangen. Dies beinhaltet die ATP-Bindung und wird durch ein Chaperon-Protein, einschließlich hsp70, überwacht und stabilisiert. Bevor das Protein den Tom-Komplex durchlaufen kann, muss es also „translokationskompetent“ werden.

Transport durch die äußere Membran: Merkmale des Tom-Komplexes.

Es überrascht nicht, dass der TOM-Komplex Importrezeptoren umfasst, die anfänglich das Signalpeptid oder eine Signalsequenz erkennen (dazu gehören Tom20, Tom22 und Tom70). Unterschiedliche Proteine ​​verwenden unterschiedliche Rezeptoren. Im obigen Cartoon wird der Rezeptor als blaues Oval dargestellt, in das das Signalpeptid eingefügt ist. Die Rezeptoren bringen das Protein dann in die Region, die die Translokatorproteine ​​enthält. Dies ist eigentlich ein Komplex von Proteinen.
Sie wird als General Import Pore (GIP) bezeichnet und erleichtert die Translokation der Präsequenz des Proteins durch die äußere Membran. (das GIP besteht aus Tom40, Tom5, Tom 6 und Tom7). Tom40 scheint das Kernelement der Pore zu sein und bildet Oligomere. Es durchquert die Membran als eine Reihe von 14 antiparallelen Beta-Strängen, die ein Beta-Fass bilden. Es interagiert auch mit Polypeptidketten, die die Pore passieren. Alle anderen Tom-Komponenten in GIP sind durch helikale Transmembransegmente (hydrophobe Anker) an der äußeren Membran verankert.

Aktuelle Studie von Tom40: Rapaport, D und Neupert W, Biogenesis of Tom40, Core Component of the TOM Complex of Mitochondria. J Cell Biol 146 321-332, 1999. Die Studie untersuchte, wie Tom40 in die äußere Membran eindrang und ein Teil des GIP wurde. Die Studie berichtet, dass:

  • Erstens benötigt Tom40 wie viele mitochondriale Proteine ​​zytosolische Chaperone, um es auf den Eintritt vorzubereiten. Im Fall dieses Proteins erfordert die "Translokationskompetenz" ATP und einen teilweise gefalteten Zustand (letzterer wird durch das zytosolische Chaperon (hsp70) vermittelt).
  • Zweitens, wenn es "kompetent" ist, interagiert es mit dem Oberflächenrezeptor Tom20. Es gibt jedoch kein spaltbares Signalpeptid. Die Experimente, die das Erfordernis einer teilweisen Faltung zeigen, legen nahe, dass Targeting-Informationen an diskontinuierlichen Stellen gefunden werden, die in der gefalteten Domäne zusammengeführt sind.
  • Die endgültige Insertion erfolgt in bereits bestehende Tom-Komplexe. Dies erfordert einen intakten N-Terminus.
  • Die Dimerisierung erfolgt nach Eintritt in die Membran.

Eigenschaften von Tim-Komplexen

Mitochondriale Proteine, die für die Matrix bestimmt sind, weisen oft ein spaltbares Signalpeptid auf dem Protein auf, das erkannt werden muss, bevor es durch den mitochondrialen Translokator aufgenommen wird. Diese Proteine ​​mit "aminoterminalen Signalen" (Ihr Text) oder "Präproteinen" oder "Präsequenzen" (aktuelle Literatur) interagieren normalerweise zuerst mit Tom20. Dann müssen sie die äußere Membran passieren. Dazu werden sie in den GIP-Komplex überführt: Zunächst interagieren sie mit Tom22 und Tom5, wodurch sie in die von Tom40 gebildete Pore gelangen. Über den Porenkomplex aus Tim23 und Tim17, der sich in der inneren Membran befindet, treten sie dann in die Matrix ein. Sehr wichtig ist auch, dass ihr Eintritt vom Membranpotential abhängt. Dies wird durch die Elektronentransportkomplexe aufgebaut. Denken Sie daran, dass Wasserstoffionen in den Zwischenmembranraum gepumpt werden, wodurch ein Ladungsgradient entsteht, der an der Matrixstelle negativer ist. Dieses Membranpotential hilft tatsächlich dabei, das Protein in die Tim23-Tim17-Kanäle zu ziehen. Das Protein tritt dann in die Matrix ein, wo das spaltbare Präprotein durch eine Protease, MPP, abgeschnitten wird. mt-hsp 70 in der Matrix arbeitet mit Tim44 zusammen, um die vollständige Übertragung in die Matrix abzuschließen. mthsp70 und Tim 44 "ziehen" das Protein tatsächlich durch einen Prozess in die Matrix, der ATP erfordert. Es erfordert auch das Membranpotential, das durch die Elektronentransportkette aufgebaut wird.

Einige mitochondriale Proteine, die für die innere Membran bestimmt sind, haben eine spaltbare Präsequenz, gefolgt von einem oder mehreren hydrophoben membranüberspannenden Segmenten, die als Stop-Transfer-Sequenzen in der IM fungieren oder dazu dienen, das Polypeptid in die IM zu inserieren, nachdem es in die Matrix gelangt ist. Diese sind wie die in der Einheit beschriebenen Typ-I-Membranproteine ​​auf dem rauen endoplasmatischen Retikulum.

Andere Proteine ​​haben jedoch kein spaltbares Targeting-Signal (Typen II und III). Mitochondriale Proteine, die eine interne Signalsequenz aufweisen (Beispiele umfassen eine Reihe von Proteinen in der inneren Membran), interagieren im Allgemeinen mit Tom70 als Rezeptor. Dann, nachdem sie die äußere Membran über den GIP-Komplex passiert haben, treten sie in den speziellen Tim-Weg ein. Dies kann Wechselwirkungen mit kleinen Tims des Intermembranraums und Tim22-Tim54 der inneren Membran selbst beinhalten.

Diejenigen Proteine, die keine spaltbare Targeting-Signalsequenz aufweisen, weisen oft Signale mit den folgenden Eigenschaften auf: Sie sind oft ein Abschnitt von positiv geladenen Aminosäuren (manchmal neben einer membranüberspannenden hydrophoben Region). Manchmal bilden diese Schleifen, die der Matrix zugewandt sind. Denken Sie daran, dass die "positive innere Regel" positiv geladene Aminosäuren auf der zytosolischen Seite konzentriert, um Proteine ​​in das raue endoplasmatische Retikulum einzufügen. Diese mitochondrialen Proteine ​​neigen dazu, dieser Regel zu folgen, nur die Matrix wird der Ort, an dem die positiven Ladungen am zahlreichsten sind.

Beispiele aus der Literatur:

Davis, AJ, Ryan, KR und Jensen, RE Tim23p enthält separate und unterschiedliche Signale für das Targeting auf die Mitochondrien und die Insertion in die innere Membran. Molekularbiologie der Zelle 9: 2577-2593 (1999).

  • Tim23 ist eines der Translokatorproteine ​​der inneren Membran. Es besitzt keine aminoterminale Präsequenz. Targeting-Informationen werden innerhalb des reifen Proteins gefunden.
  • Tim23 hat 4 Transmembransegmente und zwei positiv geladene Schleifen, die der Matrix zugewandt sind. Was wird benötigt, um einen Import zu signalisieren?
  • Ersetzte positiv geladene Aminosäuren in einer oder beiden Schleifen durch Alaninreste.
  • Mindestens eine dieser Schlaufen wird zum Einführen in die Innenmembran benötigt.
  • Das Signal zum Targeting auf Mitochondrien findet sich in mindestens zwei der hydrophoben Transmembransegmente.

Kurz, M, Martin, H, Rassow, J, Pfanner, N, und Ryan, MT. Biogenese von Tim-Proteinen des mitochondrialen Carrier-Importwegs: Differenzielle Targeting-Mechanismen und Crossing-Over mit dem Hauptimportweg. Molekularbiologie der Zelle 10: 2461-2474 (1999). Verglichen den Weg und die Bindung von drei Tim-Proteinen

  • Tim54 trägt eine aminoterminale, ungespaltene Translokationssequenz, die positiv geladen ist. Es bevorzugt jedoch Tom70 als Rezeptor anstelle von Tom20 zu verwenden. Nachdem es sich durch das GIP bewegt hat, verwendet es seine positiv geladene aminoterminale Sequenz, um in die Matrix einzutreten. Es erforderte Chaperone und ATP, um zur Matrix zu gelangen.
  • Tim22 ist ein hydrophobes Protein, das Tom20 verwendet, um auf das OM zu zielen. Dann folgt es der Tim-Route für Trägerproteine, wie Tim23. Es erfordert kein Hsp70 oder ATP für den Eintritt.
  • Kleine Tims werden normalerweise im Intermembranraum gefunden und sind keine Membranproteine. Sie verwendeten Tom20 für ihren Rezeptor und die Übertragung auf den GIP-Komplex. Als Tom20 jedoch durch Trypsin zerstört wurde und nur Tom5 übrig blieb, konnten die kleinen Tims eintreten.

Der obige Cartoon aus Ihrem Text zeigt weitere Möglichkeiten, wie Proteine ​​in innere und äußere Membranen eingefügt werden können, sobald sie von den Rezeptoren erkannt werden. Wie durch Proteine ​​in den obigen Literaturbeispielen gezeigt, verwenden die Mitochondrien sowohl positiv geladene Signale als auch membranüberspannende hydrophobe Sequenzen, um zu translozieren und dann ihr endgültiges Ziel zu erreichen. Wie in den obigen Beispielen kann es mehrere Signal- und Insertionsstellen geben. Die Verteilung der geladenen Aminosäuren hilft jedoch, das Protein so auszurichten, dass sich die positiven Ladungen in der Matrix befinden. Auf diese Weise werden die Cytochrome in die Atmungskette oder die Elementarteilchen durch mitochondriale Aktionen eingefügt.

Diese Abbildung stammt von Alberts et al., Molecular Biology of the Cell, Garland Publishing, N.Y. 1994, 3. Auflage

Die folgende Abbildung stammt aus einem anderen Text von Lodish et al., Molecular Cell Biology. Es zeigt die gesamte Abfolge von Ereignissen, die erforderlich sind, um ein Protein in die Matrix aufzunehmen.

  • Schritt 1: Protein entfaltet sich, während es an hsp70-Chaperon bindet. Ein roter positiver Bereich zeigt die Targeting-Sequenz an. Die Bindung von Chaperonen ist ATP-abhängig.
  • Schritt 2: Targeting-Sequenz bindet an Rezeptor (normalerweise Tom20)
  • Schritt 3. Der Rezeptor führt das Protein an die Stelle des Translokators. Andere Tom-Proteine ​​sind beteiligt, aber Tom40 ist der Kern des Translokator-Kanals.
  • Schritt 4: Protein wird stimuliert durch das Membranpotential transloziert. Elektronentransportkomplexe auf der inneren Membran haben H+ in den Zwischenmembranraum gepumpt, wodurch die Matrix negativer bleibt. Dies zieht das Protein an (das Signal ist positiv geladen). Protein bewegt sich durch Tim-Translokatoren. Tim 44 und hsp70 in der Matrix führen und ziehen das Protein weiterhin durch die Pore. Ein ATP-erfordernder Prozess.
  • Schritt 5. Ein weiteres Chaperon (ein sogenanntes Chaperonin), hsp60, bewirkt die Faltung des Proteins in seine tertiäre Sequenz. Auch ein ATP-erfordernder Prozess.
  • Schritt 6. Die Präsequenz wird in die Matrix gespalten.

Was passiert, wenn ein Importprotein defekt ist?

Hefestudien haben uns geholfen, etwas über den Rezeptor zu erfahren, und die Translokationsmaschinerie enthält einen Komplex von Proteinen, die zusammenarbeiten, um den Eintritt zu ermöglichen. In Hefe wurden diese als MOMX bezeichnet. Reihe, wobei die Zahl die Proteinnummer bezeichnet. Ein wichtiges Protein bei der Erkennung des Signalpeptids und seiner Bindung an den Rezeptor heißt "MOM19". MOM 19 arbeitet mit MOM 72 zusammen, um die Proteine ​​zu erkennen und zu binden. Dann hilft MOM22 dem Protein, von der Rezeptorbindungsstelle zur Insertionsstelle an der äußeren Membran zu gelangen. Die Bedeutung von MOM19 kann nachgewiesen werden, indem Antikörper zu MOM19 hinzugefügt und der Import blockiert wird.

In einem kürzlich erschienenen Artikel von Harkness et al. (J Cell Biology 124: 637–648, 1995) erzeugten sie mutierte Hefezellen, die ein defektes Gen für MOM19 enthielten.

Sie enthielten auch einen arzneimittelresistenten Marker, damit sie selektiv Zellen mit dem mutierten Gen züchten konnten (in Gegenwart des Arzneimittels, p=Fluorphenylalanin oder fpa). Je länger also die Zellen im Medikament wachsen, desto mehr resistente mutierte Zellen werden gefunden. Die obigen elektronenmikroskopischen Aufnahmen stammen aus ihrer Veröffentlichung (oben zitiert). Sie zeigen das Ergebnis des fehlenden MOM19-Proteins. Was fehlt in den Zellen, die 16 oder 32 Stunden lang im Medikament gezüchtet wurden?

Welche Proteine ​​fehlten eigentlich, als sie die Proteine ​​untersuchten? Tests zeigten, dass der größte Teil der Atmungskette (Elektronentransportkette) einschließlich der Cytochrome a/a3 und b dramatisch abnahm. Cytochrom C war jedoch nicht betroffen. Dies legt nahe, dass ein anderes Protein seinen Import kontrollieren muss.


Handbuch zur Proteinzubereitung

Erfahren Sie in diesem 32-seitigen Handbuch mehr über Entsalzen, Pufferaustausch, Konzentrieren und/oder Entfernen von Verunreinigungen aus Proteinproben, Immunpräzipitation und andere Proteinreinigungs- und Reinigungsmethoden mit verschiedenen Proteinbiologie-Tools von Thermo Scientific.

  • Immunpräzipitation (IP), co-IP und Chromatin-IP
  • Rekombinante Proteinreinigungs-Tags
  • Dialysieren Sie Proteinproben sicher mit Slide-A-Lyzer-Dialysekassetten und -geräten
  • Schnelles Entsalzen von Proben mit hoher Proteinrückgewinnung mit Zeba Spin-Entsalzungssäulen und -Platten
  • Extrahieren Sie spezifische Verunreinigungen effizient mit Harzen, die für die Entfernung von Detergenzien oder Endotoxinen optimiert sind
  • Konzentrieren Sie verdünnte Proteinproben schnell mit den Proteinkonzentratoren von Pierce

Mehr erfahren

Produkte auswählen

Proteinwechselwirkungen werden grundsätzlich als stabil oder vorübergehend charakterisiert, und beide Arten von Wechselwirkungen können entweder stark oder schwach sein. Stabile Wechselwirkungen sind solche, die mit Proteinen verbunden sind, die als Komplexe mit mehreren Untereinheiten gereinigt werden, und die Untereinheiten dieser Komplexe können identisch oder unterschiedlich sein. Hämoglobin und Kern-RNA-Polymerase sind Beispiele für Wechselwirkungen mit mehreren Untereinheiten, die stabile Komplexe bilden.

Es wird erwartet, dass transiente Interaktionen die Mehrheit der zellulären Prozesse steuern. Wie der Name schon sagt, sind transiente Wechselwirkungen temporär und erfordern typischerweise eine Reihe von Bedingungen, die die Interaktion fördern, wie Phosphorylierung, Konformationsänderungen oder Lokalisierung in diskreten Bereichen der Zelle. Transiente Wechselwirkungen können stark oder schwach und schnell oder langsam sein. Im Kontakt mit ihren Bindungspartnern sind vorübergehend interagierende Proteine ​​an einer Vielzahl von zellulären Prozessen beteiligt, darunter Proteinmodifikation, Transport, Faltung, Signalübertragung, Apoptose und Zellzyklus. Das folgende Beispiel liefert eine Illustration von Proteininteraktionen, die apoptotische und anti-apoptotische Prozesse regulieren.


Schwere BAD-Protein-Protein-Interaktion. Tafel A: Coomassie-gefärbtes SDS-PAGE-Gel von rekombinantem leichten und schweren BAD-GST-HA-6xHIS, gereinigt aus HeLa IVT-Lysaten (L), unter Verwendung von Glutathionharz (E1) und Kobaltharz (E2) Tandemaffinität. Der Durchfluss (FT) von jeder Säule wird angezeigt. Tafel B: Schema der BAD-Phosphorylierung und der Proteininteraktionen während des Zellüberlebens und des Zelltods (d. h. Apoptose). Feld C: BAD-Proteinsequenzabdeckung, die identifizierte Akt-Konsensus-Phosphorylierungsstellen zeigt (roter Kasten). Tafel D: MS-Spektren des stabilen isotopenmarkierten BAD-Peptids HSSYPAGTEDDEGmGEEPSPFr.

Proteine ​​binden aneinander durch eine Kombination aus hydrophober Bindung, Van-der-Waals-Kräften und Salzbrücken an spezifischen Bindungsdomänen auf jedem Protein. Diese Domänen können kleine Bindungsspalten oder große Oberflächen sein und können nur wenige Peptide lang sein oder Hunderte von Aminosäuren umfassen. Die Stärke der Bindung wird durch die Größe der Bindungsdomäne beeinflusst. Ein Beispiel für eine gemeinsame Oberflächendomäne, die stabile Protein-Protein-Wechselwirkungen ermöglicht, ist der Leucin-Zipper, der aus α-Helices an jedem Protein besteht, die durch die hydrophobe Bindung von regelmäßig beabstandeten Leucinresten an jedem α . parallel aneinander binden -Helix, die zwischen den benachbarten helikalen Peptidketten hervorsteht. Aufgrund der engen molekularen Packung bieten Leucin-Zipper eine stabile Bindung für Multi-Protein-Komplexe, obwohl nicht alle Leucin-Zipper aufgrund von Nicht-Leucin-Aminosäuren in der α-Helix identisch binden, die die molekulare Packung und damit die Stärke des Interaktion.

Zwei Src-Homologie-(SH)-Domänen, SH2 und SH3, sind Beispiele für übliche vorübergehende Bindungsdomänen, die kurze Peptidsequenzen binden und häufig in Signalproteinen gefunden werden. Die SH2-Domäne erkennt Peptidsequenzen mit phosphorylierten Tyrosinresten, die oft auf eine Proteinaktivierung hinweisen. SH2-Domänen spielen eine Schlüsselrolle bei der Signalübertragung von Wachstumsfaktorrezeptoren, bei der die ligandenvermittelte Rezeptorphosphorylierung an Tyrosinresten nachgeschaltete Effektoren rekrutiert, die diese Reste über ihre SH2-Domänen erkennen. Die SH3-Domäne erkennt normalerweise prolinreiche Peptidsequenzen und wird üblicherweise von Kinasen, Phospholipasen und GTPasen verwendet, um Zielproteine ​​zu identifizieren. Obwohl sowohl SH2- als auch SH3-Domänen im Allgemeinen an diese Motive binden, wird die Spezifität für unterschiedliche Proteininteraktionen durch benachbarte Aminosäurereste im jeweiligen Motiv diktiert.

Das Ergebnis von zwei oder mehr Proteinen, die mit einem bestimmten funktionellen Ziel interagieren, kann auf verschiedene Weise gezeigt werden. Die messbaren Auswirkungen von Proteininteraktionen wurden wie folgt skizziert:

  • Verändern Sie die kinetischen Eigenschaften von Enzymen, die das Ergebnis geringfügiger Veränderungen der Substratbindung oder allosterischer Effekte sein können
  • Ermöglichen Sie die Substratkanalisierung, indem Sie ein Substrat zwischen Domänen oder Untereinheiten bewegen, was letztendlich zu einem beabsichtigten Endprodukt führt
  • Erstellen Sie eine neue Bindungsstelle, typischerweise für kleine Effektormoleküle
  • Inaktiviere oder zerstöre ein Protein
  • Die Spezifität eines Proteins für sein Substrat durch die Interaktion mit verschiedenen Bindungspartnern ändern, z. B. eine neue Funktion demonstrieren, die kein Protein alleine ausüben kann
  • Eine regulatorische Rolle in einem Upstream- oder Downstream-Ereignis übernehmen

Normalerweise ist eine Kombination von Techniken erforderlich, um Proteininteraktionen zu validieren, zu charakterisieren und zu bestätigen. Bisher unbekannte Proteine ​​können durch ihre Assoziation mit einem oder mehreren bekannten Proteinen entdeckt werden. Die Analyse von Proteininteraktionen kann auch einzigartige, unvorhergesehene funktionelle Rollen für bekannte Proteine ​​aufdecken. Die Entdeckung oder Verifizierung einer Interaktion ist der erste Schritt auf dem Weg zum Verständnis, wo, wie und unter welchen Bedingungen diese Proteine ​​interagieren in vivo und die funktionellen Auswirkungen dieser Interaktionen.

While the various methods and approaches to studying protein–protein interactions are too numerous to describe here, the table below and the remainder of this section focuses on common methods to analyze protein–protein interactions and the types of interactions that can be studies using each method. In summary, stable protein–protein interactions are easiest to isolate by physical methods like co-immunoprecipitation and pull-down assays because the protein complex does not disassemble over time. Weak or transient interactions can be identified using these methods by first covalently crosslinking the proteins to freeze the interaction during the co-IP or pull-down. Alternatively, crosslinking, along with label transfer and far–western blot analysis, can be performed independent of other methods to identify protein–protein interactions.

Common methods to analyze the various types of protein interactions

MethodeProtein–protein interactions
Co-immunoprecipitation (co-IP)Stable or strong
Pull-down assayStable or strong
Crosslinking protein interaction analysisTransient or weak
Label transfer protein interaction analysisTransient or weak
Far–western blot analysisModerately stable

Co-immunoprecipitation (co-IP) is a popular technique for protein interaction discovery. Co-IP is conducted in essentially the same manner as an immunoprecipitation (IP) of a single protein, except that the target protein precipitated by the antibody, also called the "bait", is used to co-precipitate a binding partner/protein complex, or "prey", from a lysate. Essentially, the interacting protein is bound to the target antigen, which is bound by the antibody that is immobilized to the support. Immunoprecipitated proteins and their binding partners are commonly detected by sodium dodecyl sulfate–polyacrylamide gel electrophoresis (SDS-PAGE) and western blot analysis. The assumption that is usually made when associated proteins are co-precipitated is that these proteins are related to the function of the target antigen at the cellular level. This is only an assumption, however, that is subject to further verification.

Co-immunoprecipitation of cyclin B and Cdk1. The Thermo Scientific Pierce Protein A/G Magnetic Beads bind to Cdk1 antibody complexed with Cdk1. Cyclin B is bound to the Cdk1, and is captured along with its binding partner.


AlphaFold is born from deep-learning chess, Go and poker games

The success of DeepMind’s protein-folding prediction program, called AlphaFold, is not unexpected. Other deep-learning programs written by DeepMind have demolished the world’s best chess, Go and poker players.

In 2016 Stockfish-8, an open-source chess engine, was the world’s computer chess champion. It evaluated 70 million chess positions per second and had centuries of accumulated human chess strategies and decades of computer experience to draw upon. It played efficiently and brutally, mercilessly beating all its human challengers without an ounce of finesse. Enter deep learning.

On Dec. 7, 2017, Google’s deep-learning chess program AlphaZero thrashed Stockfish-8. The chess engines played 100 games, with AlphaZero winning 28 and tying 72. It didn’t lose a single game. AlphaZero did only 80,000 calculations per second, as opposed to Stockfish-8’s 70 million calculations, and it took just four hours to learn chess from scratch by playing against itself a few million times and optimizing its neural networks as it learned from its experience.

AlphaZero didn’t learn anything from humans or chess games played by humans. It taught itself and, in the process, derived strategies never seen before. In a commentary in Science magazine, former world chess champion Garry Kasparov wrote that by learning from playing itself, AlphaZero developed strategies that “reflect the truth” of chess rather than reflecting “the priorities and prejudices” of the programmers. “It’s the embodiment of the cliché ‘work smarter, not harder.’”


Proteinfaltung

The sequence of the amino acids – which is encoded in DNA – defines the protein’s 3D shape. The shape determines its function. If the structure of the protein changes, it is unable to perform its function. Correctly predicting protein folds based on the amino acid sequence could revolutionize drug design, and explain the causes of new and old diseases.

All proteins with the same sequence of amino acid building blocks fold into the same three-dimensional form, which optimizes the interactions between the amino acids. They do this within milliseconds, although they have an astronomical number of possible configurations available to them – about 10 to the power of 300. This massive number is what makes it hard to predict how a protein folds even when scientists know the full sequence of amino acids that go into making it. Previously predicting the structure of protein from the amino acid sequence was impossible. Protein structures were experimentally determined, a time-consuming and expensive endeavor.

Once researchers can better predict how proteins fold, they’ll be able to better understand how cells function and how misfolded proteins cause disease. Better protein prediction tools will also help us design drugs that can target a particular topological region of a protein where chemical reactions take place.


Cell Biology 04: The Secretory Pathway

The secretory pathway refers to the endoplasmic reticulum, Golgi apparatus and the vesicles that travel in between them as well as the cell membrane and lysosomes. It’s named ‘secretory’ for being the pathway by which the cell secretes proteins into the extracellular environment. But as usual, etymology only tells a fraction of the story. This pathway also processes proteins that will be membrane-bound (whether in the cellular membrane or in the ER or Golgi membranes themselves), as well as lysosomal enzymes, and also any proteins that will live their lives in the secretory pathway itself. It also does some things other than process proteins.

The cytosol and the ‘lumen’ (the liquid that fills the secretory pathway) are different chemical environments, and they normally never mix. The cytosol is reductive (when you’re in the cytosol, you keep meeting molecules that want to offer you electrons), and the ER, Golgi and extracellular environment are oxidative (molecules keep coming up to you asking for electrons). See redox if still confused. This makes for different protein-folding conditions: for instance, disulfide bonds usually only form in oxidative conditions. Moreover, different proteins may live only in the secretory pathway or only in the cytosol. The secretory pathway provides a route for the cell to handle things that might not be good to have in the cytoplasm, and/or are most useful when kept concentrated in a specialized compartment with their desired interacting partners. Hepatocytes (in the liver) sequester drugs and toxins in the smooth ER and break them down for excretion from the body there. The secretory pathway is not contiguous, but every movement between its components is in little bubbled-off microcosms of its own chemical world, called vesicles.

Many proteins that go through the secretory pathway never touch the cytosol – except the parts of membrane proteins that stick out on the cytosolic side. Many of them need chaperones to help with folding, and/or a whole series of post-translational modifications in order to be ready for their native function, and the secretory pathway specializes in providing them all of that.

Today’s lecture will focus on how proteins get translated into the ER and how they travel (in vesicles) between the ER, Golgi and other destinations. This is beautifully depicted in the Life of the Cell video:

Die endoplasmic reticulum is the first step in the secretory pathway. Its membrane is continuous with the outer nuclear membrane, though it’s not clear why that matters, since it’s not like proteins begin their life in the nucleus. Rather, mRNAs drift around in the cytoplasm until they get picked up by a ribosome interested in translating them. In ‘posttranslational translocation’ the new protein is moved into the ER after it’s translated. In the more interesting phenomenon called ‘cotranslational translocation’ the ribosome starts translation just like any other protein, but somewhere in the first 16 to 30 amino acids it hits a signal peptide (aka signal sequence). That signal’s motif is often 1 positively charged amino acid followed by 6-12 hydrophobic amino acids. This motif gets recognized by signal recognition particle (SRP, a ‘ribonucleoprotein’ or hybrid RNA/protein molecule) which binds to it and prevents the ribosome from continuing translation. Translation is stopped until the ribosome/SRP complex encounters an SRP receptor on the ER membrane. When they meet, SRP and its receptor each bind one GTP molecule in the ER membrane, which apparently strengthens their interaction. Fortuitously, this all happens adjacent to a Sec61 translocon – a protein complex that forms a channel crossing the ER membrane. The translocon is actually a complex of three different proteins (genes: SEC61A1 or SEC61A2, SEC61B, SEC61G), of which the Sec61a subunit has 10 membrane-spanning a-helices which form the channel. Once the ribosome is docked at the membrane it continues translation, pushing the signal peptide and eventually the whole protein through the channel into the ER lumen. When translation stops, SRP and SRP receptor both hydrolzye their GTP to release each other and the ribosome cargo (this has to require the energy of GTP, since the original binding was downhill), a signal peptidase cleaves the signal peptide off of the nascent protein, and the protein is free to start folding in the ER.

A couple of other players are involved for some ER proteins. Oligosaccharide transferase, which adds glycosyl groups to asparagines in the nascent protein, is part of the translocon complex and it actually performs glycosylation während the new protein is still being translated. So although we call glycosylation a ‘post-translational modification’ it is actually made during translation in this case. Also, to achieve their proper structure, some proteins need to be fully translated before they are allowed to start folding – if the N-terminal portion was allowed to start folding as soon as it entered the lumen, it would end up with the wrong overall structure. To prevent this, sometimes BiP the chaperone binds the protein to keep it unfolded for a while. Imagine BiP as another Pac-Man that bites down on the protein to keep it linear, like Hsc70 in the mitochondrial targeting process (see last week).

The first couple of minutes show the basic scenario described above. Then it moves on to a more complex scenario I’ll introduce in a minute. FYI, the video depicts two ‘controversial’ things not included in the above description: (1) the signal peptide being degraded in the membrane, and (2) a ‘plug protein’ that stops up the channel before/after translation. Not all scientists agree on these two things yet.

All of the proteins that we know go through the secretory pathway were pinpointed there by people doing localization experiments to see where in the cell a protein lies. A weird fact about the ER is that you can put the cell in a blender and afterwards the ER will just start reconnecting to itself, forming little ‘microsomes’ that are not attached to the nucleus but form contiguous bubbles of ER. You can then start to play games with proteases – which break down proteins – and detergents – which solubilize the ER membrane. Assuming your protein of interest is translated, you can check if it (1) survives protease treatment but (2) nicht survive protease + detergent treatment, then it’s a secretory pathway protein. The logic is that in case (1) it was protected inside the ER, but in case (2) you dissolved the ER, so it got eaten by the protease. All this assumes you have an antibody or some other way of detecting whether the protein of interest is there after these treatments.

People also used such techniques to figure out that only 70 amino acids of a new protein can be translated before it becomes too late for that protein to end up in the ER. Remember, the signal peptide is in the first 16-30 amino acids, and translocation to the ER depends on SRP being present. Ribosomes translate at a predictable rate, so people got ribosomes started on translating some mRNA and then waited set amounts of time before adding SRP, to see how much translation could occur before SRP could no longer do its job.

The SRP receptor and the Sec61 proteins are ER membrane proteins – and there many other ER membrane, Golgi membrane and lysosome membrane proteins as well. In fact, even the membrane proteins (see class 02) of the cell membrane get processed in the secretory pathway. Many of these have several or tens of transmembrane domains (20-25 hydrophobic amino acids each) that have to be inserted in the correct order and orientation (for example, you really want your ion channels and transporters pointed in the right direction, into vs. out of the cell). Accordingly there are a bunch of fancy biological mechanisms for getting these proteins inserted into the membrane correctly. This is what the latter half of the above video depicts.

So here’s a tautology: some proteins have a topogenic sequence which determines their orientation in the membrane. This sequence is made of two types of signal sequences:

  • ein stop-transfer sequence (abbreviated STA for some reason) is a 22-25 hydrophobic amino acid sequence somewhere in the middle of the protein that forms an alpha helix. When encountered it gets shoved into the membrane, and then translation of the rest of the protein continues in the cytosol. So this kind of ‘undoes’ the translocation to the ER that was started by the signal peptide at the beginning (N terminus) of the protein.
  • ein signal anchor sequence (abbreviated SA) is also a 22-25aa hydrophobic alpha helix, but with a series of

With those two signals as building blocks, you can imagine a protein with a series of stop transfer and signal anchor sequences to create a whole series of back and forth transmembrane domains stitched into the membrane as if by a sewing machine. People have classified the membrane proteins into five categories:

  1. Type I has just a signal peptide and then one stop transfer in the middle. Therefore it ends up with its (hydrophilic) N terminus in the lumen, its (hydrophobic) middle in the membrane and its (hydrophilic) C terminus in the cytosol.
  2. Type II does not start with a signal peptide. It starts out like any other protein, but in the middle it has a signal anchor sequence with the +++ amino acids coming first and the hydrophobic series after. This makes the protein get translocated midway through translation, with the already-translated N-terminal part sticking out into the cytosol (since the +++ have to stay cytosolic) and the now-beginning-to-be-translated C-terminal part getting translated directly into the ER. So it ends up transmembrane with its C terminus in the ER and N terminus in the cytosol – opposite of Type I.
  3. Type III is like Type II – no signal peptide, just a signal anchor in the middle, but in this case the +++ come after the hydrophobic sequence, which reverses the orientation. So this ends up with its N terminus in the ER and its C terminus in the cytosol. Opposite of Type II and, in the end, the same as Type I, though it got there in a different way – it does not have a signal peptide that gets cleaved off in the ER.
  4. Type IV or ’multipass’ proteins have an alternating series of signal sequences and stop transfer sequences. These are clearly more than one ‘type’, yet are not nearly as diverse as your combinatoric imagination might allow. The orientation of the first signal sequence determines whether the N terminus will end up in the cytosol or ER, and total number of stop transfer + signal anchor sequences determines where the C terminus will end up: an even number = same side as N terminus, odd number = opposite side as N terminus. The STA and SA sequences have to strictly alternate, with the exception that you can start with two signal anchor sequences if the first one is oriented with the N terminus into the cytosol. Just to make a mockery of this categorization scheme, people have defined some incompletely-defined subtypes of Type IV, where Type IVa is N-terminal in cytosol (thus it starts like a Type II protein) and Type IVb is N-terminal in the lumen (it starts like a Type III protein but then has another SA sequence that puts it back into the ER). GLUT1 from Class 02 is a Type IVa. -anchored proteins, which are the fifth type but aren’t called Type V, start with a signal peptide and end with a hydrophobic C-terminus which stays embedded in the membrane. That hydrophobic end gets cleaved off and replaced with GPI, which also stays embedded in the membrane. PrP is one of these – more on that later.

By now we’ve discussed how proteins can end up in the ER lumen or spanning the ER membrane. Most proteins leave the ER within minutes, transported in vesicles bound for the Golgi and then later for excretion, lysosomes or the cell membrane. That forward direction of travel is called anterograde going backwards from Golgi to ER is retrograde transport.

Both types of transport take place in membrane-bound vesicles. These bud off of the membrane of wherever they’re coming from, and later fuse to the membrane of wherever they’re headed – beautifully depicted at

2:25 in the Life of the Cell video above. The body from which the vesicles form is the ‘donor compartment’, and the destination they later fuse to is the ‘acceptor compartment’.

The budding process requires that G proteins in the membrane recruit Coat proteins. Specifically, for anterograde transport, G protein Sar1 (gene: SAR1A) recruits COPII (‘cop two’) for retrograde transport, an ARF G protein recruits COPI (pronounced ‘cop one’). These G proteins are activated to do this job when GEF loads them with GTP, swapping out GDP.

So the steps in anterograde transport, for example, are as follows:

  1. Sec12-GEF (Sec stands for secretory) loads Sar1 with GTP. When bound to GDP, Sar1 just floats around the donor compartment, but when bound to GTP, it undergoes conformational change that causes its otherwise-buried N-terminal hydrophobic tail to protrude, making it stick into the membrane, where COPII proteins then start to accumulate because they really like that tail.
  2. The COPIIs start to polymerize and, due to its conformation, have an intrinsic preference for curvature, so their accumulation starts to make budding happen. At the same time, membrane bound proteins that need to be transported – identified by a DXE (i.e. aspartate-anything-glutamate) amino acid sequence that forms a binding site in their cytosolic part – get recruited to the newly forming vesicle. Membrane-bound proteins act as receptors, recruiting lumenal proteins that are bound for the Golgi to hang out in the concave space where they’ll end up in the vesicle once it forms.
  3. Once enough COPII have arrived, the vesicle buds off, at which point Sar1 hydrolyzes its GTP, providing the energy for it to suck its hydrophobic tail back into itself, cutting the COPIIs loose. The vesicle is now disconnected from the donor compartment.
  4. Now, for poorly explained (or poorly understood?) reasons, the coat of COPIIs just disassembles, exposing receptors under the coat which direct the targeting of the vesicle. Once the vesicle arrives at its destination, Rab-GTP embedded in the vesicle membrane interacts with a Rab effector embedded in the acceptor compartment membrane. A sideways glance is exchanged, interest is kindled. Soon the vesicle will fuse to the membrane. proteins present on both the v esicle and t arget membrane (V-SNARE and T-SNARE respectively) interact to bring the membranes even closer. In this example we’ll consider VAMP (the VAMP_ genes) as the V-SNARE and Syntaxin (the STX__ genes) and SNAP25 (SNAP25 gene) as the T-SNAREs. Syntaxin and SNAP25 are both membrane proteins Syntaxin has 1 alpha helix and SNAP25 has 2, all on the cytosolic side. The alpha helices drive the interaction with VAMP. The opposing sides’ alpha helices have extremely strong affinity for one another, bringing the membranes close enough to fuse. Once this has happened, prying the V-SNAREs and T-SNAREs apart again requires two proteins: NSF (gene: NSF stands for NEM sensitive factor) and alpha-SNAP (gene: NAPA), a soluble NSF attachment protein. NSF is an ATPase, and burns ATP to drive the energetically uphill disassembly of the complex.

Now for retrograde transport. Why is there retrograde transport at all? Here is a non-exhaustive list of some reasons:

  • Some membrane proteins start their life in the ER, need to get modified in the Golgi, but then need to get back to the ER. They do this with a KKXX amino acid sequence.
  • There’s also a KDEL amino acid sequence at the C terminus of some lumenal proteins which is suppsoed to keep them in the ER, but it’s not perfect – sometimes they end up in the Golgi, in which case they’re targeted back to the ER via retrograde transport dependent on that KDEL sequence for recognition. The mechanism is kind of neat – the proteins that recognize and bind to KDEL do so only at low pH, and the pH of the Golgi is lower than the ER, so they bind KDEL in the Golgi, then release it when they’re back in the more neutral pH of the ER.
  • Also, think about it, all the proteins that participate in anterograde transport – the V-SNARES, Rab, etc. – have to get back to the ER so they can do it all over again, like how the bus has to get back to the bus depot at the end of the day.
  • As we’ll see shortly, the Golgi come in multiple stages which depend on the addition of enzymes from further downstream.

The process of retrograde transport is not so different from anterograde. It uses ARF instead of Sar1, COPI instead of COPII, but it works the same: ARF loaded with GTP lets its hydrophobic tail stick into the membrane, attracting the attention of COPIs. COPI has two components, COPIalpha and COPIbeta, both of which interact with that KKXXX sequence to recruit membrane-bound proteins destined for retrograde transport. Some proteins also have an RR sequence (anywhere in the protein) which can flag them for retrograde transport.

The Golgi apparatus is not contiguous. It is a stacked set of separate subcompartments called sacs or cisternae. Different compartments have different properties and proteins visit them in a particular order. In order from ER to cell membrane, the Golgi compartments are called cis, medial, trans and trans-Golgi network. Each compartment has different enzymes that modify proteins, and the modifications have to happen in a certain order, hence the need for a stacked set of compartments.

But as proteins mature in the Golgi, it’s not as though they bud off in vesicles from one compartment and move to the next. Rather, the compartment they are already in moves outward and ‘matures’ as new enzymes are added to it (from further down the Golgi chain) via retrograde transport. Verrückt oder? It’s kind of like if instead of moving from an elementary school to a middle school to a high school you just stayed in one school building for your whole childhood and adolescence, and they just brought in new textbooks and teachers every year to keep it appropriate to the grade that you and your classmates had now reached. Here’s what the Golgi look like as they move and evolve:

So there’s (little or) no anterograde transport within the Golgi, but plenty of retrograde transport to bring each new round of enzymes in. When proteins have finally completed the full K-12 curriculum of the Golgi network, they do undergo transport to move on to their final destinaton. They bud off in a vesicle which will go one of three places:

    – fusion with the cell membrane. Thus the lumenal proteins will be secreted extracellularly, and the membrane proteins will become cell membrane proteins. – these just stick around as vesicles in the cell until needed – where ‘needed’ means they do eventually undergo exocytosis. In neurons, this is where neurotransmitters are stored until an action potential demands their secretion into the synapse. In the stomach, the cells that produce gastric enzymes keep those enzymes in secretory vesicles until food intake triggers their release into the stomach. - where misfolded proteins go to get degraded.

The transport from the trans-Golgi network on to these destinations is different from the other transport discussed above and often involves clathrin (CLT__ genes). Vesicles budding off have a two-layer coat, with a dapter p rotein (AP) complexes as the inner layer and clathrin as the outer layer. The adapter proteins have a target signal with a YXXh motif (h = Φ = any hydrophobic amino acid). Clathrin forms the so-called ‘clathrin-triskelion’ formation shown here:


(Image thanks to Wikimedia Commons user Phoebus87)

Clathrin is also responsible for endocytosis – budding off of vesicles of extracellular stuff (and cell membrane proteins) to come into die Zelle. This is called clathrin-mediated endocytosis. Receptors in the cell membrane get endocytosed very frequently: the whole population of hormone receptors turns over about every hour, especially when hormones are being received. Taking up the receptor into a vesicle is one way for the cell to cut off the incoming signal until it can be processed.
The plasma membrane notes discuss cystic fibrosis briefly: CFTR is an ABC transporter responsible for pumping Cl - out of the cell (it also lets Na + in). Loss-of-function mutants don’t pump Cl - , which removes the driving force for osmosis, thickening the mucus and causing breathing problems. There are at least 127 different loss-of-function CFTR mutants (at least, that’s how many Natera tests for) that (if both alleles are disabled) cause cystic fibrosis. The most common mutation is ΔF508, which is

3% of all European CFTR alleles and about 70% of mutant ones. The loss of that one phenylalanine changes CFTR’s conformation so that the di-acidic exit code (amino acids D565 and D567) that targets CFTR for exocytotic vesicles is no longer correctly exposed and the protein never makes it to the cell membrane [Wang 2004].

discussion section

In section we read Hu 2009, who showed that atlastin proteins are involved in creating the tubular ER network. The evidence came almost entirely from protein-protein interactions. I was surprised this paper was a big deal, because there have been a million papers showing protein-protein interactions for huntingtin, and no one really believes all of them and it hasn’t necessarily gotten us any closer to knowing what huntingtin does or what goes wrong in Huntington’s Disease. But apparently Hu was able to make a pretty clean case for the atlastins’ interactions with reticulons as implying a role in ER formation. It helps that Hu was able to show a ‘genetic interaction’ in addition to a physical (binding) interaction. A ‘genetic interaction’ (I had to look it up) means when “Sometimes mutations in two genes produce a phenotype that is surprising in light of each mutation’s individual effects. This phenomenon, which defines genetic interaction, can reveal functional relationships between genes and pathways.” [Mani 2007].

This is a decade old, so some stuff may be outdated, but I found Harris 2003 (ft)’s review of PrP cell biology extremely clear and helpful. Kim & Hegde 2002 was also helpful. PrP is a secretory pathway protein. Its first 22 amino acids (MANLGCWMLVLFVATWSDLGLC) are a signal peptide that causes cotranslational translocation to the ER. Normally, PrP just gets GPI-linked at its C terminus and is anchored to the exoplasmic side of the membrane. But amino acids 111-134 (HMAGAAAAGAVVGGLGGYMLGSAM) are a sort of weak signal anchor sequence (Type II, with the +++ amino acids coming before the signal anchor) that sometimes but not always becomes a transmembrane domain, inverting the C terminus into the lumen. Even more confusingly, that sequence can sometimes just end up as a transmembrane domain ohne the inversion, so that the N terminus is in the lumen. So there are three membrane topologies of PrP: regular old GPI-anchored, and two transmembrane orientations, as depicted in Harris 2003 Fig 3:

Note how weird Ctm PrP is. It’s transmembrane yet also GPI-anchored, and the N-terminal signal peptide is never cleaved off. Normally, the transmembrane forms are < 10% of total PrP. In some laboratory conditions the percentage is higher, and two of the GSS-causing mutations (A117V and P105L) also increase the fraction of Ctm PrP to 20-30% of all PrP. Of these three forms, there is a good amount of evidence that Ctm PrP is toxic, and that it might play a role in prion formation, though most genetic prion disease mutations (including FFI D178N) do not appear to affect the membrane topology of PrP or the fraction of Ctm PrP.

After PrP goes through the Golgi, it is targeted for the cell membrane. But according to Harris, it doesn’t just sit there – it frequently through clathrin-mediated endocytosis and cycles through the cell every

60 minutes, with some molecules being cleaved on each cycle. Copper stimulates this endocytosis of PrP. Most genetic prion disease mutations change the localization of PrP – usually when a mutation is present, less PrP is found on the cell surface, with more accumulating in the ER.

About Eric Vallabh Minikel

Eric Vallabh Minikel is on a lifelong quest to prevent prion disease. He is a scientist based at the Broad Institute of MIT and Harvard.


Schau das Video: Proteiner - Biokemi 7 - Kemi B (November 2021).