Makromolekylær docking

Makromolekylær docking  er en metode til molekylær modellering af den kvaternære struktur af komplekser dannet af to eller flere interagerende biologiske makromolekyler . Oftest studeres protein-proteinkomplekser , sjældnere - protein - nukleinkomplekser .

Det ultimative mål med docking er at forudsige den tredimensionelle struktur af det undersøgte makromolekylære kompleks i det naturlige miljø. Resultatet af docking er et sæt modeller af komplekset (strukturer). De kan rangeres ved forskellige metoder, såsom en evalueringsfunktion (score, scoring, score) for at vælge den mest plausible (mere tilbøjelig til at forekomme i kroppen).

Udtrykket "docking" eller "docking" dukkede op i slutningen af ​​1970'erne i betydningen modellering af docking af to molekyler, hvor orienteringen af ​​sidstnævnte ikke ændrede sig (kun positionen ændrede sig). Med stigningen i computerkraft blev det muligt at tillade en ændring i partnernes orientering, denne docking-mulighed kaldes "rigid docking" eller rigid body docking ("rigid body"). Næste skridt var overgangen til "fleksibel docking", hvor partnernes indre geometri (konformation) ændres.

Introduktion

De biologiske roller for de fleste proteiner, beskrevet af hvilke molekyler de kan interagere med, er i bedste fald kendt, i det mindste ufuldstændigt. Selv proteiner involveret i velundersøgte biologiske processer (f.eks. TCA ) kan have uventede interaktanter eller nye biologiske funktioner.

I tilfælde af protein-protein-interaktioner opstår der yderligere spørgsmål. Det menes, at genetiske sygdomme (f.eks. cystisk fibrose ) er forårsaget af fejlfoldede ( muterede ) proteiner, og der er et ønske om at forstå, hvilke unormale protein-protein-interaktioner, der kan forårsages af en bestemt mutation . Hvis det i fremtiden bliver muligt at designe proteiner til at udføre biologiske funktioner, vil det være vigtigt at bestemme rækkevidden af ​​deres mulige interaktioner.

For et bestemt sæt proteiner kan følgende række af problemer løses:

Hvis de forbinder

Hvis de ikke forbinder,

Protein-protein docking kan bruges til at løse disse problemer.

Desuden kan docking hjælpe i studiet af proteiner med ukendt funktion (et relativt understuderet område). Hvis der ikke er nogen model for rumlig struktur, kan den modelleres (se forudsigelse af proteinstruktur ).

Protein-nukleinsyre-interaktioner spiller en vigtig rolle i en levende celle. Transkriptionsfaktorer regulerer genekspression , og polymeraser , der udfører replikation , er proteinkomplekser , og det genetiske materiale, de binder sig til, består af nukleinsyrer . Modellering af protein-nukleinsyre-interaktioner har nogle vanskeligheder, som er beskrevet nedenfor.

Historie

I 1970'erne bestod kompleks modellering af manuelt at identificere elementer på overfladen af ​​interaktanter (partnere) og fortolke implikationerne for binding, funktion og aktivitet; alle computerprogrammer blev normalt brugt i slutningen af ​​simuleringsprocessen for at skelne mellem de relativt få konfigurationer, der var tilbage, efter at alle de heuristiske begrænsninger var blevet anvendt. For første gang blev computere brugt til at studere interaktionen mellem hæmoglobin i seglcellefibre. [1] Så, i 1978, dukkede arbejdet op med trypsin - Aprotinin -komplekset . [2] Computere er blevet brugt til at skelne mellem "dårlige" og "gode" modeller gennem en scoringsfunktion. Et stort grænsefladeområde (bindingsflade) blev "belønnet", og der blev pålagt sanktioner for overlappende områder. Computeren brugte en forenklet repræsentation af interagerende proteiner: hver rest blev repræsenteret som et enkelt bindingssted. Elektrostatiske interaktioner såsom hydrogenbindinger er blevet analyseret i hånden.

I begyndelsen af ​​1990'erne var mere komplekse strukturer blevet defineret, mens den tilgængelige computerkraft var steget betydeligt. Med fremkomsten af ​​bioinformatik har fokus været på at udvikle metoder anvendelige til vilkårlige interaktanter til rimelige beregningsomkostninger og i fravær af yderligere fylogenetiske eller eksperimentelle data.

I 1992 blev en metode [3] offentliggjort , der brugte den hurtige Fourier-transformation. I denne metode var der en "grov" repræsentation af dockingpartnerne: i form af tredimensionelle matricer, hvor tallene svarede til atomernes positioner. Hurtig Fourier-transformation hjalp med at finde placeringen af ​​disse matricer svarende til kontakten mellem partnere meget hurtigere end andre dockingmetoder. I 1997 begyndte denne metode at tage højde for elektrostatiske interaktioner.

I 1996 blev resultaterne af det første studie [4] offentliggjort , hvor seks forskergrupper forsøgte at forudsige strukturen af ​​TEM-1-beta-lactamase-komplekset med beta-lactamase-hæmmerprotein (BLIP). Undersøgelsen bemærkede behovet for at tage højde for konformationelle ændringer og vanskeligheden ved at skelne konformere.

Metoder

Den grundlæggende mekanisme ved docking ligner molekylær docking . Metoder af Monte Carlo-typen anvendes også , hvor den indledende konfiguration forfines under iterative ændringer i sættet af parametre. Ved hvert trin accepteres eller afvises konfigurationen baseret på værdien af ​​evalueringsfunktionen.

Går til gensidigt rum

Hvert af proteinerne kan repræsenteres som et simpelt kubisk gitter. For komplekse modeller, der oversættes til hinanden ved at ændre proteinets position, kan en bestemt evalueringsfunktion næsten øjeblikkeligt beregnes ved hjælp af foldningssætningen . Det er muligt at konstruere meningsfulde, omend tilnærmede, "foldede" scoringsfunktioner, der tager højde for både stereokemiske og elektrostatiske interaktioner.

Gensidige rummetoder er blevet brugt i vid udstrækning på grund af deres evne til at evaluere et stort antal strukturer. De mister deres hastighedsfordel, hvis torsionsændringer finder sted. En anden ulempe er, at det er umuligt effektivt at bruge den akkumulerede viden. Spørgsmålet er også, om denne metode ikke er nøjagtig nok til pålideligt at afsløre strukturen af ​​det bedste kompleks.

Evalueringsfunktioner (scoringsfunktioner)

For at søge efter en score (en eller anden indikator), der gør det muligt at skelne mellem de bedste modeller, blev der udviklet en speciel testprøve (benchmark, se nedenfor) af protein-proteinstrukturer. Scoringer rangeres efter den rangering, de giver til den bedste struktur (ideelt set bør rangering efter score bringe den "eksperimentelle" bedste struktur til toppen) og efter deres dækning (andelen af ​​kontroltilfælde, hvor de opnår et acceptabelt resultat). Resultaterne er opdelt i flere kategorier, herunder:

Typisk skabes hybridscores (selve scorefunktionerne) ved at kombinere en eller flere af ovenstående kategorier (i det følgende benævnt "vilkårene" for scorefunktionen) til en vægtet sum, hvis vægte er optimeret ved hjælp af testprøver ( de såkaldte benchmarks). For at undgå skævheder bør de testmodeller, der bruges til at optimere vægtene, ikke overlappe med de testmodeller, der bruges til den endelige test af hybridscoringen.

I problemet med protein-protein docking er det vigtigt at finde en scorefunktion, der pålideligt afspejler information om partneres affinitet. En sådan funktion ville i høj grad accelerere udviklingen af ​​in silico protein engineering , lægemiddeludvikling og high-throughput annotering af interaktomet (dvs. hvilke proteiner der binder, og hvilke der ikke binder). Mange scoringsfunktioner er blevet foreslået for at evaluere bindingsaffinitet/fri energi. [5] [6] [7] [8] [9] Korrelationen mellem den eksperimentelt bestemte bindingsaffinitet og forudsigelserne af ni populære scorefunktioner viste sig dog at være næsten ortogonal (R 2 ~ 0). [10] [11] Det er også blevet observeret, at nogle udtryk korrelerer bedre med de eksperimentelle bindingsenergier end det fulde estimat, hvilket tyder på, at det er muligt at finde og forbedre scorefunktionen ved at gense vægten af ​​dens komponenter (termer). Blandt de eksperimentelle metoder til bestemmelse af bindingsaffinitet er overfladeplasmonresonans (SPR), Förster resonansenergioverførsel , metoder, der anvender radioligander, isotermisk titreringskalorimetri (ITC), mikroskopisk termoforese (MST) eller spektroskopiske målinger og andre fluorescensmetoder. Information fra videnskabelige artikler kan også være en god kilde til at forbedre scoringen. [12]

Testvalg (benchmarks)

For at teste dockingmetoder blev en testprøve (benchmark) lavet af 84 strukturer af protein-proteinkomplekser. [13] Strukturerne i testprøven er specielt udvalgt til at dække en bred vifte af interaktionstyper og er så heterogene som muligt (indeholder så få gentagne funktioner som muligt, såsom profiler af partnerfamilier i SCOP-databasen ) . Testelementer er opdelt i tre kompleksitetsniveauer (det sværeste indeholder den største ændring i strukturen af ​​rygraden). Eksempler på testmodeller for protein-protein docking er enzym-inhibitor strukturer, antigen-antistof strukturer og homomultimere komplekser.

Den seneste version af benchmark for protein-protein docking består af 230 komplekser, [14] og 47 til DNA -protein docking [15] Det seneste testsæt for RNA-protein docking omfatter 126 elementer. [16] Der er poolede testprøver med 209 komplekser. [17]

Affinitetstestsættet var baseret på protein - protein docking-testsættet. [10] Det omfattede 81 protein-proteinkomplekser med eksperimentelt målte affiniteter. Disse komplekser spænder over 11 størrelsesordener i affinitet.

Denne prøve blev yderligere underkastet peer review og udvidet betydeligt. [18] Det nye testsæt indeholder proteiner med forskellige biologiske funktioner. Det består af G-proteiner og ekstracellulære domæner af receptorer, samt antigen/antistof, enzym/hæmmer og enzym/substratkomplekser. Det er også forskelligt med hensyn til partneraffinitet for hinanden, med K d spænder fra 10 −5 til 10 −14 M. De ni elementer er tæt beslægtede komplekser, der har en lignende struktur, men meget forskellige affiniteter. Da strukturerne af komponenterne i komplekset er kendt separat, er det muligt at evaluere ændringer i partnernes konformation under dets dannelse. I de fleste komplekser er de meget betydningsfulde. Dette testsæt kan også bruges til biofysiske modeller, der har til formål at etablere forholdet mellem affinitet og struktur i protein-protein-interaktioner, under hensyntagen til data om reagenserne og deres konformationelle ændringer og ikke kun på produktet (komplekset). [atten]

CAPRI

CAPRI (Critical Assessment of PRediction of Interactions) [19]  er en regelmæssig begivenhed, hvor forskere over hele verden inviteres til at opnå strukturen af ​​et protein-proteinkompleks, hvis kun strukturerne af reagenser gives ved docking. Arrangementer (runder) finder sted cirka hver 6. måned. Under hver runde får deltageren udleveret strukturerne af kompleksets reagenser, hvis struktur for nylig blev bestemt eksperimentelt. Koordinaterne for komplekset holdes hemmelige. CAPRI-evalueringen er dobbeltblind , da deltagerne ikke kender kompleksets struktur, og arrangørerne ikke ved, hvem af deltagerne, der foreslog en bestemt model af komplekset.

I øjeblikket vinder CAPRI popularitet (37 grupper deltog på verdensplan i den syvende runde). Selvom resultaterne af CAPRI er af ringe statistisk signifikans på grund af det lille antal mål i hver runde, er CAPRI's rolle ret signifikant. CASP - scoren er en lignende øvelse i forudsigelse af proteinstruktur.

Se også

Noter

  1. C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hæmoglobininteraktion i seglcellefibre. I: Teoretiske tilgange til de molekylære kontakter.  (engelsk)  // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 1975-04-01. — Bd. 72 , udg. 4 . - S. 1330-1334 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.72.4.1330 .
  2. Shoshana J. Wodak, Joel Janin. Computeranalyse af protein-protein interaktion  // Journal of Molecular Biology. - 1978-09. - T. 124 , no. 2 . - S. 323-342 . — ISSN 0022-2836 . - doi : 10.1016/0022-2836(78)90302-9 .
  3. E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A.A. Friesem, C. Aflalo. Molekylær overfladegenkendelse: bestemmelse af geometrisk pasform mellem proteiner og deres ligander ved hjælp af korrelationsteknikker.  (engelsk)  // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 1992-03-15. — Bd. 89 , iss. 6 . - S. 2195-2199 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.89.6.2195 .
  4. NCJ Strynadka, M. Eisenstein, E. Katchalski-Katzir, BK Shoichet, ID Kuntz. Molekylær docking-programmer forudsiger med succes bindingen af ​​et β-lactamase-hæmmende protein til TEM-1 β-lactamase  // Nature Structural Biology. — 1996-03. - T. 3 , nej. 3 . - S. 233-239 . — ISSN 1072-8368 . doi : 10.1038 / nsb0396-233 .
  5. Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Protein-protein docking med samtidig optimering af stiv kropsforskydning og sidekædekonformationer". J. Mol. biol . 331 (1): 281-299. DOI : 10.1016/S0022-2836(03)00670-3 . PMID  12875852 .
  6. Camacho CJ, Vajda S. Proteindocking langs glatte associationsveje  // Proceedings of the National Academy of Sciences of the United States of America  : journal  . - 2008. - Bd. 98 , nr. 19 . - P. 10636-10641 . - doi : 10.1073/pnas.181147798 . — PMID 11517309 .
  7. Camacho CJ, Vajda S. In silico-screening af mutationseffekter på enzym-proteinhæmmer-affinitet: en docking-baseret tilgang  //  BMC Structural Biology : journal. - 2007. - Bd. 7 . — S. 37 . - doi : 10.1186/1472-6807-7-37 . — PMID 17559675 .
  8. Zhang C., Liu S., Zhu Q., Zhou Y. En vidensbaseret energifunktion for protein-ligand-, protein-protein- og protein-DNA-komplekser  (engelsk)  // Journal of Medicinal Chemistry : journal. - 2005. - Bd. 48 , nr. 7 . - S. 2325-2335 . - doi : 10.1021/jm049314d . — PMID 15801826 .
  9. Esmaielbeiki R., Nebel JC Scoring af dockingkonformationer ved hjælp af forudsagte proteingrænseflader  //  BMC Bioinformatics : journal. - 2014. - Bd. 15 . — S. 171 . - doi : 10.1186/1471-2105-15-171 . — PMID 24906633 .
  10. 1 2 Kastritis PL, Bonvin AM Er scoringsfunktioner i protein-protein docking klar til at forudsige interaktomer? Ledetråde fra et nyt benchmark for bindingsaffinitet  //  J. Proteome Res. : journal. - 2010. - Maj ( bind 9 , nr. 5 ). - P. 2216-2225 . - doi : 10.1021/pr9009854 . — PMID 20329755 .
  11. Rosato A., Fuentes G., Verma C. Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25  //  Faculty of 1000 Biology : journal . - 2010. - Bd. 9 , nr. 5 . - P. 2216-2225 . - doi : 10.1021/pr9009854 . — PMID 20329755 .
  12. Badal, VD, Kundrotas, PJ, Vakser, IA Naturlig sprogbehandling i tekst til strukturel modellering af proteinkomplekser mining   // BMC Bioinformatics : journal. - 2018. - Bd. 19 , nr. 1 . - S. 84 . - doi : 10.1186/s12859-018-2079-4 . — PMID 29506465 .
  13. Mintseris J., Wiehe K., Pierce B., Anderson R., Chen R., Janin J., Weng Z. Protein-Protein Docking Benchmark 2.0: an update  (neopr.)  // Proteins. - 2005. - T. 60 , nr. 2 . - S. 214-216 . - doi : 10.1002/prot.20560 . — PMID 15981264 .
  14. Vreven T., Moal IH, Vangone A., Pierce BG, Kastritis PL, Torchala M., Chaleil R., Jiménez-García B., Bates PA, Fernandez-Recio J., Bonvin AM, Weng Z. Opdateringer til Integreret protein-protein interaktion benchmarks: docking benchmark version 5 og affinity benchmark version 2  //  Journal of Molecular Biology : journal. - 2015. - September ( bind 427 , nr. 19 ). - S. 3031-3041 . - doi : 10.1016/j.jmb.2015.07.016 . — PMID 26231283 .
  15. van Dijk M., Bonvin AM En protein-DNA docking benchmark  //  Nucleic Acids Research : journal. - 2008. - August ( bind 36 , nr. 14 ). — P.e88 . - doi : 10.1093/nar/gkn386 . — PMID 18583363 .
  16. Nithin C., Mukherjee S., Bahadur RP En ikke-redundant protein-RNA docking benchmark version 2.0  //  Proteins : journal. - 2016. - November ( bind 85 , nr. 2 ). - S. 256-267 . - doi : 10.1002/prot.25211 . — PMID 27862282 .
  17. Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. Bioinformatikværktøjer og benchmarks for beregningsdocking og 3D-strukturforudsigelse af RNA-proteinkomplekser  (engelsk)  // Gener : tidsskrift. - 2018. - 25. august ( bd. 9 , nr. 9 ). - S. 432 . - doi : 10.3390/gener9090432 . — PMID 30149645 .
  18. 1 2 Kastritis PL, Moal IH, Hwang H., Weng Z., Bates PA, Bonvin AM, Janin J. Et strukturbaseret benchmark for protein-proteinbindingsaffinitet  //  Protein Science : journal. - 2011. - Marts ( bind 20 , nr. 3 ). - S. 482-491 . - doi : 10.1002/pro.580 . — PMID 21213247 .
  19. Janin J., Henrick K., Moult J., Eyck LT, Sternberg MJ, Vajda S., Vakser I., Wodak SJ CAPRI: a Critical Assessment of Predicted Interactions  //  Proteins : journal. - 2003. - Bd. 52 , nr. 1 . - S. 2-9 . - doi : 10.1002/prot.10381 . — PMID 12784359 .