Forudsigelse af proteinstruktur
Proteinstruktur forudsigelse er en retning af molekylær modellering , forudsigelse af den tredimensionelle proteinstruktur [ 1] ( sekundær , tertiær eller kvaternær ) ved aminosyresekvensen . Denne opgave er et af de vigtigste mål for bioinformatik og teoretisk kemi . Forudsigelsesdata bruges inden for medicin (for eksempel i lægemidler ) og bioteknologi til at skabe nye enzymer .
Introduktion
Enorme mængder proteinsekventeringsdata er blevet tilgængelige som et resultat af nutidens storstilede DNA - sekventeringsbestræbelser , såsom Human Genome Project . På trods af hele samfundets indsats inden for strukturgenomik halter antallet af eksperimentelt bestemte proteinstrukturer - sædvanligvis ved hjælp af arbejdskrævende og relativt dyre røntgenkrystallografi eller NMR-spektroskopi - langt bagud i forhold til antallet af proteinsekvenser , hvilket gør at forudsigelse af protein tertiær struktur ekstremt efterspurgt [2] .
At forudsige strukturen af et protein forbliver et ekstremt vanskeligt og uløst problem. De to hovedproblemer er beregningen af fri energi og at finde det globale minimum af denne energi [3] . En metode til forudsigelse af proteinstruktur skal udforske rummet af alle mulige proteinstrukturer, som er astronomisk stort. Disse problemer kan delvist omgås ved komparativ (homolog) modellering og fold - genkendelsesmetoder , hvor søgerummet reduceres på grund af antagelsen om, at det pågældende protein antager en struktur tæt på den eksperimentelt bestemte struktur af et andet homologt protein. På den anden side bør ab initio proteinstruktur forudsigelsesmetoder eksplicit løse disse problemer uden at stole på indledende antagelser [4] [5] .
I december 2020 annoncerede DeepMind- teamet ( Googles forskningsafdeling ) at de havde løst det grundlæggende videnskabelige problem med forudsigelse af proteinstruktur. Programmet, udviklet af virksomheden og baseret på neurale netværk, var i stand til at forudsige proteinets struktur med høj nøjagtighed. [6]
Proteinstruktur
Sekundær struktur af et protein
Alpha Helix
Alfa-helixen er den mest almindelige type sekundær struktur i proteiner. Alfa-helixen har 3,6 aminosyrer pr. omgang, og der dannes en H-binding mellem hver fjerde rest; den gennemsnitlige længde er 10 aminosyrer (3 omdrejninger) eller 10 Å , men varierer fra 5 til 40 (1,5 til 11 omdrejninger). Justeringen af H-bindingerne skaber et dipolmoment for helixen med en netto positiv partiel ladning ved aminoenden af helixen. Den mest almindelige placering af α-helixer er på overfladen af proteiner, hvor de giver interaktion med det vandige miljø [7] .
Den indvendige side af helixen indeholder normalt hydrofobe aminosyrer og den ydre side hydrofile aminosyrer. Således vil hver tredje af de fire aminosyrer i kæden være hydrofobe, og derfor kan denne aminosyre let påvises. I en leucin lynlås er det gentagne mønster af leucinrester på ydersiderne af to tilstødende helixer stort set vejledende for strukturen. Andre α-helixer, der findes i proteinets hydrofobe kerne eller i proteiners transmembrane domæner , har en højere procentdel af hydrofobe aminosyrer, der er mere jævnt fordelt langs kæden, hvilket også fungerer som en god markør for disse dele af proteiner . Kvalitativt aminosyreindhold kan være en god markør for den α-spiralformede region. Regioner med en høj koncentration af forskellige aminosyrer , såsom alanin (A), glutaminsyre (E), leucin (L) og methionin (M), samt dårligere koncentrationer af prolin (P), glycin (G), tyrosin (Y ) og serin (S) har tendens til at danne en α-helix [8] [9] .
β-liste
β-sheets dannes af H-bindinger mellem i gennemsnit 5-10 på hinanden følgende aminosyrer i en del af kæden og en anden 5-10 længere nede i kæden. Hver kæde kan løbe i samme retning og danne et parallelt ark, hvis kæderne går i forskellige retninger, dannes der et antiparallelt ark. Naturen af H-bindingen er forskellig i den parallelle og anti-parallelle konfiguration. ψ- og φ-vinklerne på aminosyrerne i arkene varierer betydeligt i et område af Ramachandran-kortet . At forudsige placeringen af β-sheets i en proteinstruktur er sværere end at forudsige α-helixer [10] [11] .
Loop
Sløjfer er områder af proteinkæden, der er mellem α-helixer og β-sheets, af forskellig længde og tredimensionelle konfigurationer og kan være placeret både på overfladen af proteinet og tættere på kernen [12] .
Hårnålesløjfer, som repræsenterer en fuldstændig drejning i polypeptidkæden , der forbinder to antiparallelle β-strenge, kan være op til to aminosyrer lange. Sløjferne kan interagere med miljøet (vand og andre opløsningsmidler) og andre proteiner. Da geometrien af aminosyrerne i løkkerne ikke er begrænset i rummet, da aminosyrer i området af kernen, hvor kæden er meget tæt foldet, og ikke påvirker den korrekte foldning af proteinet så meget, så kan der være flere substitutioner, insertioner og deletioner , der ikke vil påvirke proteinets funktioner. . Når sekvenser er alignet, kan tilstedeværelsen af disse mutationer (inserts, deletioner, substitutioner) således indikere en loop. Intronpositioner i genomisk DNA svarer nogle gange til loop-placeringer i det kodede protein, loops har også en tendens til at have ladede og polære aminosyrer og er ofte en komponent af bindingssteder [13] .
Tertiær struktur af et protein
Tertiær struktur - den rumlige struktur (herunder konformation ) af alle elementer i den sekundære struktur, bestående af en enkelt kæde af aminosyrer. Spiralisering af en lineær polypeptidkæde reducerer dens størrelse med ca. 4 gange; og lægning i en tertiær struktur gør den ti gange mere kompakt end den originale kæde [14] .
Da hverken polypeptidkæden eller α-helixer og β-sheets giver en idé om volumen , form af polypeptidkæden, står forskeren altid over for behovet for at bestemme proteinets tredimensionelle eller rumlige konfiguration . [femten]
Kvartær proteinstruktur
Kvartær struktur - en måde at lægge individuelle polypeptidkæder i rummet på, der har den samme (eller forskellige) primære , sekundære eller tertiære struktur, og dannelsen af en enkelt makromolekylær formation i strukturel og funktionel henseende. Specificiteten af den kvaternære struktur af proteiner manifesteres i en vis konformationel autonomi af polypeptidfragmenterne, der udgør proteinmakromolekylet. Bidraget fra hydrofobe interaktioner til stabiliseringen af den tertiære og kvaternære struktur af proteiner er meget signifikant: i tilfælde af den tertiære struktur tegner de sig for mere end halvdelen af den stabiliserende kraft. [16]
Mange proteiner er samlinger af flere polypeptidkæder. Eksempler på proteiner med en kvaternær struktur omfatter hæmoglobin , DNA-polymerase og forskellige ionkanaler [17]
Forudsigelse af proteinstruktur
Algoritmer til forudsigelse af sekundære strukturer
Sekundære strukturforudsigelsesalgoritmer er et sæt metoder til at forudsige den lokale sekundære struktur af proteiner kun baseret på viden om deres aminosyresekvens [18] . For proteiner består forudsigelse i at associere individuelle sektioner af aminosyresekvensen med de mest sandsynlige klasser af sekundære strukturer, såsom α-helixer, β-strenge eller loops [18] . Forudsigelsesnøjagtighed defineres som forholdet mellem antallet af aminosyrer, for hvilke den forudsagte strukturelle klasse matchede strukturklassen bestemt for den pågældende aminosyre af DSSP [en] -algoritmen (eller en lignende algoritme, f.eks. STRIDE-algoritmen ) og det samlede antal aminosyrer i sekvensen. Disse algoritmer markerer aminosyresekvensen af et protein i overensstemmelse med tilhørsforholdet af aminosyrer til en af klasserne af sekundær struktur, som adskiller sig i specifikke mønstre af hydrogenbindinger og sæt af dihedrale vinkler. For DSSP er disse 8 klasser, der kan kombineres i tre grupper: 3 klasser af helixer (α-helix, π-helix og 3 10 -helix), to klasser af β-strukturer (isolerede β-broer og β-sheets) og tre typer sløjfer (vendinger, bøjninger og uklassificerede elementer, der opfylder løkkens karakteristika) [19] . For at vurdere kvaliteten af strukturen anvendes oftest en forenklet klassifikation, hvor klasserne inden for disse tre grupper anses for identiske [2] . Algoritmer til at forudsige den sekundære struktur af et protein kan betinget opdeles i grupper baseret på de principper, der ligger til grund for dem. Disse grupper omfatter statistiske metoder, nærmeste nabo-metoder, metoder, der bruger neurale netværk, understøttende vektormetoder og metoder baseret på skjulte Markov-modeller . [tyve]
Nogle af disse algoritmer diskuteres nedenfor.
Chow-Fasmans statistiske metode er baseret på beregningen af et estimat af sandsynligheden for, at en bestemt aminosyre tilhører en bestemt klasse af sekundær struktur i databaser. Forudsigelsen er lavet med hensyn til tre klasser af sekundære strukturer: sløjfe, β-blad og rotation. Målet med algoritmen er at finde et segment ud fra antallet af konsekutive aminosyrer bestemt for hver sekundær strukturklasse, for hver af hvilke estimatet af sandsynligheden for at tilhøre denne sekundære strukturklasse er større end en given værdi. Ved udgangen producerer sådanne algoritmer segmenter forudsagt på denne måde for hver af de tre hovedklasser af sekundære strukturer, kortlagt på en sekvens. [21]
Det første trin i den nærmeste nabo-metode ( NNSSP-algoritme ) er at finde en homolog sekvens, for hvilken den tredimensionelle struktur er kendt. I betragtning af de lokale strukturelle træk ved en bestemt aminosyrerest i den tredimensionelle struktur af den homologe sekvens, såsom opløsningsmiddeltilgængelighed, polaritet og sekundær struktur, tildeles hver aminosyrerest en "miljøklasse". Vurderingen af sandsynligheden for, at en aminosyre i midten af det undersøgte segment af længden n aminosyrer tilhører en bestemt klasse af sekundær struktur, beregnes som logaritmen af frekvensen af denne aminosyre i miljøet, hvortil de fleste af dets naboer hører hjemme i databaser. [22]
En af algoritmerne, der anvender neurale netværk, PSIPRED , omfatter fire hovedtrin: generering af en positionel vægtmatrix ved hjælp af PSI-BLAST , primær forudsigelse af den sekundære struktur og yderligere filtrering af forudsigelserne. Den anden og tredje fase involverer to neurale netværk. For at bestemme, om en aminosyre tilhører en bestemt klasse af sekundær struktur, tilføres et fragment af en positionel vægtmatrix på 33x21 i størrelse til input fra det første neurale netværk, svarende til et fragment af den oprindelige sekvens på 33 aminosyrer med aminosyren af interesse i midten [23] . Dette netværk har to skjulte lag og tre udgangsnoder svarende til de tre forudsagte sekundære strukturklasser. Det andet neurale netværk bruges til at filtrere forudsigelserne af det første netværk og har også tre udgangsnoder for hver sekundær strukturklasse i den centrale position af vinduet, der undersøges. Ved udgangen producerer algoritmen en markering af aminosyresekvensen af elementerne i den sekundære struktur. [24]
Ud over ovenstående kan klassiske algoritmer, der anvender skjulte Markov-modeller, såsom frem-tilbage- algoritmen , Viterbi-algoritmen og Baum-Welsh-algoritmen , optimeres til at associere en aminosyresekvens med klasser af sekundære strukturer. [25]
De bedste moderne metoder til at bestemme den sekundære struktur af et protein opnår omkring 80% nøjagtighed [26] . Nøjagtigheden af nuværende metoder til at forudsige sekundære strukturer evalueres af ugentligt opdaterede ressourcer såsom LiveBench Archived 12 April 2020 at the Wayback Machine og EVA Archived 24 February 2020 at the Wayback Machine [27] .
Tertiære strukturforudsigelsesalgoritmer
Primær uddannelse
De fleste tertiære strukturmodelleringsmetoder er optimeret til modellering af den tertiære struktur af individuelle proteindomæner. Et trin kaldet domænegrænseanalyse eller domænegrænseforudsigelse udføres normalt først for at adskille proteinet i potentielle strukturelle domæner. Som med resten af de tertiære strukturforudsigelsestrin, kan dette gøres ved sammenligning med kendte strukturer, eller ab initio ved sekvens alene (normalt ved maskinlæring, der involverer kovarians ) [28] [29] . Strukturerne af individuelle domæner kombineres til en endelig tertiær struktur i en proces kaldet domænesamling [30] .
Energibaserede metoder
Ab initio - modelleringsmetoder sigter mod at skabe tredimensionelle proteinmodeller fra bunden, det vil sige, at de er baseret på fysiske principper snarere end direkte på eksperimentelt afledte strukturelle data. Der er mange mulige tilgange, der enten forsøger at efterligne proteinfoldning eller anvende stokastiske metoder til at finde mulige løsninger (dvs. søge efter det globale maksimum af en eller anden energifunktion ) [ 31] . Disse tilgange har en tendens til at være beregningsintensive og kan derfor kun anvendes på bittesmå proteiner. Forudsigelse af proteinstruktur ab initio for større proteiner kræver mere sofistikerede algoritmer og større beregningsressourcer, repræsenteret af enten kraftfulde supercomputere (såsom Blue Gene eller MDGRAPE-3 ) eller distribueret databehandling (såsom Folding@home , Human Proteome Folding Project og Rosetta @Home ) [32] .
Samevolverende sekvenser i 3D-kontaktforudsigelse
Efterhånden som sekventering blev mere almindelig i 1990'erne, brugte flere grupper af forskere proteinsekvensjustering til at forudsige korrelerede mutationer, og man håbede, at disse co - evolverende rester kunne bruges til at forudsige tertiær struktur . Det forudses, at når en mutation af en aminosyrerest ikke er dødelig, kan en kompensatorisk mutation forekomme for at stabilisere interaktioner mellem resterne. I det tidlige arbejde blev såkaldte lokale metoder brugt til at beregne korrelerede mutationer i proteinsekvenser, mens der på grund af den uafhængige overvejelse af hvert par af rester opstod falske korrelationer [33] [34] .
I 2011 viste en anden statistisk tilgang, at forudsagte co-evolverende rester er tilstrækkelige til at forudsige tredimensionel proteinfoldning, forudsat at tilstrækkelige sekvenser er tilgængelige (>1000 homologe sekvenser er nødvendige) [35] . EVfold-metoden bruger ikke homologimodellering og kan køres på en standard personlig computer selv for proteiner med hundredvis af rester. Den forudsigelige nøjagtighed af dette og relaterede tilgange er blevet demonstreret på mange strukturer og kontaktkort [36] [37] [38] .
Sammenlignende modellering af proteinstruktur
Sammenlignende proteinstrukturmodellering bruger strukturer, der tidligere er opnået ved hjælp af eksperimentelle metoder som udgangspunkt. Dette er effektivt, fordi tilsyneladende, selvom antallet af eksisterende proteiner er enormt, er antallet af tertiære strukturelle motiver , som de fleste proteiner tilhører , begrænset [4] .
Disse metoder kan også opdeles i to grupper [39] :
- Homologimodellering er baseret på den antagelse, at homologe proteiner har en lignende struktur. Da proteinfolden er mere konserveret end dens aminosyresekvens , kan strukturen af det undersøgte protein forudsiges med god nøjagtighed, selvom det er fjernt beslægtet med det protein, der anvendes som skabelon, forudsat at homologien mellem skabelonen og målet protein kan spores ved sekvensjustering [40] . Det er blevet foreslået, at den største svaghed ved komparativ modellering ligger i unøjagtighederne af justeringerne snarere end fejl i strukturforudsigelse givet en kendt god justering [41] . Ikke overraskende opnår homologimodellering de bedste resultater, når målproteinet og skabelonen har lignende sekvenser. [fire]
- Fold-genkendelse søger efter en aminosyresekvens, for hvilken en struktur er ukendt i en database med kendte strukturer [42] . I hvert tilfælde bruges scorefunktionen til at evaluere sekvensens kompatibilitet med strukturen, hvilket giver dig mulighed for at få et sæt mulige tredimensionelle modeller. Denne type teknik er også kendt som 3D-1D fold genkendelse på grund af kompatibilitetsanalyse mellem 3D strukturer og lineære proteinsekvenser . [43]
Geometri forudsigelse af sideradikaler
Nøjagtig forudsigelse af placeringen af sideaminosyreradikaler i strukturen er et separat problem i proteinstrukturforudsigelse. Metoder, der løser problemet med forudsigelse af sideradikal geometri, omfatter eliminering af dødvande og selvkonsistente feltmetoder [44] [45] . Lavenergisidekædekonformationer er sædvanligvis defineret på en stiv polypeptidrygrad og anvender et sæt adskilte sidekædekonformationer , "rotamerer". Funktionsprincippet for sådanne metoder er at søge efter et sæt rotamerer, der minimerer modellens samlede energi [40] .
Disse metoder bruger biblioteker af rotamerer, som er sæt af gunstige konformationer for hver type rest i et protein. Rotamer-biblioteker kan indeholde information om konformation, dens frekvens og standardafvigelser i forhold til gennemsnitsværdierne af torsionsvinkler, som kan bruges til valg af muligheder [46] . Rotamer-biblioteker genereres ved strukturel bioinformatik eller anden statistisk analyse af sidekædekonformationer i eksperimentelt kendte proteinstrukturer. Rotamer-biblioteker kan være rygradsuafhængige , sekundære strukturafhængige eller rygradsafhængige. Rygradsuafhængige rotamerbiblioteker bruger ikke rygradskonformationsinformation og beregnes ud fra alle tilgængelige sidekæder af en bestemt type (for eksempel det første eksempel på et rotamerbibliotek lavet af Ponder og Richards ved Yale University i 1987 [47] ). Biblioteker, der er afhængige af den sekundære struktur, er forskellige torsionsvinkler og/eller rotamerfrekvenser for klasser af sekundære strukturer (alfahelix, beta-ark eller loop [48] ). Rygradsafhængige biblioteker af rotamerer er konformationer og (eller) deres frekvenser, afhængigt af den lokale konformation af hovedkæden, som bestemmes af torsionsvinklerne phi og psi og ikke afhænger af den sekundære struktur [49] . Moderne versioner af disse biblioteker, der bruges i de fleste programmer, præsenteres som multivariate sandsynligheds- eller frekvensfordelinger, hvor toppene svarer til torsionsvinkelkonformationer, der betragtes som separate rotamerer. [halvtreds]
Kvaternære strukturforudsigelsesalgoritmer
Protein-protein docking
Protein-protein docking (eller Protein-Protein Interaction (PPI) ) er en molekylær modelleringsmetode , der gør det muligt at forudsige den mest gunstige orientering og konformation af et molekyle (ligand) i bindingscentret af et andet (receptor) for dannelsen af en stabilt kompleks . Data om partnerproteiners position og konformation bruges til at forudsige styrken af interaktionen gennem såkaldte scoringsfunktioner. [51]
Beregningsmetoder til at forudsige protein-protein-interaktioner
Da der stadig ikke er fuldstændige data om interaktomet, og ikke alle protein-protein-interaktioner er blevet fundet, anvendes forskellige beregningsmetoder til rekonstruktion af signalering eller metaboliske kort over interaktioner. De giver dig mulighed for at udfylde huller ved at forudsige tilstedeværelsen af visse interaktioner mellem netværksknuder. Ved hjælp af beregningsmetoder er det muligt at forudsige ikke kun muligheden for WBV, men også deres styrke [52] .
Følgende er flere beregningsmæssige tilgange til at forudsige protein-protein-interaktioner:
- Søgning efter gen- eller proteindomænefusionsbegivenheder : genfusioner , som ofte også betyder domænefusion, kan bruges til at søge efter et funktionelt forhold mellem proteiner. Dette bruger antagelsen om, at fusionen af disse gener under evolution blev lettet af selektion [53] .
- Komparativ genomik og genklyngemetoder : ofte er gener, der koder for proteiner med lignende funktion eller interagerende proteiner, i samme operon (i tilfælde af bakterier) eller er co-reguleret (coregulering) (i tilfælde af eukaryoter). Sådanne gener er normalt tæt placeret i genomet. Genklyngemetoder estimerer sandsynligheden for samtidig forekomst af proteinortologer, der koder for gener fra den samme klynge. Sådanne tilgange hjælper med at afsløre den funktionelle interaktion mellem proteiner snarere end deres fysiske kontakt [52] .
- Metoder baseret på fylogenetiske profiler : I sådanne metoder antages det, at hvis ikke-homologe proteiner er funktionelt beslægtede, så er der en mulighed for, at de kan gå ind i PPI og udvikle sig sammen. For at finde en funktionel sammenhæng mellem proteiner, anvendes clustering ved fylogenetiske profiler af disse proteiner, eller sandsynligheden for samtidig forekomst af proteiner i forskellige proteomer estimeres [52] . Ideen om, at interagerende proteiner ofte har topologisk lignende fylogenetiske træer , bruges i spejltræmetoden [54] .
- Homologi-baserede forudsigelsesmetoder : Denne tilgang antager, at de undersøgte proteiner vil interagere med hinanden, hvis deres homologer vides at interagere. Sådanne par af proteiner fra forskellige organismer, som har bevaret evnen til at interagere med hinanden under evolutionen, kaldes interologer . Eksempler på tjenester, der bruger denne metode, er PPISearch og BIPS [52] .
- Forudsigelse baseret på gen-co-ekspressionsdata : hvis de undersøgte proteiner koder for gener med lignende ekspressionsmønstre (lignende profil og ekspressionsniveau ) ved forskellige tidsintervaller, så kan det antages, at disse proteiner er funktionelt beslægtede og muligvis på en eller anden måde interagerer med hver andet [55] .
- Netværkstopologibaserede metoder : BWV-netværk kan repræsenteres som en graf, hvor noder er proteiner, og hver kant repræsenterer en interaktion mellem proteiner. Ved hjælp af en matematisk fortolkning af PPI-netværket (f.eks. i form af en adjacency matrix ) kan man bestemme, hvordan proteiner er funktionelt relateret til hinanden, samt forudsige nye PPI'er. Hvis to proteiner har mange fælles partnere i netværket, så deltager de højst sandsynligt i den samme biologiske proces og kan potentielt interagere med hinanden [52] .
- In-Silico to-hybrid tilgang : Hovedantagelsen af denne metode er, at interagerende proteiner co-evolverer for at opretholde funktionalitet. Denne metode analyserer flere justeringer af en proteinfamilie og søger efter korrelerede mutationer for at forudsige PPV og søge efter baser inden for bindingsstedet [56] .
- Strukturbaseret PPI-forudsigelse : Denne tilgang gør det ikke kun muligt at finde ud af, om proteiner kan interagere, men også at karakterisere denne interaktion (for eksempel dens fysiske egenskaber eller aminosyrerne, der udgør interaktionsoverfladen af to proteiner). En af metoderne, der bruger den tredimensionelle struktur af proteiner, er docking . Dette omfatter også metoder, der antager den evolutionære konservatisme af de baser, der udgør interaktionsfladen. På basis af allerede kendte strukturer er det således muligt at forudsige, hvordan det multimolekylære kompleks af de undersøgte proteiner vil se ud [52] .
- Metoder baseret på maskinlæring eller tekstmining : baseret på maskinlæring er der udviklet en metode til at forudsige PPI, der kun bruger sekvenserne af de undersøgte proteiner [57] . Dette gør det muligt at analysere, om end mindre præcist, et større antal mulige interaktioner, da kun aminosyresekvenser bruges til arbejde. Tekstmining leder efter forbindelser mellem proteiner ved at overveje deres gensidige omtale i sætninger eller afsnit i forskellige tekstblokke [58] .
CASP
CASP (fra engelsk. Critical Assessment of protein Structure Prediction - en kritisk vurdering af forudsigelsen af proteinstrukturer) er et storstilet eksperiment om forudsigelse af proteinstrukturer. Det har fundet sted siden 1994 med en frekvens på hvert andet år [59] . CASP tester objektivt metoder til forudsigelse af proteinstruktur og giver en uafhængig vurdering af strukturel modellering. Hovedmålet med CASP er at hjælpe med at forbedre metoder til at bestemme den tredimensionelle struktur af proteiner ud fra deres aminosyresekvenser . Mere end 100 forskergrupper deltager løbende i projektet. Et af hovedprincipperne i CASP er, at deltagerne ikke har nogen forudgående information om proteinet ud over aminosyresekvensen. Af denne grund bruger CASP en dobbeltblind metode - hverken arrangørerne, eksperterne eller deltagerne kender strukturen af de testede proteiner før slutningen af forudsigelsesstadiet. Testede proteiner er oftest uopløste strukturer opnået ved røntgendiffraktionsanalyse og NMR [60] .
Denne begivenhed hjælper med at sammenligne avancerede metoder til at forudsige proteinstrukturer og søgen efter en "ideel" algoritme, der kun kan forudsige den tertiære struktur af et protein ud fra aminosyresekvensen [61] .
Den sidste CASP13 blev vundet af holdet, der brugte AlphaFold neurale netværk . Så højst sandsynligt vil forudsigelsen af proteinstrukturer i fremtiden ske ved hjælp af neurale netværk [62] .
Foldit
Foldit er et online proteinfoldningspuslespil. Spillet er en del af et forskningsprojekt og udviklet ved University of Washington . Formålet med spillet er at folde strukturen af de udvalgte proteiner på den bedst mulige måde; de bedste brugerløsninger analyseres af videnskabsmænd, som kan bruge dem til at løse reelle videnskabelige problemer i forbindelse med søgen efter vacciner og biologiske innovationer. De fleste af de bedste Foldit-spillere har ikke en baggrund i biokemi [63] .
Målet med dette spil er at forudsige den tredimensionelle struktur af et bestemt protein med det laveste frie energiniveau [64] . Hver opgave offentliggøres på siden i en bestemt periode, hvor brugerne konkurrerer med hinanden.
Under spillet manipulerer spillerne interaktivt molekylet ved at ændre vinklerne på proteinrygraden og også arrangementet af aminosyreradikalerne. Spillere er i stand til at sætte restriktioner på bestemte områder ("gummibånd") eller "fryse" dem. Brugere er også forsynet med en værktøjslinje til at udføre automatiserede opgaver, såsom "wiggle"-kommandoen for at minimere energi lokalt.
Brugeren får information om, hvor godt han formår at folde proteinet, i form af point, der især gives for dannelsen af nye brintbindinger, skjule hydrofobe rester inde i molekylet osv. Programmet giver også spillerne hints, fremhæver for eksempel områder, hvor visse grupper overlapper og bør fortyndes, åbne hydrofobe områder, der skal være skjult for vandets påvirkninger osv. Siden giver brugerne mulighed for at dele og diskutere løsninger med hinanden [63] .
Historie
En af de første algoritmer til at forudsige den sekundære struktur af et protein var Chou - Fasman - metoden , primært baseret på probabilistiske parametre bestemt ved hjælp af de relative frekvenser for forekomst af hver aminosyre i hver type sekundære strukturer [21] . Nøjagtigheden af Chow-Fasman-metoden er omkring 50-60% [65] .
Det næste bemærkelsesværdige program var GOR metoden , opkaldt efter de første bogstaver i navnene på dens udviklere, en metode baseret på informationsteori [66] . Den bruger den probabilistiske metode for Bayesiansk inferens [66] . GOR-metoden tager ikke kun højde for sandsynligheden for, at en aminosyre af en bestemt type er inkluderet i en bestemt sekundær struktur, men også den betingede sandsynlighed for, at en aminosyre er inkluderet i denne sekundære struktur, under hensyntagen til bidraget fra dens naboer (det antages ikke, at naboerne har samme struktur) [66] . Den oprindelige GOR-metode havde en nøjagtighed på omkring 65 % og var signifikant mere vellykket til at forudsige alfa-helixer end beta- helixer, som den ofte fejlforudsagde som loops eller uorganiserede patches 65] .
Et andet stort skridt fremad var brugen af maskinlæringsmetoder : de første metoder til neurale netværk blev brugt i programmer til at forudsige proteiners sekundære strukturer. Som træningsprøver brugte de proteinsekvenser med eksperimentelt opnåede strukturer til at bestemme fælles motiver forbundet med et bestemt arrangement af sekundære strukturer [67] . Disse metoder er mere end 70 % nøjagtige i deres forudsigelser, selvom antallet af beta-strenge også ofte undervurderes på grund af manglen på information om den tredimensionelle struktur, der ville tillade estimering af hydrogenbindingsmønstre , der kan bidrage til dannelsen af betaark [65] . PSIPRED Arkiveret 21. juli 2011 på Wayback Machine og JPRED Arkiveret 7. april 2020 på Wayback Machine er blandt de bedst kendte neurale netværksbaserede protein sekundær struktur forudsigelsesprogrammer [68] [69] . For nylig har støttevektormaskiner vist sig at være særligt nyttige til at forudsige sving, der er svære at identificere med statistiske metoder [70] [71] .
Udvidelser til maskinlæringsmetoder bruges til at forudsige mere nøjagtige lokale egenskaber af proteiner, såsom torsionsrygradsvinkler i områder med uklassificeret struktur. Både understøttende vektormaskiner og neurale netværk er blevet brugt til at løse dette problem [70] [72] [73] . For nylig gjorde SPINE -X -programmet Arkiveret 12. april 2020 på Wayback Machine det muligt nøjagtigt at forudsige reelle vridningsvinkler og med succes bruge denne information til at forudsige ab initio struktur [74] .
Noter
- ↑ Zaki, MJ, Bystroff, C. Protein struktur forudsigelse , Humana Press, 2008, 337 s. Uddrag af tekst på Google Bøger
- ↑ 1 2 Yang Y. , Gao J. , Wang J. , Heffernan R. , Hanson J. , Paliwal K. , Zhou Y. Femogtres år af den lange march i protein sekundær struktur forudsigelse: det sidste stykke? (engelsk) // Briefings In Bioinformatics. - 2018. - 1. maj ( bd. 19 , nr. 3 ). - S. 482-494 . - doi : 10.1093/bib/bbw129 . — PMID 28040746 .
- ↑ Anfinsen CB- principper, der styrer foldningen af proteinkæder // Videnskab . - 1973. - 20. juli ( bd. 181 , nr. 4096 ). - S. 223-230 . — ISSN 0036-8075 . - doi : 10.1126/science.181.4096.223 .
- ↑ 1 2 3 Li Bian , Fooksa Michaela , Heinze Sten , Meiler Jens. At finde nålen i høstakken: mod at løse proteinfoldningsproblemet beregningsmæssigt // Critical Reviews in Biochemistry and Molecular Biology. - 2017. - 4. oktober ( bind 53 , nr. 1 ). - S. 1-28 . — ISSN 1040-9238 . doi : 10.1080 / 10409238.2017.1380596 .
- ↑ Zhang Yang. Fremskridt og udfordringer i forudsigelse af proteinstruktur // Current Opinion in Structural Biology. - 2008. - Juni ( bind 18 , nr. 3 ). - S. 342-348 . — ISSN 0959-440X . - doi : 10.1016/j.sbi.2008.02.004 .
- ↑ Fundamentalt "proteinproblem" løst. Forskere kæmpede om det i et halvt århundrede , og til sidst hjalp Google -programmører dem - og det kan være meget vigtigt for medicin
- ↑ Richardson Jane S. The Anatomy and Taxonomy of Protein Structure (engelsk) // Advances in Protein Chemistry bind 34. - 1981. - S. 167-339 . — ISBN 9780120342341 . — ISSN 0065-3233 . - doi : 10.1016/S0065-3233(08)60520-3 .
- ↑ Pace CN , Scholtz JM En helix eksperimentel tilbøjelighedsskala baseret på undersøgelser af peptider og proteiner. (engelsk) // Biophysical Journal. - 1998. - Juli ( bind 75 , nr. 1 ). - S. 422-427 . - doi : 10.1016/s0006-3495(98)77529-0 . — PMID 9649402 .
- ↑ Nick Pace C. , Martin Scholtz J. A Helix Propensity Scale Based on Experimental Studies of Peptides and Proteins // Biophysical Journal. - 1998. - Juli ( bind 75 , nr. 1 ). - S. 422-427 . — ISSN 0006-3495 . - doi : 10.1016/s0006-3495(98)77529-0 .
- ↑ Chothia C. Konformation af snoede beta-plisserede ark i proteiner. (engelsk) // Journal Of Molecular Biology. - 1973. - 5. april ( bind 75 , nr. 2 ). - S. 295-302 . - doi : 10.1016/0022-2836(73)90022-3 . — PMID 4728692 .
- ↑ Richardson JS , Richardson DC Naturlige beta-sheet-proteiner bruger negativt design for at undgå kant-til-kant-aggregering. (engelsk) // Proceedings of the National Academy of Sciences of the United States Of America. - 2002. - 5. marts ( bind 99 , nr. 5 ). - P. 2754-2759 . - doi : 10.1073/pnas.052706099 . — PMID 11880627 .
- ↑ Finkelstein A. V., Ptitsyn O. B. Sekundære strukturer af polypeptidkæder // Protein Physics. - Moskva: KDU, 2005. - S. 86-95. — ISBN 5-98227-065-2 .
- ↑ Choi Yoonjoo , Agarwal Sumeet , Deane Charlotte M. Hvor lang er et stykke løkke? (engelsk) // PeerJ. - 2013. - 12. februar ( bind 1 ). -P.e1 . _ — ISSN 2167-8359 . - doi : 10.7717/peerj.1 .
- ↑ Hvad er makromolekylære strukturer? . Hentet 20. april 2020. Arkiveret fra originalen 12. maj 2020. (ubestemt)
- ↑ tertiær struktur Arkiveret 19. maj 2011 på Wayback Machine // IUPAC, 1996, 68, 2193. (Basic terminology of stereochemistry (IUPAC Recommendations 1996)) på side 2220, IUPAC Gold Book.
- ↑ Clarke, Jeremy M. Berg; John L. Tymoczko; Lubert Stryer. Webindhold af Neil D. Afsnit 3.5 Kvaternær struktur: Polypeptidkæder kan samles i multiunderenhedsstrukturer // Biokemi . - 5. ed., 4. print.. - New York, NY [ua]: W. H. Freeman, 2002. - ISBN 0-7167-3051-0 .
- ↑ Chou, Kuo-Chen; Cai, Yu Dong. Forudsigelse af protein kvaternær struktur ved pseudo-aminosyresammensætning // Proteiner : struktur, funktion og bioinformatik : journal. - 2003. - 1. november ( bind 53 , nr. 2 ). - S. 282-289 . - doi : 10.1002/prot.10500 . — PMID 14517979 .
- ↑ 1 2 Yang Yuedong , Gao Jianzhao , Wang Jihua , Heffernan Rhys , Hanson Jack , Paliwal Kuldip , Zhou Yaoqi. Femogtres år af den lange march i forudsigelse af protein sekundær struktur: det sidste stræk? (engelsk) // Briefings in Bioinformatics. - 2016. - 31. december. —P.bbw129 . _ — ISSN 1467-5463 . - doi : 10.1093/bib/bbw129 .
- ↑ Wolfgang Kabsch, Christian Sander. Ordbog over protein sekundær struktur: Mønstergenkendelse af hydrogenbundne og geometriske træk // Biopolymerer. — 1983-12. - T. 22 , nej. 12 . — S. 2577–2637 . - ISSN 1097-0282 0006-3525, 1097-0282 . - doi : 10.1002/bip.360221211 . Arkiveret 29. maj 2020.
- ↑ Xu, Ying, Xu, Dong, Liang, Jie. Beregningsmetoder til forudsigelse og modellering af proteinstruktur: Bind 1: Grundlæggende karakterisering . - 2007. - ISBN 978-0-387-68372-0 . Arkiveret 11. juni 2020 på Wayback Machine
- ↑ 1 2 Chou Peter Y. , Fasman Gerald D. Forudsigelse af proteinkonformation // Biokemi . - 1974. - 15. januar ( bind 13 , nr. 2 ). - S. 222-245 . — ISSN 0006-2960 . - doi : 10.1021/bi00699a002 .
- ↑ Asaf A. Salamov, Victor V. Solovyev. Forudsigelse af protein sekundær struktur ved at kombinere nærmeste nabo-algoritmer og multiple sekvensjusteringer // Journal of Molecular Biology. - 1995-03. - T. 247 , no. 1 . — S. 11–15 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1994.0116 .
- ↑ Daniel W. A. Buchan, David T Jones. PSIPRED Protein Analysis Workbench: 20 år på // Nucleic Acids Research. — 2019-04-26. - T. 47 , no. W1 . — S. W402–W407 . — ISSN 1362-4962 0305-1048, 1362-4962 . - doi : 10.1093/nar/gkz297 .
- ↑ David T Jones. Protein sekundær struktur forudsigelse baseret på positionsspecifikke scoringsmatricer 1 1 Redigeret af G. Von Heijne // Journal of Molecular Biology. — 1999-09. - T. 292 , nr. 2 . — S. 195–202 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1999.3091 .
- ↑ Kiyoshi Asai, Satoru Hayamizu, Ken'ichi Handa. Forudsigelse af protein sekundær struktur ved den skjulte Markov model // Bioinformatik. - 1993. - T. 9 , no. 2 . — S. 141–146 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatik/9.2.141 .
- ↑ Pirovano Walter , Heringa Jaap. Protein Secondary Structure Prediction (engelsk) // Methods in Molecular Biology. - 2009. - 30. oktober. - s. 327-348 . — ISBN 9781603272407 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60327-241-4_19 .
- ↑ Bioinformatik / Shui Qing Ye. - Chapman og Hall/CRC, 2007-08-20. — ISBN 978-0-429-14203-1 .
- ↑ Seung Hwan Hong, Keehyoung Joo, Jooyoung Lee. ConDo: forudsigelse af proteindomænegrænse ved hjælp af coevolutionær information // Bioinformatik . - 2019-07-15. — Bd. 35 , iss. 14 . - S. 2411-2417 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bty973 .
- ↑ Ovchinnikov S, Kim De, Wang Ry, Liu Y, DiMaio F, Baker D. Forbedrede De Novo Structure Prediction i CASP11 ved at inkorporere Coevolution Information Into Rosetta . Proteiner (september 2016). Hentet 13. april 2020. Arkiveret fra originalen 1. april 2021.
- ↑ Dong Xu, Lukasz Jaroszewski, Zhanwen Li, Adam Godzik. AIDA: ab initio domænesamling til automatiseret multi-domæne proteinstruktur forudsigelse og domæne-domæne interaktion forudsigelse (engelsk) // Bioinformatik. — 2015-07-01. — Bd. 31 , udg. 13 . - S. 2098-2105 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btv092 . Arkiveret fra originalen den 3. juni 2018.
- ↑ Bian Lia et al. At finde nålen i høstakken: mod at løse proteinfoldningsproblemet beregningsmæssigt // Crit Rev Biochem Mol Biol : journal. - 2018. - Bd. 52 , nr. 1 . - S. 1-28 . doi : 10.1080 / 10409238.2017.1380596 .
- ↑ Philip Hunter. ind i folden. Fremskridt inden for teknologi og algoritmer letter store fremskridt i forudsigelse af proteinstruktur // EMBO rapporter. - 2006-03. - T. 7 , nej. 3 . — S. 249–252 . — ISSN 1469-221X . - doi : 10.1038/sj.embor.7400655 .
- ↑ Ulrike Göbel, Chris Sander, Reinhard Schneider, Alfonso Valencia. Korrelerede mutationer og restkontakter i proteiner (engelsk) // Proteins: Structure, Function, and Bioinformatics. - 1994. - Bd. 18 , iss. 4 . - S. 309-317 . — ISSN 1097-0134 . - doi : 10.1002/prot.340180402 .
- ↑ William R. Taylor, Kerr Hatrick. Kompenserende ændringer i protein-multisekvens-justeringer // Protein Engineering, Design and Selection. - 1994-03-01. — Bd. 7 , iss. 3 . - s. 341-348 . — ISSN 1741-0126 . doi : 10.1093 / protein/7.3.341 .
- ↑ Debora S. Marks, Lucy J. Colwell, Robert Sheridan, Thomas A. Hopf, Andrea Pagnani. Protein 3D-struktur beregnet ud fra evolutionær sekvensvariation // PLOS One . - Public Library of Science , 2011-07-12. — Bd. 6 , iss. 12 . —P.e28766 . _ — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0028766 . Arkiveret fra originalen den 8. marts 2022.
- ↑ Lukas Burger, Erik van Nimwegen. Adskillelse direkte fra indirekte co-evolution af rester i proteinjusteringer // PLOS Computational Biology. - 01-01-2010. — Bd. 6 , iss. 1 . — P.e1000633 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1000633 . Arkiveret fra originalen den 18. februar 2022.
- ↑ Faruck Morcos, Andrea Pagnani, Bryan Lunt, Arianna Bertolino, Debora S. Marks. Direkte-koblingsanalyse af restkoevolution fanger native kontakter på tværs af mange proteinfamilier // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 2011-12-06. — Bd. 108 , udg. 49 . - P. E1293–E1301 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1111471108 . Arkiveret fra originalen den 25. juli 2020.
- ↑ Timothy Nugent, David T. Jones. Nøjagtig de novo-strukturforudsigelse af store transmembrane proteindomæner ved hjælp af fragmentsamling og korreleret mutationsanalyse // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 2012-06-12. — Bd. 109 , udg. 24 . - P. E1540–E1547 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1120036109 . Arkiveret 25. maj 2021.
- ↑ Yang Zhang. Fremskridt og udfordringer i forudsigelse af proteinstruktur // Current Opinion in Structural Biology. — Elsevier , 2008-06-01. — Bd. 18 , iss. 3 . - S. 342-348 . — ISSN 0959-440X . - doi : 10.1016/j.sbi.2008.02.004 .
- ↑ 1 2 Bian Li, Michaela Fooksa, Sten Heinze, Jens Meiler. At finde nålen i høstakken: mod at løse proteinfoldningsproblemet beregningsmæssigt // Critical Reviews in Biochemistry and Molecular Biology. — 2018-01-02. — Bd. 53 , udg. 1 . — S. 1–28 . — ISSN 1549-7798 1040-9238, 1549-7798 . doi : 10.1080 / 10409238.2017.1380596 .
- ↑ Yang Zhang, Jeffrey Skolnick. Problemet med forudsigelse af proteinstrukturen kunne løses ved hjælp af det nuværende FDB-bibliotek // Proceedings of the National Academy of Sciences . - National Academy of Sciences , 2005-01-25. — Bd. 102 , udg. 4 . - S. 1029-1034 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.0407152101 . Arkiveret fra originalen den 22. juli 2020.
- ↑ JU Bowie, R. Luthy, D. Eisenberg. En metode til at identificere proteinsekvenser, der foldes til en kendt tredimensionel struktur // Science . - 1991-07-12. — Bd. 253 , udg. 5016 . - S. 164-170 . — ISSN 1095-9203 0036-8075, 1095-9203 . - doi : 10.1126/science.1853201 . Arkiveret fra originalen den 21. februar 2020.
- ↑ Yo Matsuo, Haruki Nakamura, Ken Nishikawa. Detektion af protein 3D-1D-kompatibilitet karakteriseret ved evaluering af sidekædepakning og elektrostatiske interaktioner // The Journal of Biochemistry. - 1995-07. — Bd. 118 , udg. 1 . — S. 137–148 . — ISSN 0021-924X 1756-2651, 0021-924X . - doi : 10.1093/oxfordjournals.jbchem.a124869 .
- ↑ Desmet J, De Maeyer M, Hazes B, Lasters I. The Dead-End Elimination Theorem and Its Use in Protein Side-Chain Positioning . Natur (9. april 1992). Hentet 27. april 2020. Arkiveret fra originalen 31. oktober 2021.
- ↑ Patrice Koehl, Marc Delarue. Anvendelse af en selvkonsistent middelfeltteori til at forudsige proteinsidekæders konformation og estimere deres konformationelle entropi // Journal of Molecular Biology. - 1994-06. - T. 239 , nr. 2 . - S. 249-275 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1994.1366 .
- ↑ Roland L Dunbrack. Rotamer Libraries in the 21st Century // Current Opinion in Structural Biology. — Elsevier , 2002-08-01. — Bd. 12 , udg. 4 . - S. 431-440 . — ISSN 0959-440X . - doi : 10.1016/S0959-440X(02)00344-5 .
- ↑ Jay W. Ponder, Frederic M. Richards. Tertiære skabeloner for proteiner: Anvendelse af pakningskriterier ved opregning af tilladte sekvenser for forskellige strukturelle klasser // Journal of Molecular Biology. - 1987-02-20. — Bd. 193 , udg. 4 . - s. 775-791 . — ISSN 0022-2836 . - doi : 10.1016/0022-2836(87)90358-5 .
- ↑ Simon C. Lovell, J. Michael Word, Jane S. Richardson, David C. Richardson. Det næstsidste rotamerbibliotek (tysk) // Proteiner: Struktur, funktion og bioinformatik. - 2000. - Bd. 40 , H.3 . - S. 389-408 . — ISSN 1097-0134 . - doi : 10.1002/1097-0134(20000815)40:33.0.CO;2-2 .
- ↑ Maxim V. Shapovalov, Roland L. Dunbrack. Et glattet rygradsafhængigt rotamerbibliotek for proteiner afledt af adaptive kernedensitetsestimater og -regressioner // Struktur . - 08-06-2011. — Bd. 19 , iss. 6 . - S. 844-858 . — ISSN 0969-2126 . - doi : 10.1016/j.str.2011.03.019 . Arkiveret fra originalen den 21. juli 2013.
- ↑ Andrew M. Watkins, Timothy W. Craven, P. Douglas Renfrew, Paramjit S. Arora, Richard Bonneau. Rotamer Libraries for the High-Resolution Design of β-Amino Acid Foldamers // Structure (London, England: 1993). — 2017-11-07. - T. 25 , nej. 11 . — S. 1771–1780.e3 . — ISSN 0969-2126 . - doi : 10.1016/j.str.2017.09.005 .
- ↑ Thomas Lengauer, Matthias Rarey. Beregningsmetoder til biomolekylær docking // Current Opinion in Structural Biology. - 1996-06-01. — Bd. 6 , iss. 3 . - S. 402-406 . — ISSN 0959-440X . - doi : 10.1016/S0959-440X(96)80061-3 . Arkiveret fra originalen den 29. november 2012.
- ↑ 1 2 3 4 5 6 Keskin, O.; Tuncbag, N; Gursoy, A. Forudsigelse af protein-protein-interaktioner fra molekylært til proteomniveau // Kemiske anmeldelser : journal. - 2016. - Bd. 116 , nr. 8 . - P. 4884-4909 . — PMID 27074302 .
- ↑ Enright, AJ; Iliopoulos, I.; Kyrpides, N.C.; Ouzounis, CA Proteininteraktionskort for komplette genomer baseret på genfusionsbegivenheder // Nature: tidsskrift. - 1999. - Bd. 402 , nr. 6757 . - S. 86-90 . — PMID 10573422 .
- ↑ Pazos, F.; Valencia, A. Similarity of Phylogenetic Trees as Indicator of Protein-Protein Interaction // Protein Eng ., Des. Sel. : journal. - 2001. - Bd. 14 , nr. 9 . - S. 609-614 . — PMID 11707606 .
- ↑ Jansen, R.; IGreenbaum, D.; Gerstein, M. Relation af hel-genomekspressionsdata med protein-protein-interaktioner // Genome Res . : journal. - 2002. - Bd. 12 , nr. 1 . - S. 37-46 . — PMID 11779829 .
- ↑ Pazos, F.; Valencia, A. In Silico To-Hybrid System til udvælgelse af fysisk interagerende proteinpar // Proteiner: Struct., Funct., Genet. : journal. - 2002. - Bd. 47 , nr. 2 . - S. 219-227 . — PMID 11933068 .
- ↑ Shen, J.; IZhang, J.; Luo, X.; Zhu, W.; Yu, K.; Chen, K.; Li, Y.; Jiang, H. Forudsigelse af protein-protein-interaktioner kun baseret på sekvensinformation (engelsk) // Proceedings of the National Academy of Sciences of the United States of America : journal. - 2007. - Bd. 104 , nr. 11 . - P. 4337-4341 . — PMID 17360525 .
- ↑ Papanikolaou, N.; Pavlopoulos, G.A.; Theodosiou, T.; Iliopoulos, I. Protein-protein interaktion forudsigelser ved hjælp af tekst mining metoder // Metoder: tidsskrift. - 2015. - Bd. 74 . - S. 47-53 . — PMID 25448298 .
- ↑ Moult John , Pedersen Jan T. , Judson Richard , Fidelis Krzysztof. Et storstilet eksperiment til at vurdere metoder til forudsigelse af proteinstruktur // Proteins: Structure, Function, and Genetics. - 1995. - November ( bind 23 , nr. 3 ). - P. ii-iv . — ISSN 0887-3585 . - doi : 10.1002/prot.340230303 .
- ↑ Moult J. , Pedersen JT , Judson R. , Fidelis K. Et storstilet eksperiment til vurdering af metoder til forudsigelse af proteinstruktur. (engelsk) // Proteiner. - 1995. - November ( bind 23 , nr. 3 ). - doi : 10.1002/prot.340230303 . — PMID 8710822 .
- ↑ Ben-David M. , Noivirt-Brik O. , Paz A. , Prilusky J. , Sussman JL , Levy Y. Vurdering af CASP8-strukturforudsigelser for skabelonfrie mål. (engelsk) // Proteiner. - 2009. - Bd. 77 Supplerende 9 . - S. 50-65 . - doi : 10.1002/prot.22591 . — PMID 19774550 .
- ↑ Googles DeepMind forudsiger 3D-former af proteiner , The Guardian (2. december 2018). Arkiveret fra originalen den 18. juli 2019. Hentet 19. juli 2019.
- ↑ 1 2 Cooper S., Khatib F., Treuille A., Barbero J., Lee J., Beenen M., Leaver-Fay A., Baker D., Popović Z., Players F. Predicting protein structures with a multiplayer online spil (eng.) // Nature: journal. - 2010. - Bd. 466 . - S. 756-760 . - doi : 10.1038/nature09304 . — PMID 20686574 .
- ↑ Godt BM, Su AI Spil med et videnskabeligt formål // Genome Biol .. - 2011. - V. 12 . - S. 135 . - doi : 10.1186/gb-2011-12-12-135 . — PMID 22204700 .
- ↑ 1 2 3 Mount, David W. Bioinformatik: sekvens- og genomanalyse . — 2. udg. - Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press, 2004. - xii, 692 sider s. — ISBN 0-87969-687-7 , 978-0-87969-687-0 , 0-87969-712-1 , 978-0-87969-712-9 652-070-9. Arkiveret 5. januar 2009 på Wayback Machine
- ↑ 1 2 3 Garnier J. , Osguthorpe DJ , Robson B. Analyse af nøjagtigheden og implikationerne af simple metoder til at forudsige den sekundære struktur af globulære proteiner // Journal of Molecular Biology. - 1978. - Marts ( bind 120 , nr. 1 ). - S. 97-120 . — ISSN 0022-2836 . - doi : 10.1016/0022-2836(78)90297-8 .
- ↑ Holley LH , Karplus M. Protein sekundær struktur forudsigelse med et neuralt netværk. (engelsk) // Proceedings of the National Academy of Sciences. - 1989. - 1. januar ( bd. 86 , nr. 1 ). - S. 152-156 . — ISSN 0027-8424 . - doi : 10.1073/pnas.86.1.152 .
- ↑ Buchan Daniel WA , Jones David T. The PSIPRED Protein Analysis Workbench: 20 years on // Nucleic Acids Research. - 2019. - 26. april ( vol. 47 , nr. W1 ). - P.W402-W407 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkz297 .
- ↑ Drozdetskiy Alexey , Cole Christian , Procter James , Barton Geoffrey J. JPred4: a protein secondary structure prediction server // Nucleic Acids Research. - 2015. - 16. april ( vol. 43 , nr. W1 ). - P.W389-W394 . — ISSN 0305-1048 . - doi : 10.1093/nar/gkv332 .
- ↑ 1 2 PHAM THO HOAN , SATOU KENJI , HO TU BAO. UNDERSTØT VEKTORMASKINER TIL FORUDSIGLING OG ANALYSE AF BETA- OG GAMMA-VENDINGER I PROTEINER // Journal of Bioinformatics and Computational Biology. - 2005. - April ( bind 03 , nr. 02 ). - S. 343-358 . — ISSN 0219-7200 . - doi : 10.1142/S0219720005001089 .
- ↑ Zhang Q. , Yoon S. , Welsh WJ Forbedret metode til at forudsige -vending ved hjælp af støttevektormaskine // Bioinformatics . - 2005. - 29. marts ( bind 21 , nr. 10 ). - S. 2370-2374 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti358 .
- ↑ Zimmermann O. , Hansmann UHE Støt vektormaskiner til forudsigelse af dihedrale vinkelområder // Bioinformatik . - 2006. - 27. september ( bind 22 , nr. 24 ). - S. 3009-3015 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btl489 .
- ↑ Kuang R. , Leslie C.S. , Yang A.-S. Forudsigelse af proteinrygradsvinkel med maskinlæringstilgange // Bioinformatik . - 2004. - 26. februar ( bind 20 , nr. 10 ). - S. 1612-1621 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bth136 .
- ↑ Faraggi Eshel , Yang Yuedong , Zhang Shesheng , Zhou Yaoqi. Forudsigelse af kontinuert lokal struktur og effekten af dens substitution af sekundær struktur i fragmentfri proteinstruktur forudsigelse // Struktur . - 2009. - November ( bind 17 , nr. 11 ). - S. 1515-1527 . — ISSN 0969-2126 . - doi : 10.1016/j.str.2009.09.006 .