Rosetta@home

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 16. juli 2015; checks kræver 23 redigeringer .
Rosetta@home

Type Protein Structure Prediction , Volunteer Computing og Berkeley Open Infrastructure for Network Computing-projekter [d]
Udvikler Baker laboratory , University of Washington , Rosetta Commons
Operativ system Cross-platform software
Første udgave 6. oktober 2005
Hardware platform BOINC
nyeste version Rosetta Mini: 3,71 [1] ( 20. januar 2016 )
Stat Aktiv
Licens Gratis til akademisk og non-profit brug, proprietær licens tilgængelig til kommerciel brug [2]
Internet side boinc.bakerlab.org/roset...
 Mediefiler på Wikimedia Commons
Rosetta@home
Platform BOINC
Software download størrelse 48 MB
Jobdata indlæst størrelse 2,5 MB
Mængden af ​​sendt jobdata 6-150 KB
Diskplads _ 130 MB
Brugt mængde hukommelse 255 MB
GUI der er
Gennemsnitlig opgaveberegningstid 0,5 - 10 timer (tidsstyring mulig)
deadline 10 dage
Mulighed for at bruge GPU Ingen
 Mediefiler på Wikimedia Commons

Rosetta@Home  er et frivilligt computerprojekt , der har til formål at løse et af de største problemer inden for molekylærbiologi - at beregne den tertiære struktur af proteiner ud fra deres aminosyresekvenser . Takket være det afsluttede Human Genome Project er aminosyresekvenserne for alle proteiner i den menneskelige krop kendt. Forskning under dette projekt vil også hjælpe med design af nye, ikke-eksisterende proteiner. Mens meget af projektet fokuserer på grundforskning for at forbedre nøjagtigheden og robustheden af ​​proteomikmetoder, fremmer Rosetta@home også anvendt forskning til bekæmpelse af sygdomme som cancer , malaria , Alzheimers , miltbrand og andre genetiske og virale sygdomme [3] . Foldit  er et videospil fra Rosetta@Home, der har til formål at nå projektets mål med en crowdsourced tilgang.

Rosetta@Home-beregningsresultater er ikke direkte tilgængelige. Du kan heller ikke bruge resultaterne af beregninger på din egen computer. [4] De bruges dog til en lang række videnskabelige publikationer. [5]

I det væsentlige er Rosetta et computerprogram, hvis hovedopgaver er:

Dette projekt bruger forudsigelse og resultatfeedback til at forbedre potentielle søgefunktioner og algoritmer .

Computerplatform

Rosetta@home-appen og BOINC Distributed Computing Platform , tilgængelig til Windows, Linux og macOS-operativsystemer; BOINC kører også på flere andre, såsom FreeBSD. Deltagelse i Rosetta@home kræver en central processing unit (CPU) med en clockhastighed på mindst 500 MHz, 200 megabyte ledig diskplads, 512 megabyte fysisk hukommelse og en internetforbindelse. Fra den 27. juni 2020 er den aktuelle version af Rosetta Mini-appen 4.20. Den aktuelle anbefalede version af BOINC-softwaren er 7.16.7. Standard Hypertext Transfer Protocol (HTTP) (port 80) bruges til kommunikation mellem brugerens BOINC-klient og Rosetta@home-serverne ved University of Washington ; HTTPS (port 443) bruges under udveksling af adgangskode. Fjern- og lokalstyring af BOINC-klienten bruger port 31416 og port 1043, som specifikt kan ophæves, hvis de er bag en firewall. Arbejdsenheder, der indeholder data om individuelle proteiner, distribueres fra servere placeret i Baker Lab ved University of Washington til frivillige computere, som derefter beregner en strukturforudsigelse for det tildelte protein. For at undgå gentagne strukturforudsigelser for et givet protein initialiseres hver arbejdsblok med et tilfældigt antal frø. Dette giver hver forudsigelse en unik bane til at gå ned gennem proteinets energilandskab. Proteinstruktur forudsigelser fra Rosetta@home er omtrentlige værdier for det globale minimum i et givet proteins energilandskab. Dette globale minimum repræsenterer den mest energimæssigt gunstige proteinkonformation, det vil sige dens oprindelige tilstand.

Hovedfunktionen i Rosetta@home grafiske brugergrænseflade (GUI) er en pauseskærm, der viser den aktuelle tilstand af det kørende modul under proteinfoldningssimulering. Det øverste venstre hjørne af den aktuelle splash-skærm viser målproteinet, der antager forskellige former (konformationer) i sin søgen efter den laveste energistruktur. Umiddelbart til højre er strukturen af ​​den sidst modtagne. Det øverste højre hjørne viser den laveste energikonformation af det aktuelle layout; nedenfor er den sande eller native struktur af proteinet, hvis det allerede er blevet bestemt. Tre diagrammer er inkluderet i splash-skærmen. Nær midten vises et plot for den accepterede models termodynamiske frie energi, som svinger i takt med at den accepterede model ændres. Det accepterede model standardafvigelse (RMSD) plot, som måler, hvor strukturelt ens den accepterede model er den oprindelige model, er vist til højre. Til højre for det modtagne energiplot og under RMSD-plottet bruges resultaterne af disse to funktioner til at plotte energien versus RMSD, efterhånden som modellen gradvist forfines.

Som alle BOINC-projekter kører Rosetta@home i baggrunden på brugerens computer ved at bruge strøm fra den inaktive computer, under eller før man logger ind på en konto på værtens operativsystem . Programmet frigiver ressourcer fra CPU'en, efterhånden som andre applikationer har brug for dem, hvilket ikke påvirker den normale brug af computeren. Mange programindstillinger kan indstilles via brugerkontoindstillinger, herunder: den maksimale procentdel af CPU-ressourcer programmet kan bruge (til at styre strømforbruget eller generere varme fra en computer, der kører med konstant strøm), tidspunktet på dagen programmet kan køre, og mere andet.

Rosetta, softwaren, der kører på Rosetta@home-netværket, er blevet omskrevet i C++ for at gøre det nemmere at udvikle, end det var tilladt af dens originale version skrevet i Fortran. Denne nye version er objektorienteret og blev udgivet den 8. februar 2008. Rosetta-kodeudvikling udføres af Rosetta Commons. Softwaren er frit licenseret til det akademiske samfund og er tilgængelig for medicinalvirksomheder mod et gebyr.

Projektets betydning

Med udbredelsen af ​​genomsekventeringsprojekter kan videnskabsmænd udlede aminosyresekvensen eller primærstrukturen af ​​mange proteiner, der udfører funktioner i en celle. For bedre at forstå proteinfunktion og hjælpe med rationelt lægemiddeldesign, skal forskerne kende proteinets tredimensionelle tertiære struktur.

Protein tredimensionelle strukturer bestemmes i øjeblikket eksperimentelt ved hjælp af røntgenkrystallografi eller nuklear magnetisk resonans (NMR) spektroskopi. Processen er langsom (det kan tage uger eller endda måneder at finde ud af, hvordan man krystalliserer et protein for første gang) og dyr (omkring $100.000 pr. protein). Desværre overstiger hastigheden, hvormed nye sekvenser opdages, langt hastigheden for strukturbestemmelse - af de mere end 7.400.000 proteinsekvenser, der er tilgængelige i National Center for Biotechnology Information (NCBI) unreduced (nr) proteindatabase, er der færre end 52.000 tredimensionelle proteinstrukturer er blevet løst og placeret i Protein Data Bank, hovedlageret for strukturel information om proteiner [6] . Et af hovedmålene med Rosetta@home er at forudsige proteinstrukturer med samme nøjagtighed som eksisterende metoder, men på en måde, der kræver væsentligt mindre tid og penge. Rosetta@home udvikler også metoder til at bestemme strukturen og docking af membranproteiner (f.eks. G-proteinkoblede receptorer (GPCR)), som er ekstremt vanskelige at analysere med traditionelle metoder som røntgenkrystallografi og NMR-spektroskopi, men som repræsenterer størstedelen af ​​målene for moderne lægemidler.

Fremskridt i forudsigelse af proteinstruktur måles i Critical Assessment for Protein Structure Prediction (CASP) halvårlige eksperiment, hvor forskere fra hele verden forsøger at udlede proteinstruktur fra aminosyresekvensen af ​​et protein. De højtydende grupper i dette til tider konkurrerende eksperiment betragtes som de facto-standarden for, hvad der er state of the art inden for forudsigelse af proteinstruktur. Rosetta, programmet som Rosetta @ home er baseret på, blev brugt med CASP5 i 2002. I 2004 CASP6-eksperimentet skrev Rosetta historie ved at være den første til at opnå nær-atomisk opløsning ab initio proteinstruktur forudsigelse i sin præsenterede model for CASP-målet T0281. Ab initio -modellering betragtes som en særlig udfordrende kategori af proteinstrukturforudsigelse, fordi den ikke bruger information fra strukturel homologi og skal stole på information fra sekvenshomologi og modellering af fysiske interaktioner inden for proteinet. Rosetta@home er blevet brugt i CASP siden 2006, hvor det var en af ​​de bedste forudsigere i alle strukturelle forudsigelseskategorier i CASP7. Disse forudsigelser af høj kvalitet blev drevet af computerkraft leveret af Rosetta@home-frivillige. Forøgelse af computerkraften gør det muligt for Rosetta@home at vælge flere regioner af konformationelt rum (mulige former, som et protein kan tage), som ifølge Levinthal's Paradox forudsiges at vokse eksponentielt med proteinlængde.

Rosetta@home bruges også til forudsigelse af protein-protein docking, som bestemmer strukturen af ​​flere komplekse proteiner eller kvaternær struktur. Denne type proteininteraktion påvirker mange cellulære funktioner, herunder antigen-antistof-binding og enzym-hæmmer-binding, samt import og eksport af celler. Bestemmelse af disse interaktioner er afgørende for lægemiddeludvikling. Rosetta bruges i Critical Interaction Prediction Evaluation-eksperimentet (CAPRI), som evaluerer tilstanden af ​​et proteins dockingfelt, svarende til hvordan CASP måler fremskridt i proteinstrukturforudsigelse. Den computerkraft, som de frivillige til Rosetta@home-projektet leverede, blev nævnt som en af ​​de vigtigste drivkræfter bag Rosettas præstationer på CAPRI, hvor dens docking-forudsigelser var blandt de mest nøjagtige og fuldstændige.

I begyndelsen af ​​2008 blev Rosetta brugt til beregningsmæssigt at designe et protein med en funktion, der ikke tidligere er set i naturen. Dette var delvist inspireret af en forkortelse af et berømt papir fra 2004, der oprindeligt beskrev beregningsdesignet af et protein med forbedret enzymatisk aktivitet i forhold til dets naturlige form. Et forskningspapir fra 2008 fra David Bakers gruppe, der beskriver, hvordan proteinet blev fremstillet, hvor Rosetta@home henviser til de beregningsressourcer, han stillede til rådighed, er et vigtigt bevis på konceptet for denne proteinteknologiske metode. Denne type proteindesign kan have fremtidige anvendelser til lægemiddelopdagelse, grøn kemi og bioremediering.

Sygdomsforskning

Alzheimers sygdom

En komponent i Rosetta-softwarepakken, RosettaDesign, er blevet brugt til nøjagtigt at forudsige, hvilke regioner af amyloidogene proteiner, der med størst sandsynlighed danner amyloidlignende fibriller. Ved at tage hexapeptider (seks aminosyrelange fragmenter) af et protein af interesse og vælge det laveste energimatch for en struktur svarende til den for et kendt fibrildannende hexapeptid, var RosettaDesign i stand til at identificere peptider dobbelt så tilbøjelige til at danne fibriller end tilfældige proteiner . Rosetta@home blev brugt i samme undersøgelse til at forudsige strukturer for beta-amyloid, et fibrildannende protein, der menes at forårsage Alzheimers sygdom. Der er opnået foreløbige, men endnu ikke offentliggjorte resultater for proteiner udviklet af Rosetta, der kan forhindre fibrildannelse, selvom det ikke vides, om dette kan forhindre sygdommen.

miltbrand

En anden komponent i Rosetta, RosettaDock, er blevet brugt i forbindelse med eksperimentelle metoder til at modellere interaktioner mellem tre proteiner - lethal faktor (LF), ødemfaktor (EF) og beskyttende antigen (PA) - der udgør miltbrandtoksin. Computermodellen forudsagde nøjagtigt dockingen mellem LF og PA, hvilket hjalp med at fastslå, hvilke domæner af de respektive proteiner, der er involveret i LF-PA-komplekset. Denne forståelse blev til sidst brugt i forskning, hvilket resulterede i forbedrede miltbrandvacciner.

Herpes simplex virus type 1

RosettaDock blev brugt til at modellere docking mellem et antistof (immunoglobulin G) og et overfladeprotein udtrykt af herpesvirus, herpes simplex virus 1 (HSV-1), som tjener til at nedbryde det antivirale antistof. Proteinkomplekset forudsagt af RosettaDock stemte nøje overens med særligt vanskeligt opnåelige eksperimentelle modeller, hvilket fik forskerne til at konkludere, at dockingmetoden kunne løse nogle af de problemer, som røntgenkrystallografi har ved modellering af protein-til-protein-grænseflader.

Gennem forskning finansieret af en 19,4 millioner dollars Bill & Melinda Gates-bevilling. USA, Rosetta@home er blevet brugt i udviklingen af ​​mange mulige humane immundefektvirus (HIV) vacciner.

Malaria

I forskning forbundet med Great Challenges in Global Health-initiativet er Rosetta blevet brugt til beregningsmæssigt at udvikle nye homing-endonukleaseproteiner, der kunne dræbe Anopheles gambiae eller på anden måde gøre myggen ude af stand til at overføre malaria. Evnen til specifikt at modellere og ændre protein-DNA-interaktioner, såsom dem for homing-endonukleaser, giver beregningsmæssige proteinteknologiske metoder såsom Rosetta en vigtig rolle i genterapi (som inkluderer potentielle kræftbehandlinger).

Antal deltagere

Baseret på de officielle statistikker fra Rosetta@Home [7] projektdeltagerne var antallet af aktive deltagere i oktober 2011 38 tusinde mennesker [8] . I juli 2017 havde projektet cirka 300.000 aktive brugere [9] .

Noter

  1. Ansøgninger . Hentet 14. marts 2016. Arkiveret fra originalen 14. marts 2016.
  2. Portfolio Highlight: Rosetta++ Software Suite  (engelsk)  (link ikke tilgængeligt) . UW TechTransfer – Digital Ventures. Hentet 7. september 2008. Arkiveret fra originalen 16. februar 2012.
  3. Rosetta@Home - Sygdomsforskning Arkiveret 2008-09-23.
  4. Rosettas vilkår for brug arkiveret 19. april 2014.
  5. Baker Lab Publications Arkiveret 24. november 2011.
  6. RCSB Protein Data Bank. FBF-statistikker : Strukturer, der kun indeholder protein, frigivet pr. år  . www.rcsb.org . Hentet 1. maj 2021. Arkiveret fra originalen 1. maj 2021.
  7. Rosetta@Home detaljerede statistikker . Hentet 15. februar 2017. Arkiveret fra originalen 15. februar 2017.
  8. BOINCstats | Rosetta@Home - Kreditoversigt (ikke tilgængeligt link) (7. oktober 2011). Hentet 27. september 2017. Arkiveret fra originalen 7. oktober 2011. 
  9. Rosetta@Home - Detaljeret statistik | BOINCstats/BAM! (utilgængeligt link) (11. juli 2017). Hentet 27. september 2017. Arkiveret fra originalen 11. juli 2017. 

Se også

Links