Gen ( anden græsk γένος - slægt ) - i klassisk genetik - en arvelig faktor, der bærer information om en bestemt egenskab eller funktion af kroppen, og som er en strukturel og funktionel enhed af arvelighed . Som sådan blev udtrykket "gen" introduceret i 1909 af den danske botaniker , plantefysiolog og genetiker Wilhelm Johannsen [1] .
Efter opdagelsen af nukleinsyrer som en bærer af arvelig information, ændrede definitionen af et gen sig, og genet begyndte at blive defineret som en del af DNA (i nogle vira , en del af RNA ), der specificerer sekvensen af monomerer i en polypeptid eller i funktionelt RNA [2] .
Med ophobningen af information om genernes struktur og arbejde fortsatte definitionen af begrebet "gen" med at ændre sig, men på nuværende tidspunkt er der ingen universel definition af et gen, der ville tilfredsstille alle forskere [3] [4] [4 ] [5] . En af de moderne definitioner af et gen er som følger: et gen er en sekvens af DNA, hvis bestanddele ikke behøver at være fysisk sammenhængende. Denne DNA-sekvens indeholder information om en eller flere fødevarer i form af et protein eller RNA. Genprodukter fungerer som en del af genetiske regulatoriske netværk, hvis resultat realiseres på fænotypeniveau [6] .
Helheden af en organismes gener udgør genotypen . Genotypen sammen med miljømæssige og udviklingsmæssige faktorer bestemmer, hvad fænotypen vil være . Overførsel af gener til afkom er grundlaget for nedarvningen af fænotypiske egenskaber. De fleste biologiske egenskaber er polygene, det vil sige, at de er påvirket af mange gener. Gener kan ændre sig som følge af mutationer , der ændrer DNA-sekvensen. På grund af mutationer i en population eksisterer gener i forskellige varianter, kaldet alleler . Forskellige alleler af et gen kan kode for forskellige versioner af et protein, som kan manifestere sig fænotypisk . Gener er sammen med dele af DNA, der ikke indeholder gener, en del af genomet , som er hele det arvelige materiale i en organisme.
Eksperimentelle beviser for tilstedeværelsen af diskrete arvelighedsfaktorer blev først præsenteret i 1865 af Gregor Mendel i en rapport på et møde i Society of Naturalists i Brno . I 1866 udkom rapporten i trykt form [7] . Gregor Mendel studerede nedarvningen af egenskaber i ærter ved kvantitativt at spore hyppigheden af egenskaber hos forældreplanter og afkom. I krydsninger af planter med forskellige egenskaber analyserede han mere end 8.000 planter. I disse eksperimenter demonstrerede Mendel den uafhængige nedarvning af egenskaber , sondringen mellem dominante og recessive egenskaber, sondringen mellem heterozygoter og homozygoter og fænomenet diskontinuerlig nedarvning . Resultaterne af hans eksperimenter beskrev han matematisk og fortolkede dem, idet han antog, at der er diskrete, ublandbare faktorer i afkommet, arvelighed.
Forud for Mendels arbejde var det dominerende koncept i forklaringen af arvemønstre at blande forældreegenskaber hos afkom på en måde analog med blanding af væsker. Dette koncept efterfølges af teorien om pangenese udviklet af Charles Darwin i 1868, to år efter offentliggørelsen af Mendels resultater [8] . I denne teori foreslog Darwin eksistensen af meget små partikler, som han kaldte "gemmules", som blandes under undfangelsen.
Mendels papir gik næsten ubemærket hen efter dets udgivelse i 1866, men det modtog en anden "fødsel" i slutningen af det 19. århundrede, takket være Hugo de Vries , Carl Correns og Erich von Tschermak , som kom til lignende konklusioner i deres egne undersøgelser [ 9] . Især udgav Hugo de Vries i 1889 sin bog "Intracellular Pangenesis" [10] , hvori han postulerede, at forskellige egenskaber har deres egne arvelige bærere, og at nedarvingen af specifikke egenskaber i organismer sker ved hjælp af partikler. De Vries kaldte disse enheder "pangens" (Pangens på tysk), ved at bruge en del af navnet på Darwins teori om pangenese .
I 1909 opfandt Wilhelm Johannsen udtrykket "gen" [1] og William Bateson opfandt udtrykket " genetik " [11] , mens Eduard Strasburger stadig brugte udtrykket "pangen" til at henvise til den grundlæggende fysiske og funktionelle enhed af arv [12] ] .
Eksperimenter udført i 40'erne af amerikanske bakteriologer fra Rockefeller Institute under ledelse af O. Avery viste, at DNA er det molekylære lager af genetisk information. I værker om genetisk transformation af pneumokokker blev det vist, at overførslen af egenskaber fra en bakterie til en anden sker ved hjælp af kun ét stof - DNA. Hverken protein eller andre kemiske komponenter i cellen havde denne egenskab [13] [14] [15] . I 1953 opnåede Rosalind Franklin og Maurice Wilkins billeder af høj kvalitet af DNA-strukturen ved hjælp af røntgenkrystallografi . Disse billeder hjalp James D. Watson og Francis Crick med at skabe en model af det dobbeltstrengede DNA-helix-molekyle og formulere hypotesen om mekanismen for genetisk replikation [16] [17] .
I begyndelsen af 1950'erne var den fremherskende opfattelse, at generne på et kromosom fungerede som separate enheder, uadskillelige gennem rekombination og arrangeret som perler på en snor. Eksperimenter udført af Seymour Benzer med mutanter , defekte bakteriofager i rII T4 -regionen (1955-1959), viste, at individuelle gener har en simpel lineær struktur og sandsynligvis svarer til det lineære tværsnit af DNA [18] [19] .
Tilsammen har denne forskning etableret det centrale dogme for molekylærbiologi , som går ud på, at proteiner oversættes fra RNA , som er transskriberet fra DNA . Dette dogme har siden vist sig at have undtagelser såsom revers transkription i retrovira . Den moderne undersøgelse af genetik på DNA-niveau er kendt som molekylær genetik .
I 1972 var Walter Fyers og hans team de første til at bestemme sekvensen af et gen: sekvensen af kappeproteinet fra Bacteriophage MS2[20] . Den efterfølgende udvikling af DNA-sekventering med Sanger-metoden i 1977 af Frederick Sanger forbedrede effektiviteten af sekventering og gjorde det til et rutinemæssigt laboratorieværktøj [21] . En automatiseret version af Sanger-metoden blev brugt i de tidlige stadier af Human Genome Project [22] .
Teorierne udviklet i det tidlige 20. århundrede for at integrere mendelsk genetik med darwinistisk evolution kaldes moderne syntese , et begreb opfundet af Julian Huxley [23] .
Evolutionsbiologer har efterfølgende modificeret dette koncept, såsom George Williams' - centrerede syn på evolution. Han foreslog det evolutionære begreb om genet som en enhed af naturlig udvælgelse, med definitionen: "det der adskiller og rekombinerer med mærkbar frekvens" [24] :24 . Fra dette synspunkt transskriberes det molekylære gen som en helhed, og det evolutionære gen nedarves som en helhed. Beslægtede ideer, der understreger genernes centrale rolle i evolutionen, er blevet populariseret af Richard Dawkins [25] [26] .
Genetisk information i langt de fleste organismer er kodet i lange DNA- molekyler . DNA består af to spiral snoede polymerkæder , hvis monomerer er fire nukleotider : dAMP, dGMP, dCMP og dTMP. Nukleotider i DNA består af et sukkerstof med fem kulstofatomer ( 2-deoxyribose ), en fosfatgruppe og en af de fire nitrogenholdige baser : adenin , cytosin , guanin og thymin [27] :2.1 . Den nitrogenholdige base er forbundet med en glykosidbinding til et 5-carbon (pentose) sukker i 1'-positionen. Rygraden i DNA-kæder er en alternerende sekvens af pentosesukkere og fosfater, fosfatgrupper er knyttet til sukkeret i 5'- og 3'-positionerne. Pentoseringens positionsnumre er markeret med et primtal for at skelne mellem nummereringen af ringene i sukkeret og den nitrogenholdige base [28] .
På grund af den kemiske sammensætning af pentoseresterne er DNA-strenge retningsbestemte. Den ene ende af DNA-polymeren indeholder en åben hydroxylgruppe på deoxyribose i 3'-positionen; denne ende kaldes 3'-enden. Den anden ende indeholder en åben fosfatgruppe , dette er 5'-enden. De to strenge af DNA-dobbelthelixen er orienteret i modsatte retninger. DNA-syntese, herunder DNA-replikation , sker i 5' → 3'-retningen, fordi nye nukleotider tilføjes via en dehydreringsreaktion, der bruger den blottede 3'-hydroxyl som nukleofil [29] :27.2 .
Ekspressionen af gener kodet i DNA begynder med transkriptionen af en DNA-nukleotidsekvens til en nukleotidsekvens af en anden type nukleinsyre- RNA . RNA ligner meget DNA, men dets monomerer indeholder ribose , ikke deoxyribose . Også uracil bruges i stedet for thymin i RNA . RNA-molekyler er enkeltstrengede og mindre stabile end DNA. Gener i DNA og efter transkription i tRNA er en naturlig chiffer (kode) for proteinsyntese. Hvert tre nukleotider (triplet) koder for én aminosyre. For eksempel, hvis et gen har 300 nukleotider, så skal et protein have 100 aminosyrer. Derfor kaldes koden triplet. Den regel, hvormed det bestemmes, hvilken triplet, der svarer til hvilken aminosyre, kaldes den genetiske kode . Aflæsningen af den genetiske kode sker i ribosomet under oversættelsen af RNA til protein . Den genetiske kode er næsten den samme for alle kendte organismer [27] :4.1 .
En organismes arvelige materiale, eller genom , er lagret på et eller flere kromosomer , hvis antal er specifikt for arten . Kromosomet består af et meget langt DNA-molekyle, som kan indeholde tusindvis af gener [27] :4.2 . Den region af kromosomet, hvor genet er placeret, kaldes locus . Hvert locus indeholder en specifik allel af et gen. Repræsentanter for en population kan være forskellige i allelerne af et gen placeret i de samme kromosomsteder.
De fleste eukaryote gener er lagret på flere lineære kromosomer. Kromosomer er pakket i kernen i kompleks med kromatinproteiner . De mest talrige kromatinproteiner er histoner , som danner en proteinkugle kaldet et nukleosom . DNA omslutter nukleosomer, som er det første niveau af DNA-pakning i et kromosom [27] :4.2 . Fordelingen af nukleosomer langs DNA, såvel som kemiske modifikationer af histonerne selv, regulerer tilgængeligheden af DNA for regulatoriske faktorer involveret i replikation, transkription, translation og reparation. Udover gener indeholder eukaryote kromosomer også servicesekvenser, der sikrer kromosomernes stabilitet og reproduktion, samt deres fordeling mellem datterceller i mitose. Disse er henholdsvis telomerer , replikationsinitieringssteder og centromerer [27] :4.2 .
Det er svært at afgøre præcis hvilken del af DNA-sekvensen et gen tilhører [5] .
Inden for molekylærbiologi er det blevet fastslået, at gener er dele af DNA , der bærer enhver integral information - om strukturen af et proteinmolekyle eller et RNA- molekyle , som bestemmer organismens udvikling, vækst og funktion .
Hvert gen er karakteriseret ved en række specifikke regulatoriske DNA-sekvenser .såsom promotorer , der er med til at regulere genets funktion. Regulatoriske sekvenser kan lokaliseres både i umiddelbar nærhed af den åbne læseramme, der koder for proteinet, eller begyndelsen af RNA-sekvensen, som i tilfældet med promotorer (de såkaldte cis -regulatoriske elementer , eng. cis-regulatoriske elementer ), og i en afstand af mange millioner basepar ( nukleotider ), som det er tilfældet med forstærkere , isolatorer og suppressorer (nogle gange klassificeret som trans -regulatoriske elementer , engelske trans-regulatoriske elementer ). Det vil sige, at begrebet et gen ikke er begrænset til den kodende region af DNA. Et gen er et bredere begreb, der omfatter regulatoriske sekvenser.
Oprindeligt optrådte udtrykket "gen" som en teoretisk enhed til overførsel af diskret arvelig information. Biologiens historie husker uenigheder om, hvilke molekyler der kan være bærere af arvelig information. Det blev antaget, at kun proteiner kan være sådanne bærere , da deres struktur (20 aminosyrer ) giver dig mulighed for at skabe flere muligheder end DNA , som kun består af fire typer nukleotider . Det er dog eksperimentelt bevist, at det er DNA, der indeholder arvelig information, hvilket blev udtrykt som molekylærbiologiens centrale dogme : DNA - RNA - protein.
Gener kan gennemgå mutationer - tilfældige eller målrettede ændringer i sekvensen af nukleotider i DNA -kæden . Mutationer kan føre til en ændring i sekvensen og derfor en ændring i de biologiske egenskaber af et protein eller RNA . Resultatet kan være ændret eller endda unormal funktion af kroppen. Sådanne mutationer er i nogle tilfælde patogene, da deres resultat er en sygdom eller dødelig på embryonalt niveau. Ikke alle ændringer i nukleotidsekvensen fører til en ændring i strukturen af proteinet (på grund af virkningen af degenerationen af den genetiske kode ) eller til en signifikant ændring i sekvensen og er ikke patogene. Især er det humane genom karakteriseret ved enkeltnukleotidpolymorfismer og kopiantal variationer , såsom deletioner og duplikationer , som udgør omkring 1 % af hele den humane nukleotidsekvens [31] . Enkeltnukleotidpolymorfier definerer især forskellige alleler af det samme gen.
DNA-replikation er for det meste ekstremt nøjagtig, men fejl ( mutationer ) forekommer [27] :7.6 . Fejlraten i eukaryote celler kan være så lav som 10 −8 pr. nukleotid pr. replikation [32] [33] , mens den for nogle RNA-vira kan være så høj som 10 −3 [34] . Det betyder, at hver person i genomet i hver generation akkumulerer 1-2 nye mutationer [34] . Små mutationer kan være forårsaget af DNA-replikation og konsekvenserne af DNA-skade og omfatter punktmutationer , hvor en enkelt base ændres, og frameshift-mutationer , hvor en enkelt base er indsat eller fjernet. Enhver af disse mutationer kan ændre genet for missense (ændre koden for kodning af en anden aminosyre) eller for nonsens (for tidlig stopkodon ) [35] . Store mutationer kan være forårsaget af fejl i rekombinationen for at forårsage kromosomale abnormiteter , herunder duplikering , deletion, omlejring eller inversion af store dele af kromosomet. Derudover kan DNA-reparationsmekanismer introducere mutationsfejl, når fysisk skade på molekylet genoprettes. Reparation, selv med mutation, er vigtigere for overlevelse end reparation af en nøjagtig kopi, for eksempel ved reparation af dobbeltstrengsbrud [27] :5.4 .
Når flere forskellige alleler af et gen er til stede i en population af en art , kaldes dette polymorfi . De fleste af de forskellige alleler er funktionelt ækvivalente, dog kan nogle alleler producere forskellige fænotypiske træk . Den mest almindelige allel af et gen kaldes vildtype , og sjældne alleler kaldes mutanter . Genetiske forskelle i de relative frekvenser af forskellige alleler i en population skyldes både naturlig selektion og genetisk drift [36] . Vildtype-allelen er ikke nødvendigvis en forfader til mindre almindelige alleler og er ikke nødvendigvis mere passende .
Størrelsen af genomet og antallet af gener, det indeholder, varierer meget blandt taksonomiske grupper. De mindste genomer findes i vira [37] og viroider (der fungerer som et enkelt ikke-kodende RNA-gen) [38] . Omvendt kan planter have meget store genomer [39] , hvor ris indeholder mere end 46.000 proteinkodende gener [40] . Det samlede antal proteinkodende gener ( Earth proteome ), som i 2007 blev anslået til 5 millioner sekvenser [41] , var i 2017 reduceret til 3,75 millioner [42] .
Genteknologi er en metode til at modificere genetisk materiale for at ændre egenskaberne af en levende organisme. Siden 1970'erne er der udviklet mange metoder specifikt til at tilføje, fjerne og redigere gener i vira, bakterier, planter, svampe og dyr, herunder mennesker [43] . Nyligt udviklede genomteknologiske teknikker bruger manipulerede nukleaseenzymer til at skabe en målrettet DNA-reparation på et kromosom for enten at forstyrre eller redigere et gen i processen med at reparere et kunstigt indført DNA-brud [44] [45] [46] [47] . Det beslægtede udtryk syntetisk biologi bruges nogle gange til at henvise til den brede disciplin af genmanipulation af en organisme [48] .
Genteknologi er nu et rutineværktøj til at arbejde med modelorganismer . For eksempel tilføjes gener nemt til bakterier [49] , mens linjerne " Knockout mus» mus med nedsat funktion af et bestemt gen bruges til at studere funktionen af dette gen [50] [51] . Mange organismer er blevet genetisk modificeret til anvendelser inden for landbrug, industriel bioteknologi og medicin .
Hos flercellede organismer modificeres embryonet sædvanligvis , som vokser til en voksen genetisk modificeret organisme [52] . Imidlertid kan genomerne af voksne celler redigeres ved hjælp af genterapimetoder til behandling af genetiske sygdomme.
![]() |
| |||
---|---|---|---|---|
|
Genetik | ||
---|---|---|
Nøglekoncepter | ||
Genetikfelter | ||
mønstre | ||
relaterede emner |