ChIP seq

ChIP-seq er en DNA - protein- interaktionsanalysemetode baseret på kromatin-immunpræcipitation (ChIP)  og high - throughput DNA- sekventering . Metoden blev udviklet til at studere histonmodifikationer i hele genomet [1] [2] , samt til at søge efter transkriptionsfaktorbindingssteder [3] . Tidligere var den mest populære metode til at etablere DNA-protein-interaktioner ChIP-on-chip , som kombinerer kromatin-immunpræcipitation med hybridisering på DNA-mikroarrays [4] .

Metode

Chromatin immunopræcipitation (ChIP)

Chromatin - immunpræcipitation  er en teknik, der bruges til den specifikke akkumulering af korte DNA-sekvenser forbundet med et protein af interesse i levende celler [5] . En typisk teknik omfatter følgende trin [5] :

Som et resultat vil alt DNA blive isoleret, men prøven vil blive beriget med fragmenter, som det undersøgte protein var forbundet med [5] .

Sekvensering

Dette trin indbefatter bestemmelse af den primære sekvens opnået efter immunpræcipitation af DNA-fragmenter ved enhver tilgængelig metode. I modsætning til ChIP-on-Chip bruger ChIP-seq næste generations sekventering til at bestemme DNA-sekvensen [6] . I ChIP-seq er single-ended sekventering mere almindeligt anvendt, men brugen af ​​double-ended sekventering øger nøjagtigheden af ​​kortlægning (hvilket er især vigtigt for gentagen mapping ) [7] . Resultatet er et sæt korte overlappende sekvenser (læser eller læser). Typisk er de originale DNA-fragmenter 150-500 bp lange. , og de resulterende læsninger har oftest en længde på 50 bp. [7]

Bioinformatik analyse

Bioinformatikanalyse omfatter følgende faser [5] :

For at filtrere de modtagne læsninger kan du bruge softwarepakkerne FastQC og FastX ToolKit [8] . Definitionen af ​​kvaliteten af ​​aflæsninger er baseret på Phred-kvalitetsscoren  - den vægt, der tildeles hvert nukleotid , når det aflæses. Softwarepakker som Gencore , FQStat , Picard og Cutadapt kan bruges til at evaluere og forbedre kvaliteten af ​​læsninger. Gencore fjerner dobbeltlæsninger og efterlader én konsensuslæsning. Dette resulterer i renere data end blot at fjerne dubletter. Picard er et sæt værktøjer, der giver dig mulighed for at arbejde med alternative formater: SAM / BAM / CRAM og VCF. FQStat er et selvstændigt, platformsuafhængigt softwarepakkeværktøj, der evaluerer kvaliteten af ​​FASTQ-filer ved hjælp af parallel programmering. Derudover vil Illumina levere en intern Illumina kyskhedsfilter læse kvalitetssikringsservice. For at forbedre kvaliteten af ​​læsninger kan "trimning" også være nyttigt - at afskære enderne af læsninger af lav kvalitet som følge af mismatch (en funktion ved næste generations sekvensering). Trimning udføres ved hjælp af Trimmomatic-programmet [9] . Kortlægning er bestemmelsen af, hvilken bestemt region og hvilket kromosom , der blev aflæst ved en given bestemt aflæsning. For at kortlægge læsninger til genomet kan softwarepakker som BWA , Bowtie , Bowtie 2 og GSNAP [6] bruges . Aflæsninger som følge af massiv parallel sekventering er normalt korte (100-200 nukleotider ), mens det gennemsnitlige eukaryote kromosom er omkring 100 millioner nukleotider. Kortlægning af aflæsninger til genomet er ikke altid en triviel opgave på grund af tilstedeværelsen af ​​et stort antal gentagelser i det eukaryote genom (for eksempel er LINE og SINE  gentagelser, der udgør 17 % og 11 % af den menneskelige DNA-sekvens ), og dermed kan gentagne aflæsninger kortlægges flere steder på én gang. Normalt er unikt kortlagte læsninger tilstrækkelige til analyse (for eksempel transkriptionsfaktorer ), men i nogle tilfælde er læsninger kortlagt til flere regioner også inkluderet i analysen [7] . Som et alternativ, for at korrigere for signalet tabt i dårligt kortlagte områder, kan kortlægning bruges, en indikator, der afhænger af forskellige eksperimentelle og analyseparametre, herunder længden af ​​aflæsninger og programmer, der bruges til databehandling [10] . SAMTools [11] [6] softwarepakken kan bruges til filtrering . Efter kortlægning bliver det muligt at bestemme bindingsstederne for det undersøgte protein i genomet ved antallet af læsninger, der er kortlagt til dette sted (hvis der er mange, var proteinet der) [6] . Sættet af aflæsninger opnået som et resultat af immunfældning kan være mislykket til yderligere analyse på grund af utilstrækkelig sekventeringsdybde, dårligt valg af størrelsen af ​​de fragmenter, hvori DNA'et blev spaltet under immunpræcipitation, eller utilstrækkelig repræsentation af fragmenterne forbundet med proteinet under undersøgelse i blandingen opnået efter immunpræcipitation (dårlige antistoffer osv.) . P.). For at bestemme alt ovenstående bruges CHANCE [8] softwarepakken . Efter at have kortlagt aflæsningerne til genomet for at identificere bindingssteder (regioner), vurderes først dækningsniveauet. Dernæst identificeres toppene (områder med stor dækning, hvor det undersøgte protein sandsynligvis var bundet), støjen adskilles, og toppenes grænser bestemmes. Det er vigtigt at opretholde en balance mellem sensitivitet og specificitet [8] . Nogle af de softwarepakker, der kan bruges til at løse dette problem, er SPP , PeakSeq [10] , MACS , MACS 2, UGENE [6] . Resultatet af arbejdet med disse programmer er en liste over regioner, rangeret enten efter størrelsen af ​​det absolutte signal (det vil sige antallet af læsninger) eller efter betydningen af ​​berigelse (for eksempel efter p-værdi eller FDR ). Valget af den passende metode afhænger af arten og proteinet, der undersøges, og de eksperimentelle forhold. Forskellige programmer bruger forskellige antagelser og antagelser til at beregne p-værdi og FDR. For eksempel bruger SPP og den originale version af MACS kun data fra ChIP-Seq-eksperimentet og kontrol (hvis tilgængeligt), mens MOSAiCS tager højde for kortbarhedsscore og GC-sammensætning . Derfor er det ret svært at sammenligne resultaterne af forskellige peak calling algoritmer. Mange algoritme matchende papirer bruger validering af antallet af fundne toppe ved hjælp af data fra ChIP-on-Chip, qPCR , osv. eksperimenter [12] [13] [14] . Situationen kompliceres også af den dårlige annotering af sande bindingssteder, så når man leder efter toppe for et protein med et ukendt bindingssted, skal der bruges negative kontroller [7] . Formålet med annotationen er at etablere en forbindelse mellem bindingsstedet og den funktionelle DNA-region, hvorpå bindingsstedet er landet. Et sådant funktionelt sted kan være en promotor , et transkriptionsstartsted , et intergent sted osv. [6] . Skæringen af ​​de forudsagte bindingssteder med funktionelle DNA-elementer kan analyseres visuelt i en af ​​de genomiske browsere ; du kan også få en kommenteret tekstfil ved hjælp af Diffbind , CEAS eller ChIPpeakAnno [8] . I de opnåede toppe (længde af størrelsesordenen hundreder af nukleotider) er det nogle gange muligt at identificere karakteristiske sekvenser, langs hvilke proteinbinding forekommer - motiver (sædvanligvis ca. 20 nukleotider lange). For at søge efter motiver kan du bruge MEME- algoritmen , Gibbs sampler [8] , ChIPMunk . Hvis bindingsmotivet allerede er kendt for det undersøgte protein, kan dets tilstedeværelse i toppene tjene som en god indikator for kvaliteten af ​​ChIP-seq [8] .

Metodens kendetegn

Ved design af ChIP-seq-eksperimentet og yderligere bioinformatisk analyse er det nødvendigt at tage højde for nogle faktorer og begrænsninger af teknikken [7] :

Uregelmæssig fragmentering og kontrol

Tilgængeligheden af ​​chromatin under fragmentering er ikke den samme i forskellige dele af genomet: det er mere tilgængeligt i aktivt transskriberede regioner, så de tilsvarende DNA-fragmenter vil dominere i prøven, hvilket kan føre til et falsk positivt resultat. I modsætning hertil kan tætpakkede områder være mindre modtagelige for fragmentering og derfor være mindre repræsenteret i prøven, hvilket kan føre til et falsk negativt resultat [7] .

På grund af ujævn fragmentering og andre faktorer er det vigtigt at bruge den rigtige kontrol. ENCODE- konsortiet beskriver to hovedtyper af kontroller [15] . I den første variant bruges DNA isoleret fra celler under samme betingelser, men uden udfældning, som kontrol (den såkaldte input-DNA-kontrol). I den anden type udføres endnu et ChIP-eksperiment med antistoffer, der binder ubetydelige ekstranukleære antigener (den såkaldte "IgG-kontrol"). I begge tilfælde bør dybden af ​​sekventering ikke være mindre end dybden af ​​ChIP-seq eksperimentet [15] .

Antal celler

Den klassiske teknik har en række begrænsninger. Således kræver ChIP normalt et betydeligt antal celler (ca. 10 millioner), hvilket gør det vanskeligt at anvende denne metode på små modelorganismer , og begrænser også antallet af eksperimenter, der kan udføres med en værdifuld prøve. For at overvinde denne begrænsning er der udviklet en række metoder baseret på DNA-amplifikation efter ChIP-seq (f.eks. nano-ChIP-seq). ChIP-seq af enkeltceller ( eng.  Single-cell ChIP-seq ) er meget kompleks på grund af baggrundsstøj forårsaget af ikke-specifik binding af antistoffer, og i midten af ​​det andet årti af det 21. århundrede blev der kun udgivet ét værk hvor Single-cell ChIP-seq blev udført med succes. Denne undersøgelse brugte dråbemikrofluidik, og på grund af lav dækning skulle tusindvis af celler sekventeres for at afsløre cellulær heterogenitet [16] .

Signal-til-støj-forhold

Signal-støjforholdet (S/N) bestemmes af antallet og effekten af ​​de opnåede toppe for hver prøve og kan bruges til at estimere støjniveauet. En høj S/N-værdi garanterer ikke den korrekte bestemmelse af bindingssteder, men afspejler kun tilstedeværelsen af ​​et stort antal genomregioner, hvortil mange aflæsninger er blevet kortlagt [7] . For at bestemme denne indikator tilbyder ENCODE to metrics [15] :

Sekvenseringsdybde

Sekvenseringsdybde (dækning) er antallet af unikke læsninger, der er kortlagt til en given region af referencegenomet. Dybden af ​​sekventering påvirker påvisningen af ​​toppe: deres antal stiger med stigende dybde af sekventering, da med en stigning i antallet af læsninger bliver et større antal steder statistisk signifikante [17] . Derfor kræves dyb sekventering for at genkende alle funktionelle steder [7] .

Værdien af ​​et tilstrækkeligt dækningsniveau afhænger af antistoffets signal-til-støj-forhold og kan defineres som den sekventeringsdybde, hvor forholdet mellem antallet af toppe fra en tilfældig delmængde af aflæsninger og antallet af toppe fra hele sæt af læsninger når et plateau. En sådan mætning opnås muligvis ikke altid (for eksempel eksisterer den ikke for histoner ), og i sådanne tilfælde er denne værdi sat empirisk [7] .

Bibliotekets kompleksitet

Bibliotekskompleksitet (NRF) er defineret som forholdet mellem antallet af ikke-berigede læsninger N ikke -røde og det samlede antal kortlagte læsninger N alle . Uberigede læsninger defineres som læsninger kortlagt til den samme region af genomet T gange eller mindre (værdien af ​​T er angivet som en parameter). Berigede læsninger (læser ikke inkluderet i N nonred ) tages ikke i betragtning i yderligere analyse. For et menneske tages parameteren T normalt lig med 1, da den forventede sekventeringsdybde i dette tilfælde normalt er meget mindre end én. For små genomer kan sekventeringsdybden være større end 1, så det er værd at tage en større T-værdi. Når man sammenligner NRF for forskellige prøver, er det værd at huske på, at det afhænger af det samlede antal kortlagte læsninger [7] .

NRF falder, når dybden af ​​bibliotekssekventeringen øges. Dette vil til sidst nå et punkt, hvor kompleksiteten vil være maksimal, og sekventeringen af ​​de samme DNA-fragmenter amplificeret ved PCR vil finde sted . Lav bibliotekskompleksitet kan for eksempel forekomme, hvis meget lidt DNA frigives under immunpræcipitation [15] .

Følsomhed

Følsomheden af ​​teknologien afhænger af dybden af ​​sekventering, længden af ​​genomet og andre faktorer. For pattedyrs transkriptionsfaktorer og enhancer-associerede kromatinmodifikationer, som normalt er lokaliseret til specifikke smalle steder og har i størrelsesordenen tusinde bindingssteder, vil omkring 20 millioner læsninger være tilstrækkelige [6] . Proteiner med et stort antal bindingssteder ( RNA-polymerase III ) kræver op til 60 millioner aflæsninger [6] . I tilfælde af orme- eller fluetransskriptionsfaktorer er der behov for cirka 4 millioner aflæsninger [6] . Omkostningerne ved sekventering af fragmenterne opnået efter immunpræcipitation korrelerer direkte med dybden af ​​sekventering. Hvis det er nødvendigt med høj følsomhed at vise bindingsstederne for proteiner, der ofte findes i et stort genom, vil det være nødvendigt med høje omkostninger, da et stort antal aflæsninger vil være nødvendige. Dette adskiller denne metode fra ChIP-on-Chip, hvor følsomhed ikke er relateret til analysens omkostninger [6] .

En anden forskel fra ChIP-metoder baseret på DNA-mikroarrays er, at nøjagtigheden af ​​ChIP-seq ikke er begrænset af afstanden mellem givne prober. Ved at integrere et stort antal korte læsninger kan lokalisering af bindingssteder med høj nøjagtighed opnås. Sammenlignet med ChIP-on-Chip-metoder kan ChIP-seq-data bruges til at lokalisere det faktiske proteinbindingssted inden for 10 af nukleotider. Aflæst tæthed ved bindingssteder er en god indikator for protein-DNA-bindingsstyrke, hvilket gør det lettere at kvantificere og sammenligne proteinaffinitet for forskellige steder [18] .

Nøjagtighed og specificitet

Længden af ​​et typisk proteinbindingssted er 6-20 nukleotider, og længden af ​​de opnåede fragmenter efter ChIP er omkring 200, hvilket gør bestemmelsen af ​​bindingsstedet ikke særlig nøjagtig. Derudover kan de resulterende biblioteker ofte indeholde DNA-regioner, der ikke er forbundet med det undersøgte protein, hvilket fører til fejl i resultaterne. Der er forskellige modifikationer af metoden, der har til formål at forbedre nøjagtigheden (for eksempel ChIP-exo). Kvaliteten af ​​ChIP-seq-eksperimentet afhænger også direkte af antistoffernes specificitet og graden af ​​prøveberigelse på stadium af immunpræcipitation. Hovedproblemerne kan være antistoffets lave reaktivitet mod det ønskede protein og/eller krydsreaktivitet med andre proteiner. ENCODE-konsortiet tilbyder flere metoder til at vurdere specificiteten af ​​antistoffer [15] .

En epitop kan også fusioneres til proteinet af interesse for at udføre immunpræcipitation . Denne metode løser begge problemer, der opstår under antistof-immunpræcipitation, men i dette tilfælde kan det vedhæftede tag påvirke proteinet under undersøgelse (for eksempel ændre dets ekspressionsniveau eller bindingsevne) [15] .

Alternative metoder

ChIP-on-chip

ChIP-on-chip , der kombinerer kromatin-immunpræcipitation med hybridisering på DNA-mikroarrays [4] , var tidligere den mest populære metode til at etablere DNA-protein-interaktioner. Chip-seq og ChIP-on-chip er de to mest anvendte tilgange i genom-dækkende undersøgelser af DNA-protein-interaktioner in vivo. En mere detaljeret sammenligning af disse metoder viser imidlertid betydelige fordele ved Chip-seq [4] . Sammenligning af Chip-seq og ChIP-on-Chip metoder er præsenteret i tabellen [4] :

Indeks ChIP seq Chip-på-Chip
Mængden af ​​originalt DNA mindre end 10 ng 4 mcg
Metodefleksibilitet ja: genom-dækkende analyse af enhver sekventeret organisme der er begrænsninger: tilgængeligheden af ​​DNA-mikroarrays
Nøjagtigheden af ​​at bestemme positionen af ​​bindingsstedet +/- 50 mdr +/- 500 − 1000 md
Følsomhed variabel: ved at øge antallet af aflæsninger kan du øge følsomheden svag: afhænger af kvaliteten af ​​hybridisering
Krydshybridisering (hybridisering af enkeltstrenget DNA med en probe, der er delvist komplementær til det) udelukket: hvert DNA-molekyle sekventeres separat kan være væsentligt, hvilket i høj grad reducerer analysens nøjagtighed

DamID

DamID (DNA-adenin-methyltransferase-identifikation) tillader kortlægning af steder for DNA-protein-interaktioner i eukaryote celler. For at gøre dette udtrykker celler et kimært protein , bestående af proteinet af interesse og E. coli adenin methyltransferase (Dam) DNA , som methylerer adeniner ved GATC-sekvensen. I de fleste eukaryoter forekommer endogen adenin-methylering på GATC-steder ikke. Når et Dam-fusionsprotein af interesse binder til DNA eller andre DNA-associerede proteiner, methylerer Dam adeninrester i DNA'et, der omgiver bindingsstedet, og denne metode tillader således mærkning af interaktionssteder for målproteinet med DNA og DNA-associeret proteiner. For at identificere sekvenser methyleret af et kimært protein amplificeres methylerede fragmenter selektivt og hybridiseres på mikroarrays [19] .

Selektiv amplifikation af methylerede DNA-fragmenter er baseret på en speciel PCR-protokol. Først skæres DNA'et, der er methyleret ved GATC-stederne, mellem GAm- og TC-nukleotiderne af restriktionsenzymet Dpnl . Spaltning med Dpnl fører til dannelsen af ​​DNA-fragmenter med stumpe ender 5' TC og 3' GA m . Derefter ligeres dobbeltstrengede adaptere til de opnåede fragmenter. Ligeringsprodukterne spaltes derefter med restriktionsendonukleasen DpnII . DpnII skærer DNA'et ved umethylerede GATC-steder, således at kun fragmenter flankeret af konsekutivt methylerede GATC-steder (dvs. steder, mellem hvilke der ikke forekommer umethylerede GATC-steder) efterfølgende amplificeres. Derefter udføres PCR med primere, der er komplementære til adapterne, og således amplificeres genomiske fragmenter med methylerede GATC-steder ved kanterne specifikt [20] .

Metodeændringer

Siden opfindelsen af ​​ChIP-Seq er mange modifikationer af denne metode blevet opfundet, som gør det muligt at udføre en eller anden delopgave mere effektivt.

ChIA-PET

Denne metode bruges til at bestemme vekselvirkningerne mellem kromatinregioner placeret i betydelig afstand fra hinanden i genomet [21] . ChIA-PET er baseret på teorien om proksimal ligering ( proximity ligation), som siger, at enderne af kromatinregionerne forbundet med proteinkomplekset, som er i nærheden, vil blive ligeret til hinanden med større sandsynlighed end enderne af regioner, der er i opløsning eller forbundet med et andet proteinkompleks.

PLAC seq

Der er mange metoder til at studere lang rækkevidde interaktioner af kromatin, men de kræver et stort antal celler til analyse. For at overvinde denne begrænsning blev PLAC-seq (Proximity Ligation-Assisted ChIP-seq) metoden udviklet, hvor tværbindingen af ​​sammenhængende regioner udføres i kernen før kromatinfragmentering og immunpræcipitation. PLAC-seq demonstrerer overlegen nøjagtighed, ydeevne og reproducerbarhed sammenlignet med ChIA-PET ved bestemmelse af lang række kontakter i pattedyrceller [22] .

Nano-ChIP seq

Nano - ChIP-seq- metoden er baseret på det faktum, at det DNA, der isoleres under ChIP-eksperimentet, amplificeres ved PCR og derefter sekventeres [23] . Dette gør det muligt at udføre analyser på et lille antal celler, typisk omkring 10.000. Et tilstrækkeligt antal celler afhænger dog af mange faktorer, såsom effektiviteten af ​​antistoffer og berigelsen af ​​prøven med målproteinet, så i nogle tilfælde kan der være behov for mere end 10 tusinde celler [23] .

ChIP-exo og ChIP-nexus

ChIP -exo -metoden  er en modifikation af ChIP-seq-protokollen, der forbedrer opløsningen af ​​fundne bindingssteder fra hundredvis af basepar til næsten et nukleotid. ChIP-exo bruger λ-exonuclease til at fjerne kontaminerende DNA og 5'-enderne af DNA-fragmenter knyttet til målproteinet op til en position i en bestemt afstand fra proteinbindingsstedet [24] . Da DNA-fragmenterne af begge strenge dannes som et resultat af ChIP-eksperimentet, kortlægges de justerede 5'-ender til to positioner i genomet, mellem hvilke proteinbindingsstedet er placeret. Gæreksperimenter har vist, at ChIP-exo tillader identifikation af bindingssteder med nukleotidnøjagtighed og 40 gange højere signal-til-støj-forhold sammenlignet med ChIP-seq og ChIP-on-Chip [24] .

En modifikation af ChIP-exo-protokollen er ChIP-nexus- protokollen [25] (ChIP-eksperimenter med nukleotidopløsning gennem exonuklease, unik stregkode og enkelt ligering). I denne protokol ligeres specielle adaptere til DNA, som indeholder et par sekvenser til biblioteksforstærkning, et BamHI -restriktionsenzymsted og en randomiseret stregkode , der tillader sporing af overamplifikation af fragmenter. Som i ChIP-exo protokollen udføres behandling med λ-exonuklease, som spalter DNA'et fra 5'-enden til en fysisk hindring i form af et DNA-bundet protein. Derefter udføres intramolekylær cirkularisering af DNA og derefter relinearisering ved behandling med BamHI -restriktionsenzym [25] . Ved kanterne af fragmentet af interesse er der således sekvenser til amplifikation. Dette yderligere trin forbedrer effektiviteten af ​​at inkorporere DNA-fragmenter i biblioteket [25] .

Konkurrence-ChIP

Competition-ChIP  er en modifikation af ChIP-seq-protokollen, der bruges til at måle den relative dynamik af transkriptionsfaktorbinding til DNA [26] . Ideen med metoden er baseret på udtrykket af to kopier af den undersøgte transkriptionsfaktor med forskellige epitopmærker . En af disse kopier er udtrykt på permanent basis, og udtrykket af den anden, der fungerer som en konkurrent, er inducerbar. Forholdet mellem isoformer forbundet med visse loci bestemmes ved hjælp af enten ChIP-seq eller ChIP-on-chip. Den hastighed, hvormed en konstitutivt udtrykt form erstattes af en inducerbar, gør det muligt at beregne opholdstiden for den undersøgte faktor på hvert bindingssted.

CLIP seq

CLIP-seq (også kendt som HITS-CLIP  - high-throughput sekventering af RNA isoleret ved tværbinding af immunpræcipitation) er en metode til at studere RNA-protein-interaktioner og RNA-modifikationer in vivo [27] .

DRIP-seq og DRIVE-seq

R-løkker er trestrengede strukturer dannet af forskudt enkeltstrenget DNA (ssDNA) og en RNA-ssDNA- dupleks . In vivo tegner de sig for cirka 5-8% af genomet. Gennem reguleringen af ​​bindingen af ​​forskellige proteiner er R-loops involveret i mange cellulære processer, såsom for eksempel differentieringen af ​​embryonale stamceller [28] . For at studere R-loops blev DRIP-seq (DNA:RNA ImmunoPrecipitation and sequencing) metoden udviklet, som i det væsentlige minder meget om ChIP-Seq, men er baseret på brugen af ​​antistoffer, der er specifikke for R-loops [29 ] . En anden måde at studere R-loops på er DRIVE-seq (DNA:RNA In Vitro Enrichment and Sequencing) metoden, som bruger inaktiveret MBP-RNASEH1 endonuklease i stedet for antistoffer [29] . DRIVE-seq kan bruges til at forfine forudsigelser lavet med DRIP-seq. Begge metoder gør det muligt nøjagtigt og praktisk at kvantificere antallet af R-løkker. For første gang blev DRIP-seq brugt til at studere R-loops i det humane genom: det blev vist, at et stort antal af dem er indeholdt i CpG-øer promotorer [29] .

CETCh-seq

CETCh-seq-metoden blev designet til at overvinde et sådant teknisk problem som tilgængeligheden af ​​antistoffer, der er egnede til ChIP-seq-eksperimenter, når man studerer DNA-protein-interaktioner. Ved hjælp af genomisk redigering ved hjælp af CRISPR/Cas9 føjes en epitop til proteiner af interesse, såsom transkriptionsfaktorer, for yderligere genkendelse af egnede antistoffer [30] .

CUT&RUN

CUT&RUN  er en modifikation af ChIP-seq, der giver dig mulighed for at øge signal-til-støj-forholdet markant. Effekten opnås ved brug af mikrokoknuklease , fusioneret med protein A , på stadiet af immunpræcipitation [31] .

CUT&Tag

CUT&Tag  er en metode, der ligner CUT&RUN, menTn5 transposase bruges i stedet for mikrokoknuklease . Fordelen ved denne metode frem for CUT&RUN er, at den ikke kræver cellelyse og kromatinfraktionering [32] .

Ansøgning

ChIP-seq er i princippet anvendelig til alle proteiner, der udfældes under kromatin-immunpræcipitation. Et typisk eksempel på anvendelsen af ​​ChIP-seq-metoden er bestemmelsen af ​​bindingssteder for transkriptionsfaktorer, DNA-polymerase , strukturelle proteiner, samt histonmodifikationer og kromatinstruktur [6] . Som et alternativ til ChIP-seq er der udviklet en række ikke-immunpræcipitationsmetoder ( DNase-Seq og FAIRE-Seq ) til at påvise nukleosomfrie DNA - regioner [6] .

Søg efter motiver

Et af hovedmålene med ChIP-seq-eksperimenter er at søge efter DNA-sekvensmotiver til proteinbinding. DNA-regioner, der fysisk er i kontakt med transkriptionsfaktorer og andre proteiner, kan isoleres ved kromatin-immunpræcipitation. Under eksperimentet opnås et sæt DNA-fragmenter forbundet med det undersøgte protein in vivo . Yderligere analyse inkluderer brugen af ​​massiv parallel sekventering og hele genom-databaser til at bestemme positionen af ​​bindingssteder i genomet [6] . Det mest udbredte motivdetektionsværktøj er MEME (Multiple EM for Motif Elicitation) algoritmen. Ofte kan mange motiver findes baseret på et enkelt datasæt, og motivanalyse kan udføres selv på ChIP-seq-data af lav kvalitet, men betydningen og pålideligheden af ​​sådanne motiver vil være lavere [33] .

Find steder med biologisk funktion

Data fra ChIP-seq eksperimenter bruges ofte til at identificere regulatoriske regioner for et sted af interesse [15] . Især er ChIP-seq meget brugt til at studere bakterielle reguloner [34] . For at gøre dette, efter at have fundet bindingsstederne, søges der efter formodede regulerede gener [34] .

Differentialanalyse

Forskelle mellem ChIP-Seq-profiler under forskellige forhold bestemmes efter at have kaldt peaks. Toppene opnået i forskellige eksperimenter slås derefter sammen til en liste. For yderligere at identificere kandidatsteder bruges ofte programmer til differentiel genekspressionsanalyse , såsom DESeq2 [35] og edgeR [36] . Disse programmer er i stand til at udføre differentiel analyse ved at behandle lister over resulterende toppe som lister over "gener". Der er også programmer designet specifikt til differentiel analyse af ChIP-Seq data (f.eks. DiffBind [37] , ChIPComp [38] , DBChIP [39] ), som arbejder efter et lignende princip. Mange andre programmer (for eksempel PePr [40] ) bruger modeller, der ikke kræver det foreløbige kald af peaks [40] .

Undersøgelse af kromatins tilstand

DNA-methylering og histonmodifikationer undergår stærke ændringer under udviklingsovergange og i sygdomme som cancer, og yder således et stort bidrag til kromatins dynamiske natur. Forskellige histonmodifikationer undersøges ved hjælp af specifikke antistoffer for at opnå en profil af histonmærker i prøven. I deres egne eksperimenter tester ENCODE-konsortiet omhyggeligt specificiteten af ​​de antistoffer, der anvendes på en række forskelligt modificerede histonterminale peptider. Fælles cellekilder bliver også brugt og profileret og sammenlignet for at sikre sammenhæng mellem forsøgene. Nuværende retningslinjer fra ENCODE-konsortiet dækker antistofvalidering, eksperimentel reproducerbarhed, sekventeringsdybde, datakvalitetsanalyse og offentliggørelse af data og metadata [33] [41] .

Analyse af allel ubalance

Af stigende interesse er analysen af ​​ChIP-Seq-data med en intern kontrol for en anden allel for at identificere allel ubalance [42] . Samtidig bruges data opnået fra ChIP-Seq-eksperimentet til at søge efter forholdet mellem biologiske signaler og enkeltnukleotidpolymorfismer (SNP'er) [42] . Denne analyse omfatter tre faser [43] :

  1. justering af læsninger, det vil sige at bestemme positionen i genomet og allelen for hver læsning,
  2. tælle antallet af pålideligt kortlagte læsninger for hver SNP for hver allel,
  3. rangordning af mulige SNP'er og statistisk vurdering af allel ubalance.

For de første to faser er den korrekte strategi for kortlægning af læsninger til referencegenomet vigtig, da det er nødvendigt at skelne sekventeringsfejl fra rigtige alleler. Til tredje fase er der udviklet flere programmer ved hjælp af forskellige statistiske test, såsom AlleleDB [44] , NPBin [42] og WASP [45] .

Databaser

Genomet af flercellede organismer er ekstremt komplekst, og det er ikke helt klart i detaljer, hvordan implementeringen af ​​arvelig information foregår. En detaljeret forståelse af genomets funktion kræver en komplet liste over funktionelle elementer og en beskrivelse af, hvordan de fungerer over tid og i forskellige celletyper. I et forsøg på at løse dette problem blev projekterne ENCODE og modENCODE [46] oprettet . Ud over ChIP-seq-resultater integrerer ENCODE og modENCODE data fra analyser såsom 5C og ChIA-PET for at bestemme kromosomkonformation; DNase-seq og FAIRE-Seq til at identificere nukleosomfrie regioner; bisulfit-sekventering og Infinium Methylation Assay for at bestemme tilstedeværelsen af ​​methylcytosiner i DNA, RT-PCR og RNA-sekventering for at bestemme niveauet af genekspression, samt CLIP-seq og RIP-seq for at identificere RNA- protein interaktioner [46] .

Fra det andet årti af det 21. århundrede er der en række databaser, der indeholder resultaterne af ChIP-seq eksperimenter og deres analyse:

Forskning

Eukaryoter

Et eksempel på den vellykkede brug af ChIP-seq til at studere eukaryoter er studiet af promotorers nukleosomarkitektur . Ved hjælp af ChIP-seq var det muligt at fastslå, at gær kan have nukleosomfrie promotorregioner (ca. 150 bp lange), hvorfra RNA-polymerase kan initiere transkription [60] . Denne metode er også blevet anvendt med succes til at søge efter bindingssteder for 22 transkriptionsfaktorer i genomet af nematoden C. elegans . For 20% af alle annoterede gener i nematode-genomet blev de transkriptionsfaktorer, der regulerer dem, bestemt [61] .

ChIP-seq er også meget brugt til at studere histonmodifikationer. Der kendes mere end 100 histonmodifikationer [62] [63] . For eksempel er det kendt, at acetylering, især acetyleringen af ​​lysin 9 af histon H3 (H3K9Ac), sædvanligvis er forbundet med åbne og tilgængelige områder af kromatin ( euchromatin ). Samtidig kan histonmethylering være forbundet med både åbne og tætpakkede områder af kromatin ( heterochromatin ). Især mono- og trimethylering af lysin 4 af histon H3 (H3K4me1 eller H3K4me3) er normalt forbundet med åben kromatin, og hvert af disse mærker repræsenterer en særlig kategori af åben kromatin: H3K4me3 markerer promotorregioner, H3K4me1 markerer transkriptionelle forstærkere, H3K36me36me36me transskriberede områder af genomet. Trimethylering af lysin 9 og 27 af histon H3 (H3K9me3 og H3K27me3) er tværtimod forbundet med kromatinkomprimering og som følge heraf genundertrykkelse . H3K9me3 og H3K27me3 regulerer forskellige typer gener: H3K27me3 undertrykker overvejende homeobox -transskriptionsfaktorer, mens H3K9me3-målgener overvejende er zinkfinger-transskriptionsfaktorer [64 ] . Forskellige kombinationer af histonmærker kan give endnu mere detaljerede oplysninger: for eksempel kan tilstedeværelsen af ​​to mærker H3K4me3 (euchromatin-mærker) og H3K9me3 (heterochromatin-mærker) på promotoren være en identifikator af indprintede gener [65] .

Prokaryoter

Hos bakterier udføres reguleringen af ​​genekspression på transskriptionsniveau ved hjælp af transkriptionsfaktorer [66] . ChIP-seq-metoden kan bruges til at identificere bindingssteder for sådanne transkriptionsfaktorer. Nogle bakterielle transkriptionsfaktorer har flere bindingssteder i promotoren (dvs. steder mindre end 100 bp fra hinanden) [67] . De fleste peak-søgealgoritmer identificerer så tæt placerede websteder som én. For at løse dette problem anvendes såkaldte peak deconvolution algoritmer, for eksempel CSDeconv [68] , GEM [69] , PICS [70] eller dPeak [71] .

Det næste trin efter bestemmelse af bindingsstederne er at bestemme de regulerede gener. Normalt udføres associationen af ​​fundne toppe med gener algoritmisk ved at søge efter nærliggende transkriptionsstartsteder (TSS). Men i tilfælde af bakterier (inklusive E. coli ) kan TSS muligvis ikke bestemmes for mange gener, så i stedet for TSS kan man kigge efter nærliggende translationsstartsteder, manuelt undersøge toppens genomiske miljø eller bruge genekspression data (sammenlign f.eks. vildtype regulonekspression) og i tilfælde af deletion af den undersøgte transkriptionsfaktor baseret på RNA-seq data) [34] .

Udsigter for udvikling

Nuværende fremskridt i ChIP-seq-metoden tillader allerede analyse af prøver, der indeholder langt færre celler, hvilket i høj grad udvider dens anvendelighed på områder som embryologi og udviklingsbiologi, hvor det er for dyrt eller vanskeligt at opnå store prøver. Metoden har helt sikkert potentialet til at påvise mutationer i bindingssteder, der påvirker proteinbinding og regulering af genekspression [6] .

Det bliver dog klart, at ChIP-seq-problemer kræver nye eksperimentelle, statistiske og beregningsmæssige løsninger. Det er nødvendigt at reducere antallet af artefakter og falsk-positive resultater, samt lære at skelne de individuelle effekter af de undersøgte fænomener fra kontekstafhængige. Vigtige nye udviklinger er relateret til opdagelsen og analysen af ​​distale (placeret i betydelig afstand fra genet) regulatoriske regioner. Ved anvendelse af ChIP-seq vil det muligvis være muligt at bestemme indirekte DNA-binding, for eksempel gennem yderligere proteiner eller proteinkomplekser, da de forudsagte steder kan være funktionelle uanset tilstedeværelsen af ​​et specifikt motiv. Endelig skal yderligere information (såsom ekspressionsniveau eller kromatinkonformationsdata) bruges til at skelne faktisk funktionalitet, da DNA-binding ikke nødvendigvis indebærer en specifik funktion [18] .

En lovende retning er integrationen af ​​data opnået fra et stort antal eksperimenter for at løse og analysere komplekse interaktioner. Forskellige maskinlæringsmetoder bruges ofte til dette formål [72] [73] [74] .

Noter

  1. Mikkelsen TS , Ku M. , Jaffe DB , Issac B. , Lieberman E. , Giannoukos G. , Alvarez P. , Brockman W. , Kim TK , Koche RP , Lee W. , Mendenhall E. , O'Donovan A. , Presser A. , ​​Russ C. , Xie X. , Meissner A. , ​​Wernig M. , Jaenisch R. , Nusbaum C. , Lander ES , Bernstein BE Genomomfattende kort af kromatintilstand i pluripotente og afstamnings-forpligtede celler.  (engelsk)  // Nature. - 2007. - Bd. 448, nr. 7153 . - S. 553-560. - doi : 10.1038/nature06008 . — PMID 17603471 .
  2. Barski A. , Cuddapah S. , Cui K. , Roh TY , Schones DE , Wang Z. , Wei G. , Chepelev I. , Zhao K. Højopløselig profilering af histonmethyleringer i det menneskelige genom.  (engelsk)  // Cell. - 2007. - Bd. 129, nr. 4 . - s. 823-837. - doi : 10.1016/j.cell.2007.05.009 . — PMID 17512414 .
  3. Johnson DS , Mortazavi A. , Myers RM , Wold B. Genom-dækkende kortlægning af in vivo protein-DNA-interaktioner.  (engelsk)  // Science (New York, NY). - 2007. - Bd. 316, nr. 5830 . - P. 1497-1502. - doi : 10.1126/science.1141319 . — PMID 17540862 .
  4. ↑ 1 2 3 4 Park PJ ChIP-seq: fordele og udfordringer ved en modningsteknologi.  (engelsk)  // Naturanmeldelser. genetik. - 2009. - Bd. 10, nr. 10 . - S. 669-680. doi : 10.1038 / nrg2641 . — PMID 19736561 .
  5. ↑ 1 2 3 4 Barbara Kaboord, Maria Perr. Isolering af proteiner og proteinkomplekser ved immunpræcipitation  //  Methods in Molecular Biology (Clifton, NJ). — 01-01-2008. — Bd. 424 . — S. 349–364 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60327-064-9_27 . Arkiveret fra originalen den 23. april 2017.
  6. ↑ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Terrence S. Furey. ChIP-seq og videre: nye og forbedrede metoder til at detektere og karakterisere protein-DNA-interaktioner  //  Nature Reviews. genetik. - 2012-12-01. — Bd. 13 , udg. 12 . — S. 840–852 . — ISSN 1471-0064 . - doi : 10.1038/nrg3306 . Arkiveret fra originalen den 23. april 2017.
  7. ↑ 1 2 3 4 5 6 7 8 9 10 Ryuichiro Nakato, Katsuhiko Shirahige. Nylige fremskridt inden for ChIP-seq-analyse: fra kvalitetsstyring til hel-genom-annotering  //  Briefings in Bioinformatics. — 2016-03-15. —P.bbw023 . _ - ISSN 1477-4054 ​​1467-5463, 1477-4054 . - doi : 10.1093/bib/bbw023 . Arkiveret fra originalen den 21. januar 2022.
  8. ↑ 1 2 3 4 5 6 Timothy Bailey, Pawel Krajewski, Istvan Ladunga, Celine Lefebvre, Qunhua Li. Praktiske retningslinjer for den omfattende analyse af ChIP-seq data  //  PLoS beregningsbiologi. — 2013-01-01. — Bd. 9 , iss. 11 . — P.e1003326 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003326 . Arkiveret fra originalen den 4. maj 2017.
  9. Anthony M. Bolger, Marc Lohse, Bjoern Usadel. Trimmomatic: en fleksibel trimmer til Illumina-sekvensdata   // Bioinformatik . — 01-08-2014. — Bd. 30 , iss. 15 . — S. 2114–2120 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatik/btu170 . Arkiveret fra originalen den 24. april 2017.
  10. ↑ 1 2 Joel Rozowsky, Ghia Euskirchen, Raymond K Auerbach, Zhengdong D Zhang, Theodore Gibson. PeakSeq muliggør systematisk scoring af ChIP-seq eksperimenter i forhold til kontroller  //  Nature Biotechnology. - 2009-1. — Bd. 27 , udg. 1 . — S. 66–75 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1518 . Arkiveret fra originalen den 30. marts 2019.
  11. Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan. Sequence Alignment/Map-formatet og SAMtools  (engelsk)  // Bioinformatics. — 2009-08-15. — Bd. 25 , iss. 16 . — S. 2078–2079 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btp352 . Arkiveret fra originalen den 24. april 2017.
  12. Hashem Koohy, Thomas A. Down, Mikhail Spivakov, Tim Hubbard. En sammenligning af Peak Callers, der bruges til DNase-Seq Data  // PLoS ONE. — 2014-05-08. - T. 9 , nej. 5 . — S. e96303 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0096303 .
  13. Elizabeth G. Wilbanks, Marc T. Facciotti. Evaluering af algoritmeydelse i ChIP-Seq Peak Detection  // PLoS ONE. - 08-07-2010. - T. 5 , nej. 7 . — S. e11471 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0011471 .
  14. Teemu D Laajala, Sunil Raghav, Soile Tuomela, Riitta Lahesmaa, Tero Aittokallio. En praktisk sammenligning af metoder til påvisning af transkriptionsfaktorbindingssteder i ChIP-seq eksperimenter  // BMC Genomics. - 2009. - T. 10 , no. 1 . - S. 618 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-10-618 .
  15. ↑ 1 2 3 4 5 6 7 S. G. Landt, G. K. Marinov, A. Kundaje, P. Kheradpour, F. Pauli. ChIP-seq retningslinjer og praksis for ENCODE og modENCODE konsortier  (engelsk)  // Genome Research. — 01-09-2012. — Bd. 22 , udg. 9 . — S. 1813–1831 . — ISSN 1088-9051 . - doi : 10.1101/gr.136184.111 .
  16. Assaf Rotem, Oren Ram, Noam Shoresh, Ralph A. Sperling, Alon Goren. Enkeltcellet ChIP-seq afslører cellesubpopulationer defineret af kromatintilstand  // Naturbioteknologi. — 2015-11. - T. 33 , no. 11 . - S. 1165-1172 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3383 . Arkiveret fra originalen den 21. maj 2016.
  17. ENCODE-projektkonsortiet. A User's Guide to the Encyclopedia of DNA Elements (ENCODE  )  // PLoS Biology / Peter B. Becker. — 2011-04-19. — Bd. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  18. 1 2 Joshua WK Ho, Eric Bishop, Peter V. Karchenko, Nicolas Nègre, Kevin P. White. ChIP-chip versus ChIP-seq: lektioner til eksperimentelt design og dataanalyse  (engelsk)  // BMC genomics. — 2011-02-28. — Bd. 12 . — S. 134 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-12-134 . Arkiveret fra originalen den 4. maj 2017.
  19. Frauke Greil, Celine Moorman, Bas van Steensel. [16 DamID: Kortlægning af in vivo protein-genominteraktioner ved hjælp af bundet DNA adeninmethyltransferase]  //  Methods in Enzymology. - Elsevier, 2006. - Vol. 410 . — S. 342–359 . — ISBN 9780121828158 . - doi : 10.1016/s0076-6879(06)10016-6 . Arkiveret 12. maj 2019.
  20. Bas van Steensel, Daniel Peric-Hupkes, Maartje J. Vogel. Påvisning af in vivo protein-DNA interaktioner ved hjælp af DamID i pattedyrceller  (engelsk)  // Nature Protocols. - 2007-06. — Bd. 2 , iss. 6 . — S. 1467–1478 . — ISSN 1750-2799 . - doi : 10.1038/nprot.2007.148 . Arkiveret 25. maj 2021.
  21. Yi Eve Sun, Weihong Ge. Fakultet for 1000 evaluering for et østrogen-receptor-alfa-bundet humant kromatin-interaktom. . F1000 - Peer review af den biomedicinske litteratur efter udgivelsen (4. december 2009). Dato for adgang: 18. april 2020.
  22. Rongxin Fang, Miao Yu, Guoqiang Li, Sora Chee, Tristin Liu. Kortlægning af langtrækkende kromatininteraktioner ved nærhedsligeringsassisteret ChIP-seq  //  Celleforskning. — 2016-12. — Bd. 26 , udg. 12 . — S. 1345–1348 . — ISSN 1748-7838 1001-0602, 1748-7838 . - doi : 10.1038/cr.2016.137 . Arkiveret fra originalen den 30. marts 2019.
  23. ↑ 1 2 Mazhar Adli, Bradley E Bernstein. Helgenomkromatinprofilering fra begrænset antal celler ved hjælp af nano-ChIP-seq  //  Nature Protocols. - 2011-10. — Bd. 6 , iss. 10 . — S. 1656–1668 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2011.402 . Arkiveret fra originalen den 18. april 2019.
  24. ↑ 1 2 Ho Sung Rhee, B. Franklin Pugh. Omfattende genomomfattende protein-DNA-interaktioner påvist ved enkeltnukleotidopløsning   // celle . - 2011-12. — Bd. 147 , udg. 6 . - S. 1408-1419 . - doi : 10.1016/j.cell.2011.11.013 . Arkiveret fra originalen den 18. april 2019.
  25. ↑ 1 2 3 Qiye He, Jeff Johnston, Julia Zeitlinger. ChIP-nexus: en ny ChIP-exo-protokol til forbedret påvisning af in vivo transkriptionsfaktorbindingsfodspor  // Naturbioteknologi. — 2015-4. - T. 33 , no. 4 . — S. 395–401 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3121 .
  26. Colin R Lickwar, Florian Mueller, Jason D Lieb. Genom-dækkende måling af protein-DNA-bindingsdynamik ved hjælp af konkurrence ChIP  //  Nature Protocols. — 2013-7. — Bd. 8 , iss. 7 . - S. 1337-1353 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2013.077 . Arkiveret fra originalen den 20. april 2019.
  27. Robert B. Darnell. HITS-CLIP: panoramaudsigt over protein-RNA-regulering i levende celler  //  Wiley Interdisciplinary Reviews: RNA. – 2010-9. — Bd. 1 , iss. 2 . — S. 266–286 . - ISSN 1757-7012 1757-7004, 1757-7012 . - doi : 10.1002/wrna.31 . Arkiveret fra originalen den 20. april 2019.
  28. László Halász, Zsolt Karányi, Beáta Boros-Oláh, Tímea Kuik-Rózsa, Éva Sipos. Kortlægning af RNA-DNA hybrid (R-loop) immunpræcipitation: en analytisk arbejdsgang til at evaluere iboende skævheder  //  Genome Research. — 2017-6. — Bd. 27 , udg. 6 . — S. 1063–1073 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.219394.116 .
  29. ↑ 1 2 3 Paul A. Ginno, Paul L. Lott, Holly C. Christensen, Ian Korf, Frédéric Chédin. R-løkkedannelse er et karakteristisk kendetegn for ikke-methylerede humane CpG-ø-promotorer  //  Molecular Cell. - 2012-3. — Bd. 45 , iss. 6 . — S. 814–825 . - doi : 10.1016/j.molcel.2012.01.017 . Arkiveret fra originalen den 20. april 2019.
  30. Daniel Savic, E. Christopher Partridge, Kimberly M. Newberry, Sophia B. Smith, Sarah K. Meadows. CETCh-seq: CRISPR-epitopmærkning ChIP-seq af DNA-bindende proteiner  (engelsk)  // Genome Research. — 2015-10. — Bd. 25 , iss. 10 . - S. 1581-1589 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.193540.115 .
  31. Peter J Skene, Steven Henikoff. En effektiv målrettet nukleasestrategi til højopløsningskortlægning af DNA-bindingssteder   // eLife . — 2017-01-16. — Bd. 6 . — P. e21856 . — ISSN 2050-084X . - doi : 10.7554/eLife.21856 . Arkiveret 13. maj 2020.
  32. M. Robyn Andersen, Kelsey Afdem, Marcia Gaul, Shelly Hager, Erin Sweet. Familiehistorie, genetiske og andre årsagsrelaterede overbevisninger blandt brystkræftoverlevere  // OBM Genetics. — 2019-02-27. - T. 3 , nej. 3 . — S. 1–1 . — ISSN 2577-5790 . - doi : 10.21926/obm.genet.1903087 .
  33. ↑ 1 2 Oversigt over chipsekvensering . epigenie.com. Hentet 22. april 2019. Arkiveret fra originalen 22. april 2019.
  34. ↑ 1 2 3 Kevin S. Myers, Dan M. Park, Nicole A. Beauchene, Patricia J. Kiley. Definition af bakterielle reguloner ved hjælp af ChIP-seq   // Methods . — 2015-9. — Bd. 86 . — S. 80–88 . - doi : 10.1016/j.ymeth.2015.05.022 . Arkiveret 2. maj 2019.
  35. Michael I Love, Wolfgang Huber, Simon Anders. Modereret estimering af foldændring og dispersion for RNA-seq-data med DESeq2  // Genome Biology. — 2014-12. - T. 15 , nej. 12 . — ISSN 1474-760X . - doi : 10.1186/s13059-014-0550-8 .
  36. MD Robinson, DJ McCarthy, GK Smyth. edgeR: en Bioconductor-pakke til differentiel ekspressionsanalyse af digitale genekspressionsdata  // Bioinformatik. — 2009-11-11. - T. 26 , nr. 1 . — S. 139–140 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatics/btp616 .
  37. Anais Bardet. Peak Calling  // Praktisk vejledning til ChIP-seq dataanalyse. — CRC Press, 2018-10-26. — S. 41–52 . — ISBN 9780429487590 .
  38. Li Chen, Chi Wang, Zhaohui S. Qin, Hao Wu. En ny statistisk metode til kvantitativ sammenligning af flere ChIP-seq datasæt  // Bioinformatik. — 2015-02-13. - T. 31 , nej. 12 . — S. 1889–1896 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatics/btv094 .
  39. Kun Liang, Sundüz Keleş. Påvisning af differentiel binding af transkriptionsfaktorer med ChIP-seq  // Bioinformatik. - 2011-11-03. - T. 28 , no. 1 . — S. 121–122 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btr605 .
  40. ↑ 1 2 Yanxiao Zhang, Yu-Hsuan Lin, Timothy D. Johnson, Laura S. Rozek, Maureen A. Sartor. PePr: en peak-kaldende prioriteringspipeline til at identificere konsistente eller differentielle toppe fra replikerede ChIP-Seq-data  // Bioinformatik. — 2014-06-03. - T. 30 , nej. 18 . — S. 2568–2575 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btu372 .
  41. Bradley E Bernstein, John A Stamatoyannopoulos, Joseph F Costello, Bing Ren, Aleksandar Milosavljevic. NIH Roadmap Epigenomics Mapping Consortium  // Naturbioteknologi. - 2010-10. - T. 28 , no. 10 . — S. 1045–1048 . — ISSN 1087-0156 . - doi : 10.1038/nbt1010-1045 . Arkiveret fra originalen den 22. maj 2016.
  42. ↑ 1 2 3 Qi Zhang, Sündüz Keleş. En empirisk Bayes-test til påvisning af allel-ubalance i ChIP-seq  // Biostatistics. - 2017-11-03. - T. 19 , nej. 4 . — S. 546–561 . — ISSN 1468-4357 1465-4644, 1468-4357 . - doi : 10.1093/biostatistics/kxx060 .
  43. Qi Zhang. Dataanalyse af ChIP-Seq-eksperimenter  //  Computational Epigenetics and Diseases. — Elsevier, 2019. — S. 67–77 . — ISBN 9780128145135 . - doi : 10.1016/b978-0-12-814513-5.00005-2 . Arkiveret 5. maj 2019.
  44. Christopher Gregg. Fakultet på 1000 evaluering for En ensartet undersøgelse af allel-specifik binding og ekspression over 1000-genomer-projekt individer. . F1000 - Peer review af den biomedicinske litteratur efter udgivelse (11. juli 2016). Hentet: 5. maj 2019.
  45. Bryce van de Geijn, Graham McVicker, Yoav Gilad, Jonathan K Pritchard. WASP: allel-specifik software til robust molekylær kvantitativ træk locus discovery  // Nature Methods. — 2015-09-14. - T. 12 , nej. 11 . — S. 1061–1063 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.3582 .
  46. ↑ 1 2 Susan E. Celniker, Laura AL Dillon, Mark B. Gerstein, Kristin C. Gunsalus, Steven Henikoff. Låse op for genomets hemmeligheder   // Nature . — 2009-06-18. — Bd. 459 , udg. 7249 . — S. 927–930 . — ISSN 1476-4687 . - doi : 10.1038/459927a . Arkiveret fra originalen den 29. april 2017.
  47. Hongzhu Qu, Xiangdong Fang. En kort gennemgang af projektet Human Encyclopedia of DNA Elements ( ENCODE  )  // Genomics, Proteomics & Bioinformatics. — 2013-06-01. — Bd. 11 , iss. 3 . — S. 135–141 . — ISSN 2210-3244 . - doi : 10.1016/j.gpb.2013.05.001 . Arkiveret fra originalen den 5. maj 2017.
  48. Oki, S; Ohta, T. ChIP-Atlas . - 2015. - doi : 10.18908/lsdba.nbdc01558-000 .
  49. modENCODE Consortium, Sushmita Roy, Jason Ernst, Peter V. Kharchenko, Pouya Kheradpour. Identifikation af funktionelle elementer og regulatoriske kredsløb ved Drosophila modENCODE  (engelsk)  // Science (New York, NY). — 2010-12-24. — Bd. 330 , iss. 6012 . — S. 1787–1797 . — ISSN 1095-9203 . - doi : 10.1126/science.1198374 . Arkiveret fra originalen den 5. maj 2017.
  50. Jie Wang, Jiali Zhuang, Sowmya Iyer, Xin-Ying Lin, Melissa C. Greven. Factorbook.org: en Wiki-baseret database for transskriptionsfaktorbindingsdata genereret af ENCODE-konsortiet  //  Nucleic Acids Research. — 2013-01-01. — Bd. 41 , udg. Database problem . — P. D171–176 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1221 . Arkiveret fra originalen den 5. maj 2017.
  51. Jian-Hua Yang, Jun-Hao Li, Shan Jiang, Hui Zhou, Liang-Hu Qu. ChIPBase: en database til afkodning af transkriptionel regulering af lange ikke-kodende RNA- og mikroRNA-gener fra ChIP-Seq-data  //  Nucleic Acids Research. — 2013-01-01. — Bd. 41 , udg. Database problem . — P. D177–187 . — ISSN 1362-4962 . doi : 10.1093 / nar/gks1060 . Arkiveret fra originalen den 5. maj 2017.
  52. Alexander Lachmann, Huilei Xu, Jayanth Krishnan, Seth I. Berger, Amin R. Mazloom. ChEA: regulering af transkriptionsfaktor udledt af integration af genomomfattende ChIP-X-eksperimenter  (engelsk)  // Bioinformatik (Oxford, England). - 2010-10-01. — Bd. 26 , udg. 19 . — S. 2438–2444 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/btq466 . Arkiveret fra originalen den 5. maj 2017.
  53. Jesse D. Ziebarth, Anindya Bhattacharya, Yan Cui. CTCFBSDB 2.0: en database for CTCF-bindingssteder og genomorganisation  //  Nukleinsyreforskning. — 2013-01-01. — Bd. 41 , udg. Database problem . — P. D188–194 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1165 . Arkiveret fra originalen den 5. maj 2017.
  54. Li Chen, George Wu, Hongkai Ji. hmChIP: en database og webserver til at udforske offentligt tilgængelige ChIP-seq- og chip-chipdata fra mennesker og mus   // Bioinformatics (Oxford, England) . - 2011-05-15. — Bd. 27 , udg. 10 . - S. 1447-1448 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/btr156 . Arkiveret fra originalen den 5. maj 2017.
  55. Ivan V. Kulakovskiy, Ilya E. Vorontsov, Ivan S. Yevshin, Anastasiia V. Soboleva, Artem S. Kasianov. HOCOMOCO: udvidelse og forbedring af samlingen af ​​transkriptionsfaktorbindingssteder-modeller  //  Nukleinsyreforskning. — 2016-01-04. — Bd. 44 , udg. D1 . — P. D116–125 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkv1249 . Arkiveret fra originalen den 5. maj 2017.
  56. Albin Sandelin, Wynand Alkema, Pär Engström, Wyeth W. Wasserman, Boris Lenhard. JASPAR: en åben adgangsdatabase for eukaryot transkriptionsfaktorbindingsprofiler  //  Nucleic Acids Research. - 2004-01-01. — Bd. 32 , udg. Database problem . — P.D91–94 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkh012 . Arkiveret fra originalen den 5. maj 2017.
  57. Mikhail Pachkov, Piotr J. Balwierz, Phil Arnold, Evgeniy Ozonov, Erik van Nimwegen. SwissRegulon, en database med annoteringer i hele genomet af regulatoriske steder: seneste opdateringer  //  Nucleic Acids Research. — 2013-01-01. — Bd. 41 , udg. Database problem . — P. D214–220 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1145 . Arkiveret fra originalen den 5. maj 2017.
  58. Bo Qin, Meng Zhou, Ying Ge, Len Taing, Tao Liu. CistromeMap: en vidensbase og webserver til ChIP-Seq og DNase-Seq studier i mus og mennesker   // Bioinformatics (Oxford, England) . — 2012-05-15. — Bd. 28 , udg. 10 . — S. 1411–1412 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/bts157 . Arkiveret fra originalen den 5. maj 2017.
  59. Qixuan Wang, Jinyan Huang, Hanfei Sun, Jing Liu, Juan Wang. CR Cistrome: en ChIP-Seq-database for kromatinregulatorer og histonmodifikationslinks i mennesker og mus  //  Nucleic Acids Research. — 2014-01-01. — Bd. 42 , udg. Database problem . — P. D450–458 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkt1151 . Arkiveret fra originalen den 5. maj 2017.
  60. Christoph D. Schmid, Philipp Bucher. ChIP-Seq-data afslører nukleosomarkitektur af humane promotorer  (engelsk)  // Cell. — 30-11-2007. — Bd. 131 , udg. 5 . — S. 831–832; forfatterens svar 832–833 . — ISSN 0092-8674 . - doi : 10.1016/j.cell.2007.11.017 . Arkiveret fra originalen den 5. maj 2017.
  61. Wei Niu, Zhi John Lu, Mei Zhong, Mihail Sarov, John I. Murray. Forskellige transkriptionsfaktorbindingstræk afsløret af genom-wide ChIP-seq i C. elegans  //  Genome Research. — 2011-02-01. — Bd. 21 , udg. 2 . — S. 245–254 . — ISSN 1549-5469 . - doi : 10.1101/gr.114587.110 . Arkiveret fra originalen den 5. maj 2017.
  62. Xiong Ji, Daniel B. Dadon, Brian J. Abraham, Tong Ihn Lee, Rudolf Jaenisch. Kromatin proteomisk profilering afslører nye proteiner forbundet med histon-mærkede genomiske regioner  // Proceedings of the National Academy of Sciences. — 09-03-2015. - S. 201502971 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1502971112 .
  63. Huihuang Yan, Shulan Tian, ​​Susan L Slager, Zhifu Sun. ChIP-seq i at studere epigenetiske mekanismer for sygdom og fremme præcisionsmedicin: fremskridt og fremtidige retninger   // Epigenomics . — 2016-9. — Bd. 8 , iss. 9 . — S. 1239–1258 . - ISSN 1750-192X 1750-1911, 1750-192X . - doi : 10.2217/epi-2016-0053 .
  64. Henriette O'Geen, Lorigail Echipare, Peggy J. Farnham. Brug af ChIP-Seq-teknologi til at generere højopløsningsprofiler af histonmodifikationer  // Metoder i molekylærbiologi (Clifton, NJ). - 2011. - T. 791 . — S. 265–286 . — ISSN 1064-3745 . - doi : 10.1007/978-1-61779-316-5_20 .
  65. Tarjei S. Mikkelsen, Manching Ku, David B. Jaffe, Biju Issac, Erez Lieberman. Genom-dækkende kort over kromatintilstand i pluripotente og afstamningsforpligtede celler  // Natur. - 2007-08-02. - T. 448 , no. 7153 . — S. 553–560 . — ISSN 0028-0836 . - doi : 10.1038/nature06008 . Arkiveret fra originalen den 22. maj 2016.
  66. Douglas F. Browning, Stephen JW Busby. Reguleringen af ​​bakteriel transkriptionsinitiering  // Nature Reviews Microbiology. - 2004-01. - T. 2 , nej. 1 . — s. 57–65 . - ISSN 1740-1534 1740-1526, 1740-1534 . - doi : 10.1038/nrmicro787 .
  67. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: Identifikation af høj opløsning af transkriptionsfaktorbindingssteder fra PET og SET ChIP-Seq Data  // PLoS Computational Biology. — 2013-10-17. - T. 9 , nej. 10 . — S. e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  68. Antonio LC Gomes, Thomas Abeel, Matthew Peterson, Elham Azizi, Anna Lyubetskaya. Afkodning af ChIP-seq med et dobbeltbindingssignal forfiner bindingstoppe til enkeltnukleotider og forudsiger samarbejdsinteraktion  //  Genome Research. — 2014-10. — Bd. 24 , udg. 10 . - S. 1686-1697 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.161711.113 .
  69. Yuchun Guo, Shaun Mahony, David K. Gifford. High Resolution Genome Wide Binding Event Finding og Motiv Discovery afslører transkriptionsfaktor Spatial Binding Constraints  //  PLoS Computational Biology / Stein Aerts. - 09-08-2012. — Bd. 8 , iss. 8 . — P.e1002638 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1002638 .
  70. Xuekui Zhang, Gordon Robertson, Martin Krzywinski, Kaida Ning, Arnaud Droit. PICS: Probabilistic Inference for ChIP-seq  (engelsk)  // Biometrics. - 2011-3. — Bd. 67 , udg. 1 . — S. 151–163 . - doi : 10.1111/j.1541-0420.2010.01441.x .
  71. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: Identifikation af høj opløsning af transkriptionsfaktorbindingssteder fra PET og SET ChIP-Seq Data  //  PLoS Computational Biology / Roderic Guigo. — 2013-10-17. — Bd. 9 , iss. 10 . — P.e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  72. Jason Ernst, Manolis Kellis. Opdagelse og karakterisering af kromatintilstande til systematisk annotering af det menneskelige genom  // Nature Biotechnology. — 2010-07-25. - T. 28 , no. 8 . — S. 817–825 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1662 .
  73. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Kortlægning og analyse af kromatintilstandsdynamik i ni humane celletyper  // Nature. — 2011-03-23. - T. 473 , no. 7345 . — s. 43–49 . — ISSN 1476-4687 0028-0836, 1476-4687 . - doi : 10.1038/nature09906 .
  74. Shirley Pepke, Barbara Wold, Ali Mortazavi. Beregning for ChIP-seq og RNA-seq studier  // Nature Methods. - 2009-11. - T. 6 , nej. 11 . — S. S22–S32 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.1371 .