PSI Proteinklassificering

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 3. oktober 2017; checks kræver 2 redigeringer .

PSI Protein Classifier  er et computerprogram, der giver dig mulighed for at opsummere resultaterne af både på hinanden følgende og uafhængige iterationer af PSI-BLAST- programmet . Programmet afgør, om proteinerne fundet ved blast tilhører tidligere kendte familier og opdeler de resterende proteiner i grupper. Det gør det muligt at kvantificere (ved antallet af iterationer) niveauet af forholdet mellem forskellige familier af homologe proteiner .

Format af parsede filer

PSI Protein Classifier bruger filer, der er genereret fra NCBI -webstedet af PSI-BLAST-programmet. Når du begynder at screene en database med aminosyresekvenser ved hjælp af PSI-BLAST, skal du indtaste den proteinsekvens, der bruges som en forespørgsel, i FASTA -format og tildele den et binært navn adskilt af en bindestreg. I dette tilfælde skal den første del af navnet være betegnelsen for den familie, det tilhører. Det er nødvendigt sekventielt (efter hver iteration) at gemme websider med resultaterne af PSI-BLAST-programmet som tekstfiler (.txt) i PSI-Blast-mappen (disse filer) ved hjælp af tilstanden "Brug gammelt BLAST-rapportformat". kaldes "blast-filer").

PSI Protein Classifier bruger filer med familielister som hjælpefiler. Tilstedeværelsen af ​​sådanne filer er valgfri. Filer af denne type er tekstfiler (.txt) og placeres i mappen FamilyName (disse filer kaldes "familiefiler"). Den første linje i hver af disse filer er navnet på familien, efterfulgt af to ord efterfulgt af mindst ét ​​mere. De følgende linjer angiver antallet af proteiner (GenPept accessionsnummer), der tilhører denne familie - en pr. linje. Det er vigtigt, at hvert tal indeholder en indikation af proteinversionen, det vil sige, at det sidste ciffer i tallet er indledt med en prik. Programmet kan også bruge færdige lister over familier fra CAZy-databasen , gemt som tekstfiler (.txt), som familiefiler . Det skal bemærkes, at CAZy-databasen dækker familierne af glycosylhydrolaser og en række andre enzymer, der virker på kulhydrater og deres derivater.

Links

PSI Proteinklassificering