Søg spam
Søgemaskinespam ( spamdexing [1] , søgemaskineforgiftning eller webspam ) - websteder og sider på internettet oprettet med det formål at manipulere søgemaskineresultater - i sidste ende for at bedrage brugeren.
Hovedtyper
- Ikke relateret til sidens indhold, men populære i søgeforespørgsler, ord i tags "meta søgeord", "beskrivelse", for eksempel " sex ", " freebie ". Som et resultat begyndte søgemaskiner at analysere ikke kun specielle tags, men også teksten på selve webstedet.
- "Pumning" af teksten med nøgleord - kunstigt at øge frekvensen af et søgeord eller et udtryk i teksten og (eller) bruge HTML markup elementer (h1-3, stærk, b, em, i) til kunstigt at øge vægten af søgeordet.
- "Usynlig tekst" - tekst, der er usynlig for den besøgende på siden, men indekseret af søgemaskinen. Anvender tekstfarve, der matcher baggrundsfarve, 1 pixel tekst, tekstblokke, med "visning: ingen" stil.
- Link spam - links, der "vinder op" parameteren "link popularitet" og PageRank på webstedet. Da søgemaskiner, når de reagerer på en anmodning, styres af antallet af tilgængelige links på andre websteder til denne ressource, kom ideen op på en eller anden måde at øge antallet af sådanne links:
- Opret små websteder på gratis hosting, registrer dem i et stort antal tematiske mapper og link til det vigtigste fra dem.
- Deltag i linkudvekslingen.
- Køb links for penge.
- Link spam fra gæstebøger, blogs, wikier osv.
Søgemaskiner håndterer dette ved at skabe filtre, der inkluderer websteder, hvis links ikke tages i betragtning ved rangering.
- Døråbninger er mellemliggende sider, der er oprettet for at øge sidevægten i linkrangering eller for at organisere en Google-bombe . I overensstemmelse med døråbningsteknologien bør en særlig døråbningsside fremmes i søgeindekset. Og allerede fra denne side omdirigeres til annoncering. Én annonce kan have et ubegrænset antal døråbninger. Søgemaskiner reagerer ved at fjerne websteder fra deres database, der har automatiske omdirigeringer. Som spammere reagerer på med et simpelt trick: de beder den besøgende om at klikke på knappen "Log ind på webstedet" eller noget lignende.
- Maskering , eller "tilsløring" - analysen af forespørgselsvariabler, hvor søgemaskinen får tildelt webstedets indhold, som er forskelligt fra det, brugeren ser.
- Omskrivning af nyttige artikler fra andre websteder. Ved første øjekast viser søgeresultaterne sig at være mange originale artikler på forskellige websteder, men i virkeligheden er dette den samme tekst, kun hver sætning på hvert websted er parafraseret på sin egen måde.
Konsekvenser af at bruge søgemaskinespam
- Det største problem, der genereres af søgespam, er, at det genererer en masse uønsket indhold, hvilket gør det vanskeligt for søgemaskiner at arbejde effektivt, forvrænger den objektive rangering af internetressourcer og relevansen af søgeresultater. Som følge heraf devaluerer dette i høj grad internettet som en kilde til objektiv information.
- Hvis tidlige søgemaskiner kunne stole på søgeord, indikationer af hyppigheden af opdateringer, så på grund af den aktive brug af disse metoder til at "bedrage" søgemaskiner, blev senere versioner af søgemaskiner tvunget til næsten fuldstændigt at ignorere disse indikationer og kritisk henvise til hver af sidens sider, hvilket gjorde det svært at finde "respektable" sider med sjældent indhold og foreskrevne søgeord. For eksempel indeholder en side med teksten til en middelalderlig sang og søgeordene "Middelalder, poesi, Østeuropa", som ikke har et stort antal links fra andre websteder, ikke ordet "Middelalder, poesi" i teksten, er usandsynligt at blive fundet af disse søgeord.
Modforanstaltninger
- Sider, der mistænkes for at være spam, udelukkes nogle gange fra søgeresultaterne af søgemaskinen.
- Brugere kan bruge søgeoperatorer til at filtrere. For Google udelukker et søgeord foran et "-" (minus) websteder, der indeholder søgeordet på deres sider eller i sidewebadresser fra søgeresultaterne. For eksempel vil søgning efter "-<uønsket websted>" fjerne websteder, der indeholder ordet "<uønsket websted>" på deres sider og sider, hvis URL indeholder "<uønsket websted>".
Noter
- ↑ SearchEngineLand , Danny Sullivans videoforklaring af søgemaskinespam, oktober 2008 Arkiveret 17. december 2008 på Wayback Machine . Hentet 2008-11-13.