Støjord

Stopord , eller Støjord , er et begreb fra teorien om informationssøgning efter nøgleord .

Stopord kan opdeles i generelle og afhængige .

Almindelige omfatter præpositioner , suffikser , participier , interjektioner , tal , partikler osv. Almindelige støjord er altid udelukket fra søgeforespørgslen (bortset fra søgning efter strengt match af søgesætningen), de ignoreres også når man bygger et omvendt indeks . Det menes, at hvert af de almindelige stopord findes i næsten alle dokumenter i samlingen .

Afhængige stopord afhænger af søgesætningen. Ideen er at tage højde for fraværet af simple ord fra forespørgslen og afhængige stopord fra forespørgslen på en anden måde i det fundne dokument.

For eksempel, når du søger efter Pushkin Alexander Sergeevich , giver det mening at vise alle dokumenter, der indeholder:

Men det giver næppe mening at vise dokumenter, der kun indeholder:

Det vil sige, i denne forespørgsel er støjordene Alexander og Sergeevich .

Afhængige stopord adskiller sig ved, at de kun skal tages i betragtning i søgeforespørgslen, hvis der er væsentlige nøgleord i det søgte dokument.

Se også

Litteratur