Sprogredundans er en statistisk værdi, der angiver redundansen af information indeholdt i teksten på et bestemt sprog .
Matematisk er denne værdi defineret som
hvor er den absolutte entropi af sproget , er den faktiske entropi af sproget .
Hvis vi tager den faktiske entropi af det engelske sprog som 1,3 bit pr. bogstav, så er dens redundans 3,4 bit pr. bogstav (absolut entropi er 4,7 bit pr. bogstav).
I lingvistik betyder redundans information, der gentages mere end én gang. [1] [2] Eksempler på redundans er elementer af multipel overensstemmelse i morfologi [1] , flere træk der adskiller fonemer i fonologi [2] , eller brugen af flere ord til at udtrykke en idé i retorik [1] .
Mængden af redundans på forskellige sprog i verden varierer fra 70-80% [3] . Alle sprog har overflødige elementer på alle niveauer. Redundans i sprog er ikke tilfældig: dens funktion er at lette kommunikationen under ugunstige betingelser for informationsoverførsel. Redundans er et system til at forhindre mulige fejl [4] .
Redundans kan forekomme på et hvilket som helst niveau af grammatik på grund af enighed - en nødvendig betingelse i mange sprog, der gør det muligt at kombinere forskellige ords former med hinanden i en sætning eller sætning - den samme semantiske information kan formidles flere gange. For eksempel i den spanske sætning los árboles verdes ("grønne træer") ændres artiklen los, navneordet árboles og adjektivet verdes for at angive flertalsformen [1] . På engelsk ville dette være, at mennesket er en soldat versus de mænd er soldater. ("Denne mand er en soldat" versus "disse mennesker er soldater").
I fonologi forekommer redundans i minimale par - par af ord eller sætninger, der kun adskiller sig fra hinanden med et fonem , den mindste kendetegnende enhed i et lydsystem. Fonemer kan dog afvige på flere fonetiske måder. For eksempel på engelsk har fonemerne /p/ og /b/ i ordene pin og bin forskellig klang, aspiration og udtales med forskellige spændingsniveauer. Enhver af disse funktioner er tilstrækkelig til at skelne mellem /p/ og /b/ på engelsk [2] .
I generativ grammatik bruges redundans til at forenkle formen for grammatisk beskrivelse. Ethvert træk, der kan forudsiges (udledes) på grundlag af et andet træk (f.eks. hvordan aspiration er direkte afhængig af stemmelighed), bør ikke inkluderes i grammatikregler. Derfor kaldes ikke-redundante træk, der bør beskrives i grammatiske regler, for differentielle træk [2] .
Sammen med overensstemmelse i morfologi tilføjer fonologiske vekslen som koartikulation og assimilation redundans til det fonologiske niveau. De fonologiske reglers redundans kan forklare nogle af uklarhederne i mundtlig kommunikation. Ifølge psykolog Steven Pinker, "I taleforståelse kan redundans i fonologiske regler kompensere for nogle af lydbølgens unøjagtigheder. For eksempel ved taleren, at thisrip skal være denne rip og ikke srip, fordi konsonantkombinationen sr ikke bruges på engelsk [5] .
Det er denne egenskab ved redundans, der er nævnt som vigtig, der giver folk mulighed for at mestre komplekse grammatiske systemer. Sprogtilegnelse af børn bør abstraheres fra grammatiske regler og baseret på den information, de hører. Sprogets redundans gør det muligt for børns induktive tænkning at blive styrket ved at præsentere mere meningsfuld evidens for de induktioner, som den er baseret på. Derfor giver redundans tilstrækkelig stimulus til at mestre et komplekst grammatisk system.
Ofte i tale opstår redundans utilsigtet, men overflødige sætninger kan bevidst komponeres for at fremhæve, for at mindske sandsynligheden for, at en sætning bliver fejlfortolket. I retorik har udtrykket "redundans" en tendens til at have en negativ konnotation og kan virke upassende på grund af gentagne eller overflødige formuleringer (nogle bruger selvmodsigende formuleringer såsom dobbeltnegativer for at udvide definitionen), men det forbliver en sprogligt gyldig måde at lægge vægt på en bestemt idé. Gennem brug af gentagelser af visse begreber øger redundans sandsynligheden for, at budskabets betydning kan forudsiges og forstås af andre.
Normalt tager redundans form af tautologier : sætninger, der gentager betydning gennem brug af semantisk lignende ord. Almindelige eksempler er "udvalg af diverse varer", "ekstra bonusser", "overdrive", "og så videre", "slutresultat", "gratis gave", "fremtidsplaner", "ubekræftet rygte", "dræb, dræbt, elektrocuteret til døden, "fortidshistorie", "sikker havn", "potentiel fare", "fuldstændig omringet", "svigagtigt bedrageri" og så videre. Der er også en "joking organisation" kendt som "Redundant Society of Redundancy", også kaldet "Redundant Society Society".
En variation af tautologien er RAS-syndrom , hvor et af de ord, der allerede er indeholdt i forkortelsen, gentages efter forkortelsen: "AGM-maskine", "HIV-virus", "PIN-nummer" og "IMND-array". Disse sætninger står for "automatisk talende maskine." henholdsvis "human immunodeficiency virus virus", "personligt identifikationsnummer", "redundant array af uafhængig drive array". Selve navnet "RAS Syndrome" er et ironisk eksempel på "RAS Syndrome", som kan dechifreres som "Redundanssyndrom i forkortelser Syndrom". Et andet almindeligt eksempel på redundans er sætningen "i ily you" ("jeg yalt dig") er en kort sætning for beskeder, der, når de udvides, lyder som "Jeg elsker dig".
En mere generel klassificering af redundans er pleonasme , som er brugen af et ekstra ord (eller en del af det). I betragtning af den retoriske tautologi og RAS-syndrom inkluderer det også den dialektiske brug af teknisk unødvendige dele som i "off of" versus "off". Pleonasme kan også tage form af ren semantisk redundans, som er normen i sproget og forståelig for taleren (for eksempel betyder spørgsmålet "Qu'est-ce que c'est?" på fransk "Hvad er dette? Eller "Hvad er dette?", som bogstaveligt oversættes som "Hvad er det her, hvad er det her?"). Udtrykket pleonasme bruges dog oftest som et synonym for tautologi.
Fra et informationsteoretisk synspunkt tillader stor redundans tekster at blive godt komprimeret ved hjælp af entropikodning .