Informationsteori er en gren af anvendt matematik , radioteknik (signalbehandlingsteori ) og datalogi , der vedrører måling af mængden af information , dens egenskaber og etablering af begrænsende forhold for datatransmissionssystemer. Som enhver matematisk teori opererer teorien med matematiske modeller og ikke med rigtige fysiske objekter (kilder og kommunikationskanaler ). Anvender hovedsageligt det matematiske apparat for sandsynlighedsteori og matematisk statistik .
De vigtigste grene af informationsteori er kildekodning ( komprimerende kodning ) og kanalkodning ( støjkorrigerende ). Informationsteori er tæt forbundet med informationsentropi , kommunikationssystemer, kryptografi og andre relaterede discipliner.
Feltet er i skæringspunktet mellem matematik , statistik , datalogi , fysik , neurovidenskab , informationsteknik og elektroteknik . Teorien har også fundet anvendelser på andre områder, herunder statistisk inferens , naturlig sprogbehandling , kryptografi , neurovidenskab [1] , menneskesyn [2] , evolution [3] og funktionen [4] af molekylære koder ( bioinformatik ), statistisk model selektion [5] , termisk fysik [6] , kvanteberegning , lingvistik , plagiatdetektion [7] , mønstergenkendelse og anomalidetektion [8] . Vigtige underområder af informationsteori omfatter datakomprimering , kanalkodning , algoritmisk kompleksitetsteori , algoritmisk informationsteori , informationsteoretisk sikkerhed, Gray's relationelle analyse og informationsmåling.
Fremkomsten af informationsteori er forbundet med udgivelsen af Claude Shannon af værket " Matematical Theory of Communication " i 1948 . Fra Shannons synspunkt er informationsteori en gren af den matematiske kommunikationsteori. Informationsteori sætter hovedgrænserne for mulighederne for informationstransmissionssystemer, sætter de indledende principper for deres udvikling og praktiske implementering. Rækken af problemer med informationsteori præsenteres ved hjælp af et blokdiagram, et typisk system til transmission eller lagring af information.
I skemaet er en kilde ethvert objekt i universet , der genererer beskeder, der skal flyttes i rum og tid . Uanset den oprindelige fysiske karakter konverteres alle meddelelser, der skal transmitteres, normalt til form af elektriske signaler , sådanne signaler betragtes som output fra kilden. Kildekoderen repræsenterer informationen i den mest kompakte form. Kanalkoderen behandler informationen for at beskytte meddelelser mod interferens under transmission over kommunikationskanalen eller mulige forvrængninger under informationslagring. Modulatoren konverterer meddelelserne genereret af kanalkoderen til signaler i overensstemmelse med den fysiske natur af kommunikationskanalen eller informationslagringsmediet. Informationsformidlingsmediet ( kommunikationskanalen ) introducerer tilfældig støj i informationstransmissionsprocessen, som forvrænger budskabet og derved gør det svært at læse. Blokkene placeret på modtagersiden udfører de omvendte operationer og giver modtageren information i en form, der er let at forstå .
Informationsteoriens fødsel forbindes ofte med Claude Shannon 's placering i juli-oktober 1948 af et værk i det amerikanske telefonselskab Bell Systems tidsskrift under titlen "Mathematical Theory of Communication". Men det er værd at nævne, at bidraget til formuleringen og konstruktionen af informationsteori også blev givet af mange andre fremtrædende videnskabsmænd. Shannon selv skrev i begyndelsen af sin artikel "Nogle af de vigtigste bestemmelser i denne teori findes i de vigtige værker af Nyquist og Hartley . På nuværende tidspunkt er teorien blevet udvidet til at omfatte en række nye faktorer, især påvirkningen af støj i kanalen.
Grundlæggende udviklede Shannon retningen for Hartleys arbejde, ved at bruge begrebet "information", men udtrykket i sig selv forklarer ikke, det foreskriver kun, at beskeder kan have en form for "betydning", det vil sige henvise til et system, der har sin egen fysisk eller spekulativ essens ( kybernetisk system). Shannons teori blev oprindeligt betragtet som et præcist formuleret matematisk problem og gjorde det muligt at bestemme gennemløbet af en støjende kommunikationskanal.
Kodning er processen med at overføre en meddelelse ved input af en kommunikationskanal til en meddelelseskode ved output, mens meddelelsens informationsværdi skal forblive uændret. I informationsteori kan der skelnes mellem følgende afsnit:
1. Kodning af diskrete kilder (tabsfri datakodningsmodel).
2. Datakodning, der sikrer deres fejlfri transmission over en støjende kanal.
En kode er unikt afkodebar, hvis en sekvens af tegn fra kodens alfabet (og for det meste 0'er og 1'er) er opdelt i separate ord. Hvis ingen af kodeordene er begyndelsen på et andet, kaldes koden en præfikskode, og den er unikt afkodelig. Derfor er præfiks en tilstrækkelig, men ikke nødvendig betingelse for unik afkodning. Præfikskravet begrænser mængden af længder af kodeord og gør det ikke muligt at vælge kodeord, der er for korte. En nødvendig og tilstrækkelig betingelse for eksistensen af en præfiksvolumenkode med kodeordslængder er opfyldelsen af Krafts ulighed:
Det er også nødvendigt at overveje Shannon-Fano-koden - en algoritme til præfiks ikke-ensartet kodning. Denne indkodningsmetode bruger redundansen af meddelelsen, som ligger i den uensartede frekvensfordeling af tegnene i dets alfabet, det vil sige, den erstatter koderne for hyppigere tegn med korte binære sekvenser og koderne for sjældnere tegn med længere binære sekvenser. Overvej en kilde, der vælger bogstaver fra et sæt med sandsynligheder . Vi antager, at bogstaverne er ordnet i faldende rækkefølge af sandsynligheder ( ). Kodeordet i Shannon-koden for en besked med et tal er en binær sekvens, som er de første cifre efter decimaltegnet i den binære notation af tallet :
3. Datakodning for systemer med mange brugere beskriver den optimale interaktion mellem abonnenter ved hjælp af en fælles ressource, for eksempel en kommunikationskanal.
Ordbøger og encyklopædier | ||||
---|---|---|---|---|
|
Informatikkens hovedretninger | |
---|---|
Matematiske grundlag | |
Teori om algoritmer | |
Algoritmer , datastrukturer | |
Programmeringssprog , compilere | |
Samtidig og parallel computing , distribuerede systemer | |
Software engineering | |
Systemarkitektur | |
Telekommunikation , netværk | |
Database | |
Kunstig intelligens |
|
Computer grafik | |
Menneske-computer interaktion |
|
videnskabelig databehandling | |
Bemærk: Datalogi kan også opdeles i forskellige emner eller grene i henhold til ACM Computing Classification System . |