WordNet er en engelsk leksikalsk database udviklet ved Princeton University og udgivet med tilhørende software under en fri licens uden copyleft . Det er en elektronisk ordbog -thesaurus og et sæt semantiske netværk for det engelske sprog.
Ordbogen består af fire netværk for de væsentligste dele af talen: substantiver, verber, adjektiver og adverbier. Den grundlæggende ordforrådsenhed i WordNet er ikke et enkelt ord, men en synonym serie, det såkaldte " synset " , som kombinerer netværkets ord med en lignende betydning til en node i det semantiske netværk. For at gøre det nemmere at bruge ordbogen af en person, er hvert synset suppleret med en definition og eksempler på brug af ord i sammenhæng. Et ord eller en sætning kan forekomme i mere end ét synset og have mere end én kategori af ordled . Hver synset indeholder en liste over synonymer eller synonyme sætninger og pointer, der beskriver forholdet mellem det og andre synset. Ord, der har flere betydninger, indgår i flere synssæt og kan tildeles forskellige syntaktiske og leksikalske klasser.
Synsets i WordNet er forbundet med forskellige semantiske relationer:
WordNet beskriver også andre typer links. Blandt dem spiller hyponymi en særlig rolle: det giver mulighed for at organisere synsets i form af semantiske netværk. For forskellige dele af tale kan generiske relationer have yderligere karakteristika og variere i omfang.
WordNet er gratis at bruge til kommercielle og videnskabelige formål. For at arbejde med det er der adskillige programmer, mange grænseflader og API'er implementeret på de fleste mulige sprog, samt brug af DICT -protokollen , GoldenDict- programmet og andre. Desuden findes WordNet-pakker i nogle softwarelagre til GNU og Linux og deres distributioner.