U-Net

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 16. maj 2020; checks kræver 6 redigeringer .

U-Net  er et foldet neuralt netværk , der blev skabt i 2015 til biomedicinsk billedsegmentering ved Computer Science Department ved University of Freiburg [1] . Netværkets arkitektur er et fuldt forbundet foldningsnetværk [2] , modificeret, så det kan arbejde med færre eksempler (træningsbilleder) og lave mere præcis segmentering.

Netværksarkitektur

Netværket indeholder en foldningsdel (til venstre) og en udfoldelig del (til højre), så arkitekturen ligner bogstavet U, som afspejles i navnet. Ved hvert trin fordobles antallet af feature-kanaler.

Konvolutionsdelen ligner et almindeligt foldningsnetværk, den indeholder to 3x3 foldningslag i en række, hvorefter der er et ReLU-lag og pooling med en 2x2 maksimal funktion med et trin på 2.

Hvert trin i den udfoldede del indeholder et lag, omvendt pooling, som udvider feature-kortet, efterfulgt af en 2×2-foldning, som reducerer antallet af feature-kanaler. Dette efterfølges af en sammenkædning med et passende trimmet funktionskort fra kompressionsstien og to 3x3 folder, hver efterfulgt af en ReLU. Beskæring er nødvendig på grund af det faktum, at vi mister kantpixel i hver foldning. På det sidste lag bruges en 1×1 foldning til at bringe hver 64-komponent egenskabsvektor til det nødvendige antal klasser.

I alt har netværket 23 foldningslag.

To artikler af netværksforfattere har over 1600 og 1000 citater i maj 2018 [3] .

Noter

  1. U-Net forfatterens artikel: U-Net: Convolutional Networks for Biomedical Image Segmentation Arkiveret 21. oktober 2018 på Wayback Machine
  2. Long, J.; Shelhamer, E. & Darrell, T. (2014), Fuldt foldede netværk til semantisk segmentering, arΧiv : 1411.4038 [cs.CV]. 
  3. [1] Arkiveret 14. oktober 2021 på Wayback Machine Google Scholar-citatdata