iconv er et UNIX -værktøj (og et bibliotek af samme navn ) til at konvertere tekst fra en kodning til en anden. Også porteret til Windows.
Iconv-værktøjet konverterer tekst fra en kodning til en anden. Indgangskodningen indstilles med -f-tasten, og udgangskodningen med -t-tasten. Enhver af disse kodninger er standard til systemets lokalitet. Alle inputfiler læses efter tur, hvis inputfilparameteren ikke er angivet, bruges standardinput , og den konverterede tekst udlæses til standardoutput .
Når -c-indstillingen er givet, kasseres tegn, der ikke kan konverteres. Ellers, når en sådan fejl opstår, går programmet ned .
Når indstillingen -s er givet, udskrives der ingen fejlmeddelelser.
Kontakten -l viser en liste over tilgængelige kodninger.
Følgende script finder alle filer i den aktuelle mappe med filtypenavnet *.java, omkoder dem til UTF-8 og kopierer resultatet til res-mappen:
mkdir res find -maxdepth 1 -iname "*.java" -type f -exec bash -c "iconv -c -f WINDOWS-1251 -t UTF-8 {} > ./res/{}" \;Omkodning af alle filer i en mappe med deres erstatning:
for i i * ; gør iconv -f WINDOWS-1251 -t UTF-8 " $i " >tmp ; mv tmp " $i " ; FærdigRekursiv omkodning af alle filer af den påkrævede type (i eksemplet - txt):
finde. -navn '*.txt' | mens du læser i ; gør iconv -f WINDOWS-1251 -t UTF-8 " $i " >tmp ; mv tmp " $i " ; FærdigRekursiv genkodning af alle html-filer:
# !/bin/sh find . -type f -navn '*.htm' -o -navn '*.html' | mens jeg læser jeg ekko $i iconv -f WINDOWS-1251 -t UTF-8 " $i " > tmp mv -f tmp " $i " færdigFølgende sæt scripts finder alle filer i den aktuelle mappe med filtypenavnet *.txt, omkoder til CP1251 fra KOI8-R :
all.cmd:
for /R %% i i ( . ) skal du kalde txt.cmd %% itxt.cmd:
sæt cd2 = %cd% cd %1 for %% j in ( *.txt ) ring til % cd2% \iconv2.cmd %% j cd %cd2%iconv2.cmd:
iconv -c -f KOI8-R -t CP1251 %1 > vinde. %1 del %1 omdøb gevinst. %1 %1En anden måde (via cmd):
Før du udfører denne kommando, skal du tilføje stien til iconv.exe-programmet til Path-miljøvariablen:
for %% i in ( *.txt ) gør iconv -f cp1251 -t utf-8 " %% i" > utf8/ %% iKommandoen vil omkode alle filer med filtypenavnet "txt" og lægge de omkodede filer i en forudoprettet utf8-mappe.
Unix-kommandoer | ||||||||
---|---|---|---|---|---|---|---|---|
| ||||||||
|
Tegnkodninger | |
---|---|
Historiske indkodninger | yderligere komp. semafor (Makarov) morse Bodo MTK-2 komp. 6-bit SCP RADIX-50 EBCDIC KOI-7 ISO 646 |
moderne 8-bit repræsentation | symboler ASCII ikke-ASCII 8-bit kodesider Kyrillisk KOI-8 Grundlæggende kodning Mackyrillisk ISO 8859 1 (lat.) 2 3 fire 5 (kir.) 6 7 otte 9 ti elleve 12 13 fjorten 15 (€) 16 Windows 1250 1251 (Kir.) 1252 1253 1254 1255 1256 1257 1258 WGL4 IBM og DOS 437 850 852 855 866 "alternativ" MIC |
Multibyte | traditionel DBCS GB2312 HTML unicode UTF-32 UTF-16 UTF-8 tegnliste Kyrillisk |
brugergrænseflade tastatur layout lokalitet linje oversættelse skrifttype translitteration brugerdefinerede skrifttyper forsyningsselskaber ikonv optage |