Lobanov, Boris Methodievich

Boris Lobanov
Fødselsdato 18. juli 1938( 1938-07-18 ) [1] (84 år)
Fødselssted
Land  USSR , Hviderusland 
Videnskabelig sfære computeranalyse , talesyntese , talegenkendelse
Arbejdsplads Det fælles institut for informatikproblemer ved National Academy of Sciences of Belarus
Alma Mater Minsk Radio Engineering Institute
Akademisk grad doktor i tekniske videnskaber
Priser og præmier Badge " Æres radiooperatør af USSR "; 1 sølv- og 2 bronzemedaljer af VDNKh fra USSR ; Jubilæumsmedalje " Til ære for 80-årsdagen for National Academy of Sciences of Belarus "

Boris Methodievich Lobanov (født 18. juli 1938) er en sovjetisk og hviderussisk videnskabsmand inden for teknisk kybernetik [2] . Udviklede det teoretiske grundlag og metoder til analyse, syntese og talegenkendelse . Han udviklede de første enheder i USSR til syntese af russisk og hviderussisk tale [3] . Forfatter til mere end 300 videnskabelige artikler om problemerne med taleanalyse, -genkendelse og -syntese [4] [5] [6] . Forfatteren til tre kapitler i den første håndbog om kunstig intelligens , udgivet i USSR , dedikeret til talekommunikationssystemer [7] . Lavet en række opfindelser på dette område [8] .

Biografi

Boris Methodievich Lobanov blev født den 18. juli 1938 i byen Prokopyevsk (på det moderne Kemerovo Oblasts territorium ). I 1948 flyttede familien til Minsk for permanent ophold [9] .

Uddannelse og tidlig forskning

Allerede i skolen blev Boris Lobanov interesseret i at designe radioudstyr: i 6. klasse byggede han sin første detektorradio, i 8. - en rør, og i 10. designede han sin egen VHF-radiostation. I 1955 dimitterede han fra gymnasiet nr. 13 i Minsk og besluttede sig endelig for valget af sit fremtidige speciale [10] [9] .

På det tidspunkt var der ingen højere uddannelsesinstitution med en passende profil i Minsk, og Boris Lobanov kom ind i Radio Communications and Broadcasting Department ved Minsk Electrotechnical College of Communications . På den tekniske skole fortsatte han med at være radioamatør, organiserede de første republikanske radiokonkurrencer i "rævejagt", modtog den første kategori i radiosport og et certifikat som radioobservatør for signalerne fra den første jordsatellit [9] .

Efter at have afsluttet en teknisk skole i 1958 modtog Boris Lobanov et diplom med udmærkelse, men i stedet for at fortsætte sine studier på universitetet blev han indkaldt til militærtjeneste i den sovjetiske hær som senior radiomester ( Petrozavodsk ). Allerede i 1959, med tilstrækkelig specialuddannelse og et radioværksted godt udstyret med instrumenter, begyndte Boris Lobanov at studere tale og studere det med en mikrofon og et oscilloskop. Samtidig indgik han korrespondance med en kendt videnskabsmand, professor L. A. Chistovich , fra hvem han modtog en række værdifulde tips om at udføre forskning i tale. Et dokumentarisk indlæg er blevet bevaret i Lobanovs dagbog, dateret 25. oktober 1959: " Fonmofonen fører til fonemografen ." Det kan ses fra dette indlæg, at Boris Lobanov allerede da indså og fastlagde den generelle strategi for sin fremtidige taleforskning: " Mod talegenkendelse gennem syntese ", som han uvægerligt holdt sig til gennem hele sin videre videnskabelige aktivitet [9] .

Efter sin eksamen fra hæren i 1961 gik Boris Lobanov ind på Minsk Radio Engineering Institute (MRTI) med en grad i Radio Engineering og blev allerede i sit første år formand for instituttets videnskabelige studentersamfund, inden for hvilket, sammen med en gruppe af studerende begyndte han at udvikle en talesignalanalysator. I 1965 udgav Lobanov som fjerdeårsstuderende sine første fire videnskabelige artikler om analyse af talesignaler, som blev regnet som et afgangsprojekt, hvilket gjorde det muligt for ham at afslutte instituttet før tidsplanen. Metoden foreslået i disse værker til forbedring af hovedparametrene for parallel spektral analyse blev derefter effektivt brugt i udviklingen af ​​talegenkendelsessystemer [9] .

Efter sin eksamen fra MRTI i 1965 gik Boris Lobanov ind på instituttets forskerskole og fortsatte med at arbejde på opgaverne med primær analyse af talesignaler til talegenkendelse og syntesesystemer. I 1968 afsluttede han sine postgraduate studier og forsvarede sin ph.d.-afhandling om emnet " Nogle spørgsmål i analyse af talesignaler " [11] .

Videnskabelig aktivitet i 60'erne og 70'erne

Mens han stadig var på kandidatskolen, organiserede B. M. Lobanov i 1966 et selvbærende videnskabeligt laboratorium til analyse og syntese af talesignaler ved afdelingen for radiomodtagere i MRTI, hvoraf mange af ansatte fortsatte med at engagere sig i taleforskning i lang tid. I laboratoriet under ledelse af Lobanov blev der for første gang i USSR designet en spektrumanalysator til taleforskning " Spektr-1 " og en enhed til intonografisk forskning af tale " Intonograph ". Samtidig forskede laboratoriet i metoder til automatisk at fremhæve fonetiske træk ved talelyde, såsom "støjende", "stemme", "vokal", "eksplosiv". På deres grundlag blev der for første gang i USSR udviklet en enhed til genkendelse af talekommandoer " Sesam-1 ", som blev tildelt sølvmedaljen fra VDNKh fra USSR [11] .

I anden halvdel af 1960'erne deltog B. M. Lobanov i at løse det grundlæggende problem med talegenkendelse forbundet med ikke-lineære forvrængninger af tidsaksen i processen med at udtale talelyde. Denne form for forvrængning skabte betydelige vanskeligheder ved at sammenligne talte ord med deres standarder i processen med talegenkendelse. I 1968, uafhængigt og næsten samtidigt, foreslog G.S. Slutsker ( Moscow State Research Institute of Radio ) og T.K. Vintsyuk ( Institut for Cybernetics of the Academy of Sciences of the Ukrainian SSR ) at bruge den dynamiske programmeringsmetode (DP-metoden) til at løse dette problem [11] . I 1969 publicerede B. M. Lobanov i samarbejde med G. S. Slutsker en artikel, hvori videreudviklingen af ​​DP-metoden blev givet til et yderst vigtigt praktisk tilfælde, hvor grænserne for et anerkendt ord er ukendte, det vil sige at løse problemet med detektering og genkendelse af lydkombinationer i kontinuerligt stemmesignal. DP-metoden blev efterfølgende bredt anerkendt af udenlandske forskere [12] .

Det næste år efter det vellykkede forsvar af sin afhandling, i november 1969, blev B. M. Lobanov sendt til et videnskabeligt praktikophold i en periode på 10 måneder i Storbritannien . B. M. Lobanov havde et praktikophold på problemerne med analyse af talesignaler under vejledning af professor K. Cheri ved Imperial College of Science and Technology ( London ), og om problemerne med talesyntese - under vejledning af professor R. Lorenz kl. University of Edinburgh [12] .

Efter at have gennemført et praktikophold i Storbritannien var hovedretningen for B. M. Lobanovs videnskabelige arbejde udviklingen af ​​metoder og apparater til talesyntese fra tekst. Selv under sit praktikophold på University of Edinburgh udførte han vellykkede eksperimenter med syntese af russiske talelyde, som gjorde det muligt at lægge grundlaget for formant talesyntese ud fra en fonemisk tekst. Som et resultat, allerede i 1972, under ledelse af B. M. Lobanov, blev den første i USSR synthesizer af russisk tale " Fonemofon-1 " udviklet, som blev tildelt to medaljer af VDNKh i USSR [12] . " Fonemofon " var i stand til ikke kun at syntetisere russisk tale, men også at læse den indtastede tekst på flere fremmedsprog, samt at syntetisere sang [13] .

I 1973 blev B. M. Lobanov tildelt titlen " Seniorforsker ". I forbindelse med åbningsmulighederne for indførelse af taleteknologier i kommunikationsindustrien henledte ledelsen af ​​Moskva-afdelingen af ​​Central Research Institute of Communications (TsNIIS) opmærksomheden på B. M. Lobanovs arbejde med syntesen af ​​russisk tale. Som et resultat blev Laboratoriet for Talesystemer åbnet i 1974 på grundlag af Minsk-afdelingen for det centrale forskningsinstitut, ledet af B. M. Lobanov i de næste 15 år. Hovedretningen for laboratoriets arbejde var udviklingen af ​​metoder og skabelsen af ​​systemer til automatisk talegenkendelse og syntese, med fokus på deres praktiske anvendelse i industriens " Kommunikation " [14] .

Sammen med praktiske aktiviteter i skabelsen af ​​taledialogsystemer lagde B. M. Lobanov stor vægt på videnskabeligt og organisatorisk arbejde. I 1976 organiserede og afholdt han i Minsk All-Union School-Seminar " Automatic Recognition of Auditory Patterns " (ARSO), som blev overværet af mere end 200 deltagere fra 75 forskellige videnskabelige organisationer i USSR. ARSO-skoleseminaret blev afholdt regelmæssigt (hvert andet år) indtil 1991, og siden 1976 var B. M. Lobanov medlem af den permanente programkomité for ARSO. På seminaret blev deltagerne i ARSO i Minsk for første gang vist en prototype af et telefonforespørgselssystem med syntetiseret stemmesvar [15] .

I 1978, på invitation af franske videnskabsmænd, blev Lobanov sendt på en to-måneders forretningsrejse til Frankrig for videnskabeligt arbejde og fortrolighed med arbejdet i førende videnskabelige centre for taleforskning: universiteter i Paris , Nancy og Aix-en-Provence , samt talelaboratorier i Toulouse , Grenoble , Orsay og Lanion. Under sit ophold i Frankrig deltog Lobanov i en konference om stemmekommunikation og blev optaget som medlem af det akustiske samfund i frankofone lande [15] .

I 1979 præsenterede B. M. Lobanov på verdensudstillingen " Telecom-79 " i Genève en ny model af talesynthesizer - " Fonemofon-3 ", belønnet med et diplom fra udstillingen. Den berømte science fiction-forfatter Arthur Clark , efter at have besøgt USSR-pavillonen og stiftet bekendtskab med talesynthesizeren, skrev i gæstebogen: " Du forudså mine fantasier fra filmen" A Space Odyssey 2001 " [15] [16] , og Den schweiziske avis Obozrevatel offentliggjorde en artikel: " Nu lærer russere fremmedsprog med en computer, der taler ." For et sæt værker om skabelsen af ​​talesynthesizere i 1981 blev Lobanov tildelt titlen " Æres Radio Operator of the USSR " [15] .

Videnskabelig aktivitet i 80'erne

I begyndelsen af ​​1980'erne begyndte B. M. Lobanov at udvikle metoden til artikulatorisk-formant talesyntese foreslået af ham, som var grundlaget for en ny generation af talesynthesizere. I 1983 udgav B. M. Lobanov i samarbejde med V. Ya. Kucherov bogen " Syntetiseret tale i køsystemer " [17] .

I begyndelsen af ​​1984 skabte Lobanov den endelige formulering og gennemførte den teoretiske og eksperimentelle udvikling af en samlet linguoakustisk tilgang til løsning af problemet med talesyntese fra tekst. De udviklede metoder og algoritmer til deres implementering dannede grundlaget for hans doktorafhandling " Forskning og udvikling af metoder til automatisk talesyntese fra fonemisk tekst ", som Lobanov med succes forsvarede i 1984 ved Institute of Electronics and Computer Technology of Academy of Sciences den lettiske SSR i Riga . Senere blev de opnåede teoretiske og eksperimentelle resultater tilpasset til talesyntesesystemer på andre europæiske sprog. Især i 1987 blev der udviklet en engelsksproget version af synthesizeren, som blev demonstreret på World Congress of Phonetic Sciences og blev meget værdsat af engelsktalende eksperter [18] .

1980'erne var perioden for oprettelsen af ​​de første industrielle systemer til syntese og anerkendelse af tale og deres udbredte introduktion i kommunikationsindustrien i USSR med direkte deltagelse af B. M. Lobanov og hans kolleger - B. V. Panchenko, N. P. Degtyarev, V P Afanasiev. I Kaliningrad-softwaren blev der udført eksperimentelt design med efterfølgende serieproduktion af Mars-1 taleterminalen , som omfatter undersystemerne til talegenkendelse " Sesam " og talesyntese " Fonemofon ". På basis af Mars-1 taleterminalen blev der udviklet et system til automatisk at informere abonnenter på langdistancetelefonnetværk (AIAMTS) om gælden for opkald. AIAMTS-systemet blev med succes implementeret og drevet i lang tid i en række store byer: Minsk , Novosibirsk , Alma-Ata , Frunze , Petropavlovsk-Kamchatsky . Et andet system - et system til overvågning af parametrene for telefon- og radiostationers udstyr med hurtig meddelelse til vagtpersonale om problemer, der er opstået - blev indført på Minsk, Moskva og Zelenograd automatiske telefoncentraler såvel som på den hviderussiske republikanske radio relæstation RTS-5 [19] .

Laboratoriet for talegenkendelse og syntese

I 1988 sluttede B. M. Lobanov sig til Institut for Teknisk Kybernetik ved Akademiet for Videnskaber i BSSR på invitation af direktøren for instituttet V. S. Tanaev og ledede det nyoprettede Laboratory of Speech Recognition and Synthesis. Overførslen af ​​B. M. Lobanov til Institut for Teknisk Kybernetik faldt sammen med udseendet af de første personlige computere (PC), og laboratoriets arbejdsplaner omfattede emner relateret til at udstyre pc'er med taleinput-outputsystemer. Formantmetoden, som længe har spillet en nøglerolle i tale-til-tekst-systemer, var ikke egnet til dette formål på grund af behovet for en stor mængde realtidsberegning. I 1989 foreslog B. M. Lobanov en ny mikrobølgemetode (MW-metode) til syntese af talesignaler, hvor der i stedet for at beregne formantoscillationer blev brugt et forudforberedt sæt mikrobølger af et naturligt talesignal. Under vejledning af B. M. Lobanov blev MW-metoden implementeret af laboratoriemedarbejderen A. N. Ivanov i Fonemofon-5- synthesizeren . Kompaktheden af ​​dens software (kun 64 Kb) gjorde det muligt at udstyre den første IBM PC/XT og endda indenlandske pc'er EC-1840 med talesyntese . Talesynthesizeren har været efterspurgt i mange praktiske anvendelser af blinde brugere. Senere, på grundlag af MW-metoden, blev versioner til de tjekkiske og polske sprog udviklet, samt et autonomt enkeltbords talesyntesemodul, hvis ukrainske version fungerede i nogen tid på Kiev-metrolinjen [20 ] .

Akademiske grader og titler

Større publikationer

Monografier

Afhandlinger

Nogle artikler i tidsskrifter og konferenceartikler

Noter

  1. Belarusian Encyclopedia  (Belarusian) - Hviderussisk Encyclopedia opkaldt efter Petrus Brocki , 1996.
  2. Belarusian Encyclopedia = Belarusian Encyclopedia / Redkol. G.P. Pashkov og andre - Minsk : Hviderussisk encyklopædi opkaldt efter Petrus Brovka . - T. 9. - S. 80. - 560 s.
  3. Lobanov B. Historie og udvikling af talevidenskab og -teknologi i USSR  (engelsk)  // Eds. D. Mehnert, D. Kordon, M. Wolff Systemteori Signalverarbeitung Sprachtechnologie: Rüdiger Hoffmann zum 65. Geburtstag. - Dresden: TUDpress, 2013. - S. 327-338 . — ISBN 9783944331195 .
  4. Boris  Lobanov . ResearchGate . _ Hentet: 8. oktober 2018.
  5. B.M. Labanau  (hviderussisk) . Laboratorium for talegenkendelse og syntese . Hentet 8. oktober 2018. Arkiveret fra originalen 11. september 2018.
  6. Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 .
  7. Kunstig intelligens: kommunikationssystemer og ekspertsystemer, 1990 .
  8. Patenter af forfatteren LOBANOV BORIS MEFODIEVICH . " findpatent.ru ". Hentet: 8. oktober 2018.
  9. 1 2 3 4 5 Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. 7.
  10. Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. 3.
  11. 1 2 3 Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. otte.
  12. 1 2 3 Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. 9.
  13. Phonemophone - En menneskelig talesynthesizer skabt ved Institut for Kommunikation. 1976 . Hentet: 18. marts 2019.
  14. Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. 9-10.
  15. 1 2 3 4 Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. ti.
  16. Lobanov, B.M. Om russisktalende maskiners historie (Fra stemmen fra en robot til en personlig klon af en menneskelig stemme)  // Artificial Intelligence News. - Moskva , 2003. - Nr. 1 (55) . - S. 3-9 .
  17. Syntetiseret tale i køsystemer, 1983 .
  18. Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. 10-11.
  19. Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. elleve.
  20. Boris Methodievich Lobanov: i anledning af hans 70-års fødselsdag, 2008 , s. 11-12.
  21. Forskning og udvikling af metoder til automatisk talesyntese fra fonemisk tekst . " dslib.net ". Hentet 9. oktober 2018. Arkiveret fra originalen 30. juni 2018.

Litteratur