Googleov AI trenira prepoznavanje glasova u gomili

Agencija
Googleov AI trenira prepoznavanje glasova u gomili

Vizija kompanije Google na polju procesiranja se poboljšavala tokom godina, što potkrepljuje činjenica da njihova Photos aplikacija prepoznaje lica, objekte i još mnogo toga. Sada Google želi isto da uradi i sa glasom. Preciznije, sa audio-vizuelnim razdvajanjem govora.

Recimo da se nalazite u gomili ljudi i pozove vas poznata osoba. Iako možda ne znate gdje se vaš prijatelj/-ica nalazi u toj gomili, njegov/njen glas ima određeni obrazac koji možete odmah da prepoznate, bez obzira na bučne ljude oko vas. Mašina možda neće moći da to čini efikasno, bar u trenutno popularnim servisima.

Međutim, istraživači Googlea su razvili sistem dubokog učenja koji može da razdvoji glasove gledajući lica osoba kada one govore i potom se može fokusirati na te glasove. Tim je uspio ovo da postigne obučavanjem "neural networka" da prvo razumije i prepoznaje pojedinačne glasove ljudi kada su oni pričali sami.

Zatim je simulirao virtuelne strane i ubacio indiviudualne glasove u ovo, kako bi istrenirao AI da nauči da izoluje više glasova u odvojene segmente.

Prema navodima iz Googlea, tehnika podrazumijeva kombinovanje audio i vizuelnih signala za video ulaz, kako bi se govor razdvojio. Kombinacija vizuelnog elementa, zajedno sa zvukom, za razliku od pukog razdvajanja zvuka, pomaže u odvajanju i pročišćavanju govora povezanog sa određenim vidljivim govornikom u videu.

Ovo može biti korisno tokom komunikacije preko video četa. Google trenutno istražuje mogućnosti testiranja ove funkcije u svojim proizvodima kao što su Habgouts i Duo, prenosi Benchmark.

Google takođe vjeruje da bi ova tehnologija mogla da pomogne kod automatskih zatvorenih sistema za snimanje, gdje se više govornika međusobno preklapa. Može da se koristi i kao pred proces za prepoznavanje govora. Alatka, takođe, može i bude zloupotrebljena i da se koristi u javnom prisluškivanju.

Pratite nas na našoj Facebook i Instagram stranici i Twitter nalogu.

© AD "Glas Srpske" Banja Luka, 2018., ISSN 2303-7385, Sva prava pridržana