Lytt til den supernaturlige datamaskinstemmen Google bygger

Artikler

DeepMind – Google-selskapet bak AlphaGo, den banebrytende 'Go'-spillende bot - er jobber med en ny talegenerator kalt WaveNet, og det høres veldig, veldig bra ut:

Vi er fortsatt ikke helt ute av den uhyggelige dalen med WaveNet, men det er definitivt en forbedring i forhold til de tidligere talegenereringsmetodene, den sammenkjedede metoden (bygge tale av korte, forhåndsinnspilte fraser) og den parametriske metoden (hvor tale genereres basert på en eksisterende modell). I følge DeepMind:



WaveNet endrer dette paradigmet ved å direkte modellere den rå bølgeformen til lydsignalet, en prøve om gangen. I tillegg til å gi mer naturlig klingende tale, betyr bruk av rå bølgeformer at WaveNet kan modellere alle slags lyd, inkludert musikk.

Her er en sammenligning av de tre metodene:

Selvfølgelig, siden WaveNet ikke er begrenset til tale, prøvde DeepMind seg med musikk etter å ha matet den med en haug med klassisk pianomusikk:

Les mer om hvordan WaveNet fungerer på DeepMind sin blogg .

[ DeepMind ]

I slekt:

To chatbots som snakker med hverandre er helt grusomt

Dan Fallon er Delfins sjefredaktør.