Lytt til den supernaturlige datamaskinstemmen Google bygger
DeepMind – Google-selskapet bak AlphaGo, den banebrytende 'Go'-spillende bot - er jobber med en ny talegenerator kalt WaveNet, og det høres veldig, veldig bra ut:
Vi er fortsatt ikke helt ute av den uhyggelige dalen med WaveNet, men det er definitivt en forbedring i forhold til de tidligere talegenereringsmetodene, den sammenkjedede metoden (bygge tale av korte, forhåndsinnspilte fraser) og den parametriske metoden (hvor tale genereres basert på en eksisterende modell). I følge DeepMind:
WaveNet endrer dette paradigmet ved å direkte modellere den rå bølgeformen til lydsignalet, en prøve om gangen. I tillegg til å gi mer naturlig klingende tale, betyr bruk av rå bølgeformer at WaveNet kan modellere alle slags lyd, inkludert musikk.
Her er en sammenligning av de tre metodene:
Selvfølgelig, siden WaveNet ikke er begrenset til tale, prøvde DeepMind seg med musikk etter å ha matet den med en haug med klassisk pianomusikk:
Les mer om hvordan WaveNet fungerer på DeepMind sin blogg .
[ DeepMind ]
I slekt:
To chatbots som snakker med hverandre er helt grusomt
Dan Fallon er Delfins sjefredaktør.