Google's DeepMind AI Just Taught Itself To Walk
Kunstmatige intelligentie maakte robotstemmen gewoon veel realistischer.
DeepMind, dat eerder de kracht van A.I. door in Go een menselijke speler te verslaan in maart en zijn energierekening in juli te halveren, is nu gericht op spraaksynthese.
De A.I-onderzoeksgroep, onderdeel van Google-moederbedrijf Alphabet, heeft vanochtend bekendgemaakt dat het een nieuwe technologie genaamd WaveNet heeft gemaakt die kan worden gebruikt om spraak, muziek en andere geluiden nauwkeuriger dan voorheen te genereren.
DeepMind legt uit dat veel bestaande spraaksynthesemethoden afhankelijk zijn van "een zeer grote database van korte spraakfragmenten wordt opgenomen vanuit een enkele luidspreker en vervolgens opnieuw gecombineerd om complete uitingen te vormen." WaveNet gebruikt daarentegen de "onbewerkte golfvorm van het audiosignaal" "Om meer realistische stemmen en geluiden te creëren.
Dit betekent dat WaveNet werkt met de individuele geluiden die worden gecreëerd wanneer een mens spreekt in plaats van volledige lettergrepen of volledige woorden te gebruiken. Die geluiden worden vervolgens door een "computationeel duur" proces geleid dat DeepMind "essentieel voor het genereren van complexe, realistisch klinkende audio" met machines heeft gevonden.
Het resultaat van al dat extra werk is een verbetering van 50 procent ten opzichte van gesynthetiseerde spraak in het Engels van de VS en Chinees. Hier is een voorbeeld van spraak die is gegenereerd met behulp van parametrische tekst-naar-spraak, die tegenwoordig algemeen is, gebruikt door DeepMind om aan te tonen hoe deze spraaksynthesemethode ontbreekt:
En hier is een voorbeeld van dezelfde zin die is gegenereerd door WaveNet:
Naarmate bedrijven hun werk aan natuurlijke taalinterfaces voortzetten, zal het aanbieden van meer realistisch klinkende antwoorden steeds belangrijker worden. WaveNet kan dat probleem helpen oplossen.
Testangst: Stressvermindering kan de kloof tussen sociaaleconomische prestaties verkleinen
Voor sommigen is de angst van de testdag zo groot dat het de prestaties ernstig kan beïnvloeden. In hun nieuwe paper stellen psychologen van Stanford twee manieren voor waarop studenten hun angstgevoelens kunnen beheersen, waarvan ze denken dat ze vooral effectief zijn voor studenten met een laag inkomen.
De vrouw die vóór president kon stemmen voordat vrouwen konden stemmen
Vorige maand luisterde ik naar een podcast met de naam Laura House At Large, waar een komiek uit LA en een gast zich verdiept in leuke diepe duiken, en in de aflevering met gastroutine Riley Silverman brachten ze iets uit de Amerikaanse geschiedenis naar me op dat me in de oren klopte en stuurde Ik heb mijn eigen konijnenhol van onderzoek. Dit is een van de ...
Orka's bootsen menselijke stemmen en andere walvissen na in vreemde opname
Je hebt misschien gehoord dat papegaaien menselijke woorden nabootsen, maar wetenschappers zeggen dat een orka (Orcinus-orka) de geluiden van een andere orka en een mens kan nabootsen.