Microsoft Research ontwikkelt een beter-dan-menselijke spraakherkenning

$config[ads_kvadrat] not found

How Microsoft does Zero Trust

How Microsoft does Zero Trust
Anonim

Microsoft is 's werelds eerste bedrijf geworden dat spraakherkenningssoftware ontwikkelt die nauwkeuriger is dan mensen. In de paper "Achieving Human Parity in Conversational Speech Recognition", gepubliceerd op maandag, produceerde de software transcripten die een half procent minder fouten bevatten dan menselijke inspanningen, wat ongelooflijk is, gelet op hoe goed mensen zijn in het begrijpen van spraak. De doorbraak opent de deur voor nieuwe A.I. assistenten die nauwkeuriger zijn dan ooit tevoren.

Het is indrukwekkend hoe ver de technologie in zo'n korte tijd is gekomen. Het was niet zo heel lang geleden dat computer spraakherkenning een rare niche was die hopeloos ver weg leek. Bekijk deze demonstratie van de spraaksoftware van Windows Vista uit 2006:

Het team gebruikte de test van het National Institute of Standards and Technology (NIST) 2000, die in de industrie wordt gebruikt om de betrouwbaarheid van spraaktranscripties te meten. Een gesprek vindt telefonisch plaats tussen twee deelnemers, beurtelings, voordat het resulterende script wordt vergeleken en vergeleken met woordenboekspelling.

In het gedeelte van het schakelbord, waar twee vreemden voor de eerste keer spreken, is het menselijke foutenpercentage ongeveer 5,9 procent, terwijl op het gedeelte van de oproep thuis, waar twee mensen die elkaar kennen, het foutenpercentage ongeveer 11,3 procent is. De software van Microsoft scoorde rond een 0,4 procent lager foutenpercentage.

De doorbraak zal nieuwe vormen van meeslepende A.I. helpen brengen. In augustus nam student Joshua Browder de wraps van zijn DoNotPay-chatbot, waarmee daklozen gratis juridisch advies kunnen krijgen. Gecombineerd met herkenningsvoortgangen is het gemakkelijk om een ​​toekomst voor te stellen waarin mensen een virtuele assistent om hulp vragen bij huisvesting door regelmatig een gesprek met hun computer te voeren.

In dit stadium overwegen onderzoekers hoe A.I.-gevoede spraakherkenning slimmere antwoorden kan geven. Sensay, een woede-detecterende A.I. van het laboratorium achter Siri, gebruikt geavanceerde herkenningsmogelijkheden om te detecteren of een gebruiker zich boos of verward voelt, en zijn antwoorden aanpassen aan de situatie. Het verwijderen van de barrière van foutgevoelige spraakherkenning creëert spannende nieuwe kansen voor virtuele hulp.

$config[ads_kvadrat] not found