CEO of controversial AI startup dismisses critics
Speechmatics gaat voor Google. De Britse startup haalde vorige maand de wraps van Automatic Linguist, een krachtige kunstmatige intelligentie die in een kwestie van dagen elke taal kan leren voor transcriptie van spraak naar tekst. Het team wil de technologie mogelijk maken voor elk van de ongeveer 7.000 talen in de wereld, met het potentieel om levens te veranderen.
Sinds de lancering van de linguist-tool werkt Speechmatics aan Omniglot, een uitdaging om elke dag een taal te bouwen. Vorige week sloeg het bedrijf een grote mijlpaal: het heeft Google officieel verslagen, met in totaal 72 unieke talen.
Het systeem gebruikt machinaal leren om audiogegevens te matchen met een transcriptietegenhanger. Het maakt dan gebruik van taalpatronen uit andere talen om het proces zo eenvoudig mogelijk te maken, de overeenkomsten tussen geluiden en grammaticale structuren te identificeren en toe te passen op nieuwe talen. Het proces is zeer effectief: het werk van Speechmatics aan Hindi kostte bijvoorbeeld slechts twee weken om een nauwkeurigheid van 80 procent te bereiken. Toen het eindproduct werd getest tegen de inspanningen van Google, maakte het 23 procent minder fouten.
omgekeerde sprak met Benedikt von Thüngen, CEO van Speechmatics, voor meer informatie.
Hoe zijn jullie team voor het eerst aan het project begonnen?
We begonnen het project Omniglot als een uitdaging voor onszelf - om te zien hoeveel talen we in zes weken zouden kunnen bouwen. We realiseerden ons enige tijd geleden dat de traditionele aanpak om elke taal afzonderlijk te bouwen niet langer haalbaar is als je snel wilt opschalen. Met dat in gedachten, moesten we heroverwegen wat een taal is, hoe het is gestructureerd en welke overeenkomsten er zijn tussen verschillende talen. We hebben een manier gevonden om die overeenkomsten te gebruiken om patronen te identificeren en ons AI-gevoede kader, Automatic Linguist (AL), te helpen talen sneller dan ooit te bouwen - 46 binnen zes weken om precies te zijn, of ongeveer één taal per dag gedurende zes weken !
Hoe verschilt dit van de inspanningen van Google?
Onze benadering van taalontwikkeling is een van de belangrijkste aspecten die ons van Google onderscheidt. Hoewel we ervan uitgaan dat ze hun talen individueel bouwen (of door wat we 'brute force' noemen), gebruiken we de kracht van A.I. om het taalopbouwproces te stroomlijnen en te versnellen. Bovendien, terwijl andere diensten zoals Google zich richten op het bouwen van dialecten in plaats van op unieke talen, zijn we trots om te zeggen dat onze inspanningen zijn gericht op unieke talen van over de hele wereld, inclusief gebieden die voorheen niet werden bediend door de grote technologiebedrijven.
Wat zijn enkele van de real-world applicaties hiervoor?
We hebben nu de technologie en kennis om onze service verder te reiken dan ooit tevoren en iedereen automatische spraakherkenning (ASR) te bieden. Dit is met name van belang in landen met lage alfabetiseringspercentages, waar de mogelijkheid om eerder niet beschikbare spraak-naar-teksttechnologie te gebruiken om communicatie te maken, het verschil kan maken voor mensen. Andere real-life gevallen waarin ASR-technologie kan helpen met kwesties van toegankelijkheid - mensen met gehoor en / of slechtzienden van over de hele wereld kunnen nu een apparaat gebruiken dat zo eenvoudig is als een telefoon om met degenen om hen heen te communiceren.
Verbetert dit de nauwkeurigheid van goed bedekte talen zoals Engels?
Naarmate we meer talen blijven ontwikkelen, heeft onze A.I. kader zal steeds beter in staat zijn om taalkundige kenmerken en patronen te identificeren. We zullen deze kennis gebruiken om onze huidige taalbasis, inclusief het Engels, verder te perfectioneren.
Kon dit iets verbeteren als de real-time vertaaltools van Google Pixel Buds?
We zien zeker projecten als Omniglot helpen om real-time vertaaltools in de toekomst te verbeteren. Naarmate er meer middelen worden geïnvesteerd in het uitbreiden van het bereik en de nauwkeurigheid van talen, zullen we een voortdurende verbetering in de sector vertaaldiensten zien.
Werkt dit met elke taal, zelfs geconstrueerde talen zoals Klingon?
We moeten nog proberen alle leugels te bouwen, maar we zien geen redenen waarom ze niet zouden werken. Aangezien deze talen nog steeds door mensen worden gesproken, volgen ze ook vergelijkbare structurele regels en beperkingen als alledaagse talen (zoals het aantal fonemen), wat AL genoeg gegevens zou geven voor een build.
Ben je open voor het project?
Nee, we hebben daar geen plannen voor.
Hoe werkt licentiering?
De talen aangeboden onder project Omniglot zijn gratis en kunnen niet worden gebruikt voor commerciële doeleinden. Als zodanig zal er binnen afzienbare tijd geen licentie aan hen zijn gekoppeld.
Wat zijn de volgende stappen vanaf hier?
Project Omniglot is nog maar het begin voor ons. We willen uiteindelijk elke taal ter wereld bouwen, dus we zullen hard werken aan dat doel!
Google's A.I. Verslaat Facebook in Race om te winnen tijdens het Ancient Game of Go
Iets voor middernacht in de Pacific op dinsdag lanceerde Mark Zuckerberg een preventieve aanval op zijn concurrentie bij Google met een uitspraak waarvan hij waarschijnlijk wist dat die fout was: "Het oude Chinese spel Go is een van de laatste games waar de beste menselijke spelers nog steeds kunnen spelen versla de beste kunstmatige intelligentie p ...
Science Fiction zal de superheldenindustrie consumeren en het genre worden dat verslaat
Superheldenfilms domineren het bespreekbureau langer dan iedereen redelijkerwijs had mogen verwachten en de halveringstijd van de trend is gegarandeerd. Een groep gemaskerde mannen en een handvol gemaskerde vrouwen hebben al het groene licht van de studiohoofden ontvangen. De rage van superhelden eindigt niet in de komende drie jaar omdat ...
Het Amerikaanse agentschap verslaat Elon Musk en Bill Gates tot 'Holy Grail' of Batteries
Draagbare elektrische apparaten - of het nu gaat om auto's, telefoons, hoverboards of iets anders dat niet met een draad is verbonden, worden beperkt door het vermogen van hun batterijen om energie op te slaan. De batterijtechnologie was lange tijd grotendeels stil - batterijen worden beter, maar alleen door de bestaande systemen voor energieopslag te maken m ...