Waarom A.I. Kan moeite hebben om Arabisch te begrijpen

$config[ads_kvadrat] not found

BETER GA JE BEGINNEN TE GAAN BEGRIJPEN DE GRONDWET | #1

BETER GA JE BEGINNEN TE GAAN BEGRIJPEN DE GRONDWET | #1
Anonim

In de wereld van kunstmatige intelligentie zijn gegevens koning. Hoe meer u heeft, des te beter uw gereedschappen worden naarmate systemen beter kunnen 'leren' wat u kunt verwachten. Maar afhankelijk van het platform heeft de A.I. is het tekenen van gegevens van, sommige talen kunnen beter worden weergegeven dan andere, volgens Miriam Redi, een onderzoeker voor Yahoo Labs.

"Zoals bijvoorbeeld Flickr, waar we onze gegevens uithalen, zijn sommige talen zeer weinig vertegenwoordigd", zei Redi op donderdag tijdens de Deep Learning Summit in Londen. "Dus we hebben Engels, miljoenen afbeeldingen voor Engels, maar we hebben misschien 100.000 voor Arabisch."

Het team van Redi werkt aan een hulpmiddel dat niet-zichtbare elementen voor afbeeldingen kan identificeren, zoals culturele waarden en emotionele connotaties. Het hulpprogramma analyseert de tekst die is gekoppeld aan openbaar beschikbare afbeeldingen op Flickr. In de loop van de tijd heeft de A.I. begint te begrijpen waarom iemand een afbeelding "happy party" of "awkward moment" kan taggen, maar deze ideeën zullen steeds nauwkeuriger worden naarmate de tool meer afbeeldingen analyseert.

"Helaas is de nauwkeurigheid voor het detecteren van sentimenten in afbeeldingen voor Arabische talen meestal lager omdat we niet genoeg gegevens hebben," zei Redi.

In de talen die grotere hoeveelheden gegevens hadden, merkte Redi's team een ​​paar interessante patronen op. Romaanse talen zoals Frans en Spaans hadden de neiging om zich op soortgelijke manieren uit te drukken, terwijl het Italiaans de enige taal leek waarin gebruikers beelden identificeerden met de term 'belastingontwijking'.

Taalbarrières blijven nog steeds een probleem voor A.I. onderzoekers. Iedereen die Google Translate heeft gebruikt, weet dat schakelen tussen talen nooit zo eenvoudig is als het klinkt. Nieuwe ontwikkelingen veranderen echter dingen. Facebook kondigde deze zomer aan dat het dichterbij zijn droom van een eentalig sociaal netwerk kwam, waarbij automatisch teksten voor gebruikers werden vertaald.

Ontwikkelingen bij het wegnemen van taalbarrières kunnen de internationale communicatie helpen bevorderen, maar voor projecten zoals Redi's is er geen echte vervanging voor door mensen gegenereerde sentimentgegevens.

$config[ads_kvadrat] not found