Er komen steeds meer apparaten die je moet bedienen met je stem. De vertaalapp van Google kan zelfs naar meerdere talen tegelijk luisteren, waarbij hij herkent welke taal er wordt gesproken. Hoe gaat dat dan in zijn werk?
Het geluid van je stem bestaat uit trillingen die door de lucht reizen. Die trillingen worden door je stembanden geproduceerd, en opgevangen door de microfoon van je smartphone. Daar worden de trillingen omgezet in elektrische stroompjes. Deze signalen worden snel naar de supersnelle computers van Google gestuurd. Die rekenen uit wat er waarschijnlijk is gezegd en sturen de tekst terug naar je mobiel.
Hoe begrijpen ze je
Maar hoe kunnen ze uit de signalen van je microfoon afleiden wat je hebt gezegd? Dat is een zeer ingewikkeld proces waar veel wiskunde en kansberekening bij komt kijken. Eerst worden de signalen opgeknipt in woorden. Dat kan doordat er tussen twee woorden een pauze zit. Daarna worden de klanken van elk woord afzonderlijk bepaald. Deze klanken worden vergeleken met klanken uit een gigantische bibliotheek waarvan bekend is welk woord ze betekenen.
Vervolgens wordt er gekeken hoe logisch het is dat twee herkende woorden achter elkaar worden gebruikt. Dat kan de computer weten aan de hand van eerder ingesproken zinnen. Als de combinatie erg onlogisch is, gaat hij op zoek naar twee woorden die ongeveer hetzelfde klinken, maar veel vaker achter elkaar zijn gebruikt. Vervolgens controleert hij op eenzelfde manier of de hele zin logisch is opgebouwd. En dat allemaal in een fractie van een seconde!
Dit Weetje komt uit de Weet Scheurkalender 2021. Wil je meer van dit soort weetjes lezen? Neem dan een abonnement op Weet Magazine!