Google Translate krijgt 24 nieuwe talen met ‘Zero-Shot Machine Translation’

Google Translate kan nu woorden, zinnen en hele websites vertalen in 133 talen. De zoekgigant gebruikt een Zero-Shot machinevertalingstechniek die kan vertalen zonder zelfs maar naar een voorbeeld te kijken, waardoor het proces enorm wordt versneld.

Google heeft 24 talen toegevoegd aan Translate. Dit betekent dat Google Translate nu vertalingen biedt voor 133 talen. Google beweert dat meer dan 300 miljoen mensen deze nieuw toegevoegde talen spreken.

Verschillende nieuw toegevoegde talen zijn geboren uit Zero-Shot machinevertaling , een machine learning-model dat alleen eentalige tekst ziet . Simpel gezegd, Google heeft een algoritme ontwikkeld dat in een andere taal kan vertalen zonder zelfs maar een voorbeeld te zien.

Zoals bij elke vertaling zijn deze nieuw toegevoegde talen niet perfect en zullen er wat haperingen zijn. Google erkende dit, maar verzekerde dat de vertalingen zouden verbeteren. Google heeft al een team van native speakers, professoren en taalkundigen die continu bijdragen aan het Google Translate-platform.

Hier is de volledige lijst met nieuwe talen die nu beschikbaar zijn op Google Translate:

  • Assamees: Gebruikt door ongeveer 25 miljoen mensen in Noordoost-India.
  • Aymara: gebruikt door ongeveer twee miljoen mensen in Bolivia, Chili en Peru.
  • Bambara: gebruikt door ongeveer 14 miljoen mensen in Mali.
  • Bhojpuri: Gebruikt door ongeveer 50 miljoen mensen in Noord-India, Nepal en Fiji.
  • Dhivehi: Gebruikt door ongeveer 300.000 mensen op de Malediven.
  • Dogri wordt gebruikt door ongeveer drie miljoen mensen in Noord-India.
  • Schapen: gebruikt door ongeveer zeven miljoen mensen in Ghana en Togo.
  • Guarani: gebruikt door ongeveer zeven miljoen mensen in Paraguay en Bolivia, Argentinië en Brazilië.
  • Ilocano: gebruikt door ongeveer 10 miljoen mensen in de noordelijke Filipijnen.
  • Konkani: gebruikt door ongeveer twee miljoen mensen in Centraal-India.
  • Krio: gebruikt door ongeveer vier miljoen mensen in Sierra Leone.
  • Koerdisch (Sorani): Gebruikt door ongeveer acht miljoen mensen, voornamelijk in Irak.
  • Lingala: Gebruikt door ongeveer 45 miljoen mensen in de Democratische Republiek Congo, de Republiek Congo, de Centraal-Afrikaanse Republiek, Angola en de Republiek Zuid-Soedan.
  • Luganda: Gebruikt door ongeveer 20 miljoen mensen in Oeganda en Rwanda.
  • Maithili: Gebruikt door ongeveer 34 miljoen mensen in Noord-India.
  • Meiteilon (Manipuri): Gebruikt door ongeveer twee miljoen mensen in Noordoost-India.
  • Mizo: gebruikt door ongeveer 830.000 mensen in Noordoost-India.
  • Oromo: Gebruikt door ongeveer 37 miljoen mensen in Ethiopië en Kenia.
  • Quechua: gebruikt door ongeveer 10 miljoen mensen in Peru, Bolivia, Ecuador en aangrenzende landen.
  • Sanskriet: Gebruikt door ongeveer 20.000 mensen in India.
  • Sepedi: gebruikt door ongeveer 14 miljoen mensen in Zuid-Afrika.
  • Tigrinya: gebruikt door ongeveer acht miljoen mensen in Eritrea en Ethiopië.
  • Tsonga: gebruikt door ongeveer zeven miljoen mensen in Eswatini, Mozambique, Zuid-Afrika en Zimbabwe.
  • Twi: Gebruikt door ongeveer 11 miljoen mensen in Ghana.

Het is interessant om op te merken dat de meeste nieuwe talen niet wereldwijd worden gesproken. Maar veel gebruikt in sommige lokale regio’s. Dit kan de alfabetiseringsgraad in onderontwikkelde delen van de wereld helpen verbeteren. Bovendien werden in de oudheid talen zoals het Sanskriet gebruikt. Dit kan velen helpen om oude geschriften te vertalen met Google Translate.