Jakarta, Gizmologi – Google terus meningkatkan kemampuan dari layanan Google Translate miliknya. Kini aplikasi tersebut sudah bisa menterjemahkan lebih dari 108 bahasa, termassuk 300 juta dialek yang digunakan orang di seluruh dunia.
Sejak pertama kali diperkenalkan pada 201, Google Translate telah mengalami berbagai peningkatan dan kemampuan hingga melakukan transkrip teks secara real-time. Google Translate juga dapat memproses lebih dari 100 miliar kata per hari.
Terbaru dalam ajang Google I/O, raksasa teknologi itu menambah 24 bahasa lagi ke dalam kemampuan terjemahannya. Per saat ini, Google mendukung 133 bahasa yang digunakan di seluruh dunia, termasuk di antaranya adalah Bahasa Sansekerta.
“Seperti Mizo yang dituturkan oleh orang-orang di timur laut India dengan sekitar 800.000 orang, hingga bahasa dunia yang sangat besar seperti Lingala yang dipakai oleh sekitar 45 juta orang di seluruh Afrika Tengah,” kata Research Scientist Google Translate, Isaac Caswell, dikutip dari Techcrunch.
Dia mengatakan bahwa selain bahasa asli Amerika, Google Translate juga akan mendukung dialek asing dalam bahasa Inggris seperti Krio dari Sierra Leone. Google mengklaim model bahasa ini bisa menambah ragam kosa kata yang dapat diterjemahkan ke bahasa lain.
Di sisi lain, Google juga memilih kumpulan bahasa baru agar mendukung pencarian bahasa dengan populasi yang sangat besar tapi tidak terlayani, seperti di benua Afrika dan India. Mereka juga ingin menambahkan bahasa asli yang kerap diabaikan teknologi.
“Beberapa tahun lalu, teknologi masih belum memungkinkan menambah bahasa seperti ini, yang kami sebut sebagai sumber daya rendah. Artinya, tidak banyak sumber teks di luar sana untuk mereka,” ujar dia.
Hal ini dapat direalisasikan berkat teknologi baru yang digunakan Google, yakni Zero-Shot Machine Translation, kini menerjemahkan bahasa itu menjadi lebih mudah. Caswell mengatakan kalau teknologi ini telah dilatih dalam 100 bahasa berbeda dengan terjemahannya.
“Selain itu ia dapat melihat teks dalam 1.000 lebih bahasa yang tidak diterjemahkan,” katanya.
Terakhir kali Google menambahkan sejumlah besar bahasa ke layanan Translate-nya pada 2020 ketika perusahaan memperbarui layanannya untuk mendukung mesin pencarian di wilayah Kinyarwanda, Odia, Tatar, Turkmenistan, dan Uyghur.
Diperkirakan masih ada lebih dari 7.151 bahasa lisan secara global yang belum diterjemahkan. Hal ini membuat Google terus berupaya untuk menambahkan kosa kata baru, agar dapat membantu orang berkomunikasi dalam situasi di mana mereka tidak dapat melakukannya.
Berikut 24 bahasa baru di Google Translate:
1. Assamese, digunakan sekitar 25 juta orang di India timur laut
2. Aymara, digunakan sekitar 2 juta orang di Bolivia, Cile dan Peru
3. Bambara, digunakan sekitar 14 juta orang di Mali
4. Bhojpuri, digunakan sekitar 50 juta orang di India sebelah utara, Nepal, dan Fiji
5. Dhivehi, digunakan sekitar 300 ribu orang di Maladewa
6. Dogri, digunakan sekitar 3 juta orang di India utara
7. Ewe, digunakan sekitar 7 juta orang di Ghana dan Togo
8. Guarani, digunakan sekitar 7 juta orang di Paraguay dan Bolivia, Argentina dan Brasil
9. Ilocano, digunakan sekitar 10 juta orang di Filipina sebelah utara
10. Konkani, digunakan sekitar 2 juta orang di India bagian tengah
11. Krio, memiliki sekitar 4 juta penutur di Sierra Leone
12. Kurdi (Sorani), dituturkan leh sekitar 15 juta orang di Irak dan Iran
13. Lingala, digunakan oleh sekitar 45 juta orang di Republik Demokratik Kongo, Republik Kongo, Republik Afrika Tengah, Angola dan Republik Sudan Selatan
14. Luganda, digunakan oleh sekitar 20 juta orang di Uganda dan Rwanda
15. Maithili, digunakan oleh sekitar 34 juta orang di India utara.
16. Meiteilon (Manipuri), digunakan oleh sekitar 2 juta orang di India sebelah timur laut.
17. Mizo, digunakan oleh sekitar 830 ribu orang di India timur laut
18. Oromo, digunakan oleh sekitar 37 juta orang di Etiopia dan Kenya
19. Quechua, digunakan oleh sekitar 10 juta orang di Peru, Bolivia, Ekuador, dan negara-negara sekitarnya
20. Sansekerta, dituturkan oleh sekitar 20 ribu orang di India
21. Sepedi, dituturkan oleh sekitar 14 juta orang di Afrika Selatan
22. Tigrinya, digunakan oleh sekitar delapan juta orang di Eritrea dan Ethiopia
23. Tsonga, memiliki sekitar 7 juta penurut di Eswatini, Mozambik, Afrika Selatan, dan Zimbabwe
24. Twi, digunakan oleh sekitar 11 juta orang di Ghana
from Gizmologi https://ift.tt/WJrHd9E
via IFTTT
0 Komentar