NATIVZEN.com – Samsung mempelopori dalam pengembangan pengalaman premium dengan mobile AI. Ini dikembangkan oleh Samsung di pusat penelitiannya di seluruh dunia, sehingga akhirnya lahir Galaxy AI yang mampu memaksimalkan potensi yang dimilikinya.
Galaxy AI saat ini mendukung 16 bahasa, sehingga lebih banyak orang dapat meningkatkan kemampuan berbahasa yang dimiliki secara langsung, berkat fitur on-device translation seperti Live Translate, Interpreter, Note Assist, dan Browsing Assist.
Namun, apa saja yang dilibatkan dalam pengembangan bahasa dalam AI? Seri ini akan mengeksplorasi tantangan dalam pengembangan mobile AI dan bagaimana mengatasinya. Oleh karena itu, mari kita gali secara langsung dari tim Samsung R&D Institute Indonesia (SRIN).
Seperti dikatakan oleh Junaidillah Fadlil, Head of AI di SRIN bahwa AI yang hebat dimulai dari dua hal, yakni data yang berkualitas dan relevan. Setiap bahasa menuntut cara yang berbeda untuk memproses data.
Dilanjutkan oleh Fadlil bahwa timnya juga menggali lebih dalam untuk memahami kebutuhan linguistik dan keunikan dari Bahasa Indonesia. Saat ini bersama timnya, Junaidillah juga telah menambahkan dukungan Bahasa Indonesia di Galaxy AI.
“Pengembangan bahasa lokal harus didasarkan pada pemahaman dan ilmu pengetahuan, sehingga penambahan bahasa ke Galaxy AI dimulai dengan merencanakan informasi yang dibutuhkan oleh tim kami secara legal dan etis,” tambahnya.
Fitur-fitur Galaxy AI seperti Live Translate menjalankan tiga proses inti, yakni pengenalan ucapan otomatis (automatic speech recognition/ASR), mesin terjemahan (neural machine translation/NMT), dan teks-ke-suara (text-to-speech/TTS).
Masing-masing proses tersebut memerlukan kumpulan informasi yang unik. Automatic Speech Recognition, misalnya, membutuhkan rekaman suara yang mencakup beragam situasi di berbagai kondisi, dan setiap rekaman dilengkapi transkripsi teks yang akurat.
“Tidak cukup hanya menambahkan suara lalu lintas jalan raya ke rekaman. Selain data yang kami peroleh secara legal dari pihak ketiga, kami harus pergi ke kafe atau lingkungan kerja untuk merekam suara kami sendiri,” ucap Muchlisin Adi Saputra, pemimpin tim ASR.
Hal yang dilakukan oleh Saputra bersama timnya ini memungkinkan mereka untuk bisa menangkap suara-suara autentik yang unik dari kehidupan sehari-hari, seperti orang yang sedang memanggil atau ketikan keyboard.
Sifat bahasa yang dinamis dan selalu berubah juga harus dipertimbangkan. Seperti ditambahkan Saputra bahwa mereka perlu terus memperbarui bahasa slang terbaru dan cara penggunaannya. Ini banyak mereka temukan dari media sosial.
Dalam pengembangannya, Neural Machine Training juga membutuhkan data untuk melatih terjemahan. Oleh karena itu, Muhammad Faisal, pemimpin Tim NMT mengakui bahwa menerjemahkan Bahasa Indonesia itu penuh dengan tantangan.
“Penggunaan makna kontekstual serta implisit yang luas bergantung pada petunjuk sosial dan situasional. Data yang digunakan harus berisi banyak teks terjemahan sebagai referensi bagi AI untuk memahami kata-kata baru, kata-kata asing, kata benda, dan angka,” ucap Faisal.
Semua informasi dibutuhkan untuk membantu AI memahami aturan komunikasi. Sementara itu, Text To Speech (TTS) memerlukan rekaman yang melibatkan berbagai macam suara dan nada, dengan konteks tambahan tentang bagaimana setiap kata terdengar dalam situasi yang berbeda.
“Rekaman suara yang baik mempercepat pekerjaan yang dilakukan karena mencakup satuan bunyi terkecil yang diperlukan AI untuk membedakan makna,” jelas Harits Abdurrohman, pemimpin pengembangan fitur TTS.
Ia juga menambahkan bahwa setelah mendapat rekaman suara yang baik pada fase awal, timnya dapat fokus pada tahap selanjutnya yaitu penyempurnaan model AI agar dapat mengucapkan setiap kata dengan jelas.
Lebih Kuat Bersama
Diperlukan sumber daya yang besar untuk bisa merencanakan pengembangan banyak data. Tentunya, tantangan yang dihadapi juga tidak mudah. Oleh karena itu, SRIN pun bekerja sama dengan para ahli linguistik di Indonesia.
“Tantangan ini membutuhkan kombinasi kreativitas, ketangkasan, dan keahlian dalam Bahasa Indonesia dan machine learning. Filosofi Samsung yang terus membuka ruang kolaborasi memainkan peran penting dalam menyelesaikan pekerjaan ini,” tambah Fadlil.
Berkolaborasi dengan sejumlah pusat penelitian Samsung di seluruh dunia juga membuat tim SRIN mampu dengan cepat mengadopsi praktik terbaik dan mengatasi tantangan kompleks dalam menetapkan target data.
Selain itu, kerja sama ini tidak hanya memajukan teknologi tetapi juga budaya. Misalnya, ketika tim SRIN bergabung dengan rekan-rekan di Bangalore, India, mereka mengamati tradisi lokal dan menjalin ikatan layaknya keluarga, dan membangun koneksi yang lebih dalam.
Tak kalah menarik, mereka juga harus piawai untuk mengembangkan pemahaman tentang kebudayaan yang berbeda-beda. Bagi tim, proyek penambahan Bahasa Indonesia pada Galaxy AI memiliki makna yang baru.
“Kami sangat bangga dengan pencapaian kami di sini karena hal ini adalah proyek AI pertama kami. Tentunya, ini bukan yang terakhir karena kami akan terus menyempurnakan dan meningkatkan kualitas model AI kami,” pungkas Fadlil.