Qualcomm dan sebuah perusahaan rintisan (startup) AI, Memories.ai, menjalin kerja sama untuk mewujudkan teknologi yang sangat dibutuhkan: kemampuan untuk mencari foto dan video yang tersimpan di dalam perangkat sebagai sumber informasi secara cepat.
Saat ini, kolaborasi tersebut berada pada tahap dasar untuk komersialisasi di masa depan. Memories.ai, bekerja sama dengan Qualcomm, telah memperkenalkan ‘LVMM 2.0’ (Large Visual Memory Models 2.0). Kedua perusahaan berencana untuk mengkomersialkan teknologi ini pada tahun 2026. Setelah itu, teknologi ini akan ditawarkan kepada pelanggan korporat yang mengembangkan aplikasi untuk ponsel pintar, headset, dan PC.
Memories.ai juga mempertimbangkan kemungkinan penerapan teknologinya pada aplikasi foto bawaan ponsel pintar, seperti Samsung Gallery, dengan model kerja sama untuk meningkatkan sistem manajemen gambar internal ponsel menggunakan AI.
AI Dirancang untuk Memulihkan Konteks Visual
Sean Shen, salah satu pendiri dan CEO Memories.ai, menjelaskan bahwa manusia sering kali tidak mengingat detail pasti dari sebuah pengalaman, tetapi petunjuk visual dapat menjadi kunci untuk membangkitkan ingatan tersebut. “Misalnya, satu foto hamburger yang Anda makan dua minggu lalu dapat memicu ingatan lengkap tentang ‘di mana, dengan siapa, dan apa yang Anda makan’. AI kami dirancang untuk memulihkan konteks melalui gambar,” jelasnya.
“Mesin sangat pandai mengenali hubungan antar kata atau data, tetapi kemampuannya untuk memahami hubungan antar gambar masih kurang. Itulah tantangan yang ingin dipecahkan oleh Memories.ai,” tambah Shen. “Pada akhirnya, ingatanlah yang akan menang.”
Teknologi Inti: Encoder dan Infrastruktur Pencarian
Teknologi inti yang sedang dikembangkan oleh Memories.ai terdiri dari dua bagian: ‘Encoder’ dan ‘Infrastruktur Pencarian’. Teknologi ini tidak bekerja dengan gambar atau video asli yang biasa dilihat pengguna. Sebaliknya, ia menciptakan dan menyimpan versi optimal dari media tersebut yang berfokus pada nilai informasinya.
Data yang telah diubah ini kemudian dikirim ke infrastruktur pencarian. Pengguna dapat memasukkan kueri dalam bahasa alami, seperti “Foto makan malam bersama teman-teman di Korea,” dan sistem akan menemukan gambar atau video yang sesuai dengan konteks tersebut. Memories.ai juga telah mendemonstrasikan teknologi yang mencakup kemampuan pencarian dan kueri bahasa alami untuk adegan di dalam video.
Fokus Ganda: Privasi Perangkat dan Interaksi Kueri
Pengembangan teknologi Memories.ai saat ini memiliki dua arah utama. Pertama, kolaborasi dengan Qualcomm difokuskan untuk memajukan fungsi pencarian foto dan video yang beroperasi langsung di dalam perangkat. Tujuannya adalah menciptakan ‘alternatif berorientasi privasi’ yang lebih cepat dan personal daripada Google Photos, tanpa bergantung pada cloud (komputasi awan). Mirip dengan cara beberapa aplikasi galeri ponsel menandai orang atau tempat secara otomatis, Memories.ai ingin AI menganalisis gambar secara real-time untuk menghasilkan tag instan.
Fungsi utama kedua adalah ‘antarmuka berbasis kueri’ yang memungkinkan interaksi seperti percakapan dengan AI. Mirip dengan layanan transkripsi suara Otter.ai, pengguna dapat mengajukan pertanyaan dalam bahasa alami tentang rekaman atau video tertentu.
“Anda bisa bertanya kapan terakhir kali pizza diantar, apakah ada hal mencurigakan yang terjadi di sekitar rumah, atau kapan anjing peliharaan Anda menjatuhkan vas bunga,” kata Shen. “AI dapat langsung menjawabnya berdasarkan file media pribadi yang direkam oleh kamera. Meskipun beberapa informasi ini mungkin ada di kalender atau email, kami percaya foto dan video menyimpan konteks yang jauh lebih kaya.”
Antusiasme Qualcomm Terhadap Komputasi Lokal
Vinesh Sukumar, Wakil Presiden Manajemen Produk dan Kepala AI Generatif di Qualcomm, menyatakan bahwa kolaborasi ini akan mewujudkan platform AI yang tidak hanya responsif tetapi juga memiliki kesadaran kontekstual. “AI ini akan mendukung kemampuan mengingat informasi visual jangka panjang, mengenali pola, dan beroperasi secara stabil bahkan di lingkungan dengan koneksi terbatas,” ujarnya.
Sumber internal di Qualcomm dilaporkan “sangat antusias” dengan kerja sama ini. Qualcomm melihat potensi teknologi Memories.ai tidak hanya untuk pencarian gambar, tetapi juga untuk pencarian di dalam video dan bahkan fungsi pengeditan video di masa depan. Keunggulan besar lainnya adalah model Memories.ai cukup ringan untuk dijalankan secara lokal di perangkat. Ini memungkinkan pencarian dilakukan tanpa koneksi cloud dan menghilangkan masalah latensi.
Meskipun tidak diungkapkan secara spesifik prosesor Qualcomm mana yang ditargetkan, Shen menjelaskan bahwa proses encoding akan berjalan di NPU (Neural Processing Unit) lokal, sementara proses pencarian dan kueri berjalan di CPU, mirip cara CPU mengambil data dari database.
AI Fisik Menjadi Tren, Aktuator Jadi Komponen Kunci Robot Humanoid
Sementara itu, di garis depan pengembangan AI lainnya, AI Fisik (Physical AI) kini menarik perhatian sebagai kecerdasan buatan generasi berikutnya. AI Fisik merujuk pada sistem otonom yang dapat mengenali, memahami, dan melakukan tindakan kompleks di dunia nyata. Wujud paling representatif dari AI Fisik adalah robot.
Untuk robot humanoid yang dapat bergerak seperti manusia, komponen intinya adalah ‘aktuator’, yang berfungsi sebagai sendi. Aktuator adalah perangkat penggerak utama yang mengubah energi (listrik, hidrolik, atau mekanis) menjadi gaya dan gerakan untuk menggerakkan sendi robot.
KETI dan HL Mando Jalin Kemitraan Strategis
Dalam upaya memajukan kinerja aktuator, Institut Teknologi Elektronik Korea (Korea Electronics Technology Institute/KETI) di bawah Kementerian Perdagangan, Industri, dan Energi Korea, telah bermitra dengan HL Mando. KETI mengumumkan pada tanggal 7 bahwa mereka telah menandatangani nota kesepahaman (MOU) dengan HL Mando di Robot Plus Test Field di Seoul, untuk kerja sama di bidang robot AI dan humanoid. Robot Plus Test Field adalah fasilitas publik yang dibuka Juli tahun lalu untuk memverifikasi kinerja robot dan teknologi yang sedang dikembangkan.
Fokus pada Peningkatan Kinerja dan Standardisasi
Dalam kemitraan ini, KETI akan berfokus pada peningkatan kelengkapan dan keandalan teknologi, termasuk desain sistem robot, sensor pintar, infrastruktur pengujian dan sertifikasi, serta algoritma intelijen dan kontrol. KETI juga akan membangun kerangka kerja demonstrasi dan standardisasi.
Di sisi lain, HL Mando akan memanfaatkan keahliannya di bidang elektrifikasi dan kontrol (motor, peredam, pengontrol) untuk memajukan teknologi inti aktuator robot. Ini termasuk desain rendah kebisingan, daya tahan tinggi, dan algoritma kontrol presisi tinggi.
Secara khusus, kedua pihak akan fokus pada peningkatan kinerja aktuator yang esensial untuk gerakan tingkat tinggi robot humanoid. Mereka akan mengembangkan teknologi kunci seperti desain efisiensi tinggi, algoritma cerdas, dan memastikan ketahanan terhadap lingkungan.
Jo Jin-woo, Wakil Presiden Eksekutif KETI, menyatakan, “Pengembangan teknologi inti robot humanoid melalui kerja sama industri-penelitian ini akan menjadi titik balik penting bagi kemandirian industri suku cadang robot domestik.”
Bae Hong-yong, CTO HL Mando, menambahkan, “Kami akan memperluas kompetensi inti kami di bidang elektrifikasi dan kontrol ke sektor robotika untuk mengamankan daya saing global dalam aktuator robot humanoid. Melalui kerja sama erat dengan KETI, kami akan mempercepat komersialisasi teknologi dan penciptaan ekosistem industri.”