Support Me Subscribe now!

You cannot copy content of this page

RoboCAT: Era Baru Kecerdasan Buatan yang bisa Belajar Sendiri

RoboCAT dan MineAisle: Keajaiban Kecerdasan Buatan yang Mengubah Permainan

RoboCAT: Era Baru Kecerdasan Buatan yang bisa Belajar Sendiri

Tiba-tiba, Google baru saja mengungkapkan model AI baru bernama RoboCAT sebagai kecerdasan buatan yang paling canggih di dunia berdasarkan AI umum dari DeepMind yang disebut Gato. Gato mampu melakukan lebih dari 600 tugas, merevolusi kecerdasan RoboCAT dengan kemampuannya untuk belajar jumlah tugas yang potensial tanpa batas dengan kecepatan yang semakin cepat.

Kecerdasan Luar Biasa dari RoboCAT

Namun, sebelum kita masuk ke dalam proses lima langkah yang penting yang menggerakkan kecerdasan umum RoboCAT, seberapa pintar sebenarnya AI baru ini dari Google? Pada intinya, RoboCAT menggabungkan kemajuan terbaru dalam transformer dan reinforcement learning, dibangun di atas dasar pendahulu multimodalnya, Gato, yang dikenal karena kemampuannya dalam memproses bahasa, gambar, dan tindakan di lingkungan simulasi dan fisik.

Kemampuan Unik RoboCAT

Apa yang membuat RoboCAT benar-benar luar biasa adalah kemampuannya untuk berkembang dari elemen-elemen dasar ini melalui perbaikan diri dan adaptasi dalam beberapa tugas dunia nyata dan lengan robotik. Di mana sebelumnya, robot telah diprogram untuk melakukan tugas-tugas spesifik dengan presisi. RoboCAT membuktikan bahwa robot tidak hanya dapat menjalankan tugas-tugas berbeda, tetapi juga bisa belajar, beradaptasi, dan memperbaiki diri dari berbagai kumpulan data.

Kapasitas Pembelajaran RoboCAT

Dengan kemampuan untuk memahami tugas baru dari hanya 100 demonstrasi, RoboCAT mendorong batas, menunjukkan potensi percepatan yang belum pernah terjadi sebelumnya dalam penelitian dan pengembangan robotika. Selain itu, fitur signifikan yang membedakan RoboCAT dari yang lain adalah proses perbaikan dirinya sendiri.

Related Posts

RoboCAT memulai dengan putaran pelatihan awal menggunakan kumpulan data besar gambar dan tindakan dari berbagai lengan robot yang melakukan ratusan tugas yang berbeda. Setelah putaran pelatihan pertama selesai, RoboCAT memulai siklus pelatihan perbaikan diri. Dan di sinilah RoboCAT menunjukkan keunikan yang khas.

Dalam siklus ini, RoboCAT mulai dengan mengumpulkan demonstrasi tugas baru menggunakan lengan robot yang dikendalikan manusia. Kemudian, ia menyempurnakan pembelajarannya untuk tugas baru ini, menciptakan agen khusus. Agen ini berlatih dalam tugas baru ini sekitar 10.000 kali, menciptakan sejumlah besar data pelatihan baru dalam prosesnya. Data baru ini kemudian diintegrasikan ke dalam kumpulan data pelatihan RoboCAT yang ada.

Siklus ini diselesaikan dengan versi baru RoboCAT yang dilatih dengan kumpulan data terbaru ini. Dalam perjalanan pelatihannya, RoboCAT telah menggunakan kumpulan data yang sangat beragam terdiri dari jutaan lintasan, baik nyata maupun simulasi. Empat jenis robot yang berbeda dan banyak lengan robotik telah dikerahkan untuk mengumpulkan data berbasis visi, menciptakan berbagai tugas bagi RoboCAT untuk belajar dan beradaptasi.

Keahlian RoboCAT

Hasilnya adalah robot yang mampu dengan cepat belajar mengoperasikan lengan robotik yang berbeda dan tugas-tugas dalam beberapa jam. Dengan mengamati 1.000 demonstrasi, RoboCAT menunjukkan kemampuannya untuk mengendalikan lengan robotik kompleks dengan genggaman tiga jari dan dua kali lebih banyak input yang dapat dikendalikan, berhasil mengambil gigi dengan tingkat keberhasilan 86%.

Lebih lanjut, RoboCAT menunjukkan kemampuannya dalam tugas-tugas yang membutuhkan presisi dan pemahaman, seperti memilih buah yang tepat dari mangkuk atau memecahkan teka-teki pencocokan. Yang benar-benar menarik dari perjalanan pembelajaran RoboCAT adalah siklus pelatihan yang penuh berkah yang ditempuhnya. Dengan setiap tugas baru yang dipelajari, RoboCAT menjadi lebih terampil dalam belajar tugas baru tambahan.

Pola ini mencerminkan cara manusia memperdalam pembelajaran dan keterampilannya seiring dengan mendapatkan pengalaman lebih banyak dalam suatu domain. Pola pembelajaran manusia ini yang membedakan RoboCAT. Pemurnian terus-menerus dari kemampuan RoboCAT adalah bukti kekuatan proses pelatihannya. Versi pertama RoboCAT, setelah belajar dari 500 demonstrasi per tugas, memiliki tingkat keberhasilan 36% pada tugas-tugas yang sebelumnya belum pernah dilihat.

Namun, versi terbaru yang dilatih dengan berbagai tugas lebih beragam lebih dari dua kali lipat tingkat keberhasilan pada tugas-tugas yang sama, dengan peningkatan ini hasil dari mengikuti proses pelatihan lima langkah RoboCAT. 

  1. Mengumpulkan 100 hingga 1.000 demonstrasi tugas baru menggunakan lengan robotik yang dikendalikan manusia. 
  2. Menyempurnakan RoboCAT pada tugas baru untuk menciptakan agen khusus. 
  3. Agen khusus berlatih dalam tugas baru ini sekitar 10.000 kali untuk menghasilkan lebih banyak data pelatihan. 
  4. Demonstrasi baru ini diintegrasikan dan data yang dihasilkan sendiri dimasukkan ke dalam kumpulan data pelatihan RoboCAT yang ada.
  5. Pelatihan versi terbaru RoboCAT pada kumpulan data pelatihan yang ditingkatkan ini. 

Urutan lima langkah ini yang diikuti dengan tekun tidak hanya membantu RoboCAT menguasai tugas-tugas baru, tetapi juga meningkatkan adaptabilitasnya dalam menggunakan perangkat robotik yang berbeda. Dalam intinya, kemampuan RoboCAT untuk pembelajaran mandiri dan perbaikan diri yang cepat menjanjikan loncatan menuju masa depan dengan generasi baru agen robotik tujuan umum yang lebih mampu.

Penerapan Hybrid Learning

Universe yang hidup dan kompleks ini membutuhkan sistem AI dengan kapasitas pembelajaran di luar metode reinforcement learning tradisional. Sebagai tanggapannya, OpenAI menggunakan pendekatan hibrida yang menggabungkan pembelajaran imitasi dari pemain manusia dengan reinforcement learning. Selanjutnya, dalam penelitian yang baru saja diterbitkan, OpenAI memperkenalkan metode pelatihan video pre (VP) key.

Teknik ini menggabungkan reinforcement learning tradisional dengan kekuatan pelatihan video yang ekstensif. Ini berarti memberi model AI hampir 70.000 jam video permainan mentah dan satu set video pemrosesan manusia yang lebih kecil. Melalui ini, model AI tidak hanya mengamati, tetapi belajar untuk memprediksi, meniru, dan akhirnya menguasai perilaku pemain manusia.

Melalui VPQ, OpenAI membangun model dasar yang dilatih untuk memprediksi tindakan masa depan dari input dan bingkai masa lalu. Diterapkan dalam Minecraft pada frame rate 20 Hertz dengan input mouse dan keyboard yang disimulasikan, model AI dengan mahir menunjukkan kemampuan nolnya dan kinerjanya dalam berbagai tugas kompleks hanya dengan data pelatihan video.

Pencapaian AI dalam Minecraft

Pencapaiannya sangat mengesankan, menciptakan meja dari batang kayu dalam waktu kurang dari 50 detik atau sekitar 1.000 tindakan, tugas yang membutuhkan waktu yang sama untuk pemain manusia rata-rata. Tidak hanya itu, model AI juga dilatih dalam permainan awal Minecraft. Ini menghasilkan peningkatan dalam kemampuannya di awal permainan, memungkinkannya untuk membuat alat-alat kayu dan batu, bahkan kadang-kadang menunjukkan keterampilan dasar seperti membangun tempat berlindung dan mencari desa.

Kemampuan Adaptasi dan Integrasi Voice Training

Rencana-rencana juga sedang dilakukan untuk eksperimen masa depan, termasuk pengumpulan hingga sejuta jam video pelatihan Minecraft untuk penyempurnaan tambahan. Ada juga uji coba awal yang menjanjikan dari integrasi pelatihan suara dengan pelatihan video, yang potensial memberikan beberapa kontrol atas agen AI. Selanjutnya, OpenAI percaya bahwa pendekatan ini dapat diperluas ke domain yang memerlukan keputusan berurutan dengan menggunakan jumlah besar data video yang tersedia secara bebas di internet.

Oleh karena itu, model VP yang disesuaikan dengan data tambahan dapat dijadikan dasar untuk agen AI menggunakan reinforcement learning dalam aplikasi lain. Secara keseluruhan, pembelajaran melalui antarmuka keyboard dan mouse memungkinkan model AI meniru berbagai perilaku manusia, menawarkan aplikasi potensial dalam domain mana pun dengan data tak berlabel yang substansial dan bisa mengoperasikan perangkat lunak sehari-hari.

Mulai dari membuat beliung berlian di dunia digital Minecraft hingga berpotensi menavigasi tugas-tugas dunia nyata, OpenAI sedang mengubah batasan tentang apa yang kita pikirkan AI bisa capai.

Kesimpulan

Namun, robotika bukanlah satu-satunya area di mana kecerdasan buatan tujuan umum sedang berkembang seperti OpenAI baru saja mengumumkan kecerdasan buatan yang belajar sendiri yang disebutnya "mine aisle". Secara mengejutkan, eksperimen terbaru dari OpenAI telah mengajarkan kecerdasan buatan untuk membuat beliung berlian di Minecraft, yang mungkin terdengar seperti prestasi sepele, tetapi implikasinya sangat luas dan transformatif.

Khususnya, Minecraft adalah permainan dunia terbuka yang populer yang menawarkan tantangan-tantangan bagi para peneliti kecerdasan buatan. Bahkan, dengan dimulainya tantangan mine aisle pada tahun 2019, OpenAI mengambil langkah pertama dalam mengajarkan kecerdasan buatan untuk menjelajahi dunia ini dari tugas sederhana seperti menemukan gua hingga tugas-tugas kompleks seperti membuat rumah.

Post a Comment

Cookie Consent
We serve cookies on this site to analyze traffic, remember your preferences, and optimize your experience.
Oops!
It seems there is something wrong with your internet connection. Please connect to the internet and start browsing again.
AdBlock Detected!
We have detected that you are using adblocking plugin in your browser.
The revenue we earn by the advertisements is used to manage this website, we request you to whitelist our website in your adblocking plugin.
Site is Blocked
Sorry! This site is not available in your country.