মিথুন ব্যবহার করে একটি রোবটকে Google DeepMind অফিসে নেভিগেট করতে দেখুন

জেনারেটিভ এআই ইতিমধ্যে রোবটগুলিতে অনেক প্রতিশ্রুতি দেখিয়েছে। অ্যাপ্লিকেশনগুলির মধ্যে রয়েছে প্রাকৃতিক ভাষা মিথস্ক্রিয়া, রোবট শিক্ষা, নো-কোড প্রোগ্রামিং এবং এমনকি ডিজাইন। গুগলের ডিপমাইন্ড রোবোটিক্স দল এই সপ্তাহে দুটি শাখার মধ্যে আরেকটি সম্ভাব্য মিষ্টি স্পট প্রদর্শন করছে: নেভিগেশন।

শিরোনাম একটি কাগজে “মোবিলিটি ভিএলএ: লং-কনটেক্সট ভিএলএম এবং টপোলজিক্যাল গ্রাফ সহ মাল্টিমোডাল নির্দেশনা নেভিগেশন,” দলটি দেখায় যে কীভাবে এটি Google Gemini 1.5 Pro প্রয়োগ করেছে একটি রোবটকে কমান্ডের প্রতিক্রিয়া জানাতে এবং একটি অফিসের চারপাশে নেভিগেট করতে শেখাতে৷ স্বাভাবিকভাবেই, ডিপমাইন্ড এমন কিছু প্রতিদিনের রোবট ব্যবহার করেছে যেগুলি গুগল থেকে ঘুরে বেড়াচ্ছে গত বছর ব্যাপক ছাঁটাইয়ের মধ্যে প্রকল্পটি বন্ধ করে দেয়.

প্রকল্পের সাথে সংযুক্ত ভিডিওগুলির একটি সিরিজে, ডিপমাইন্ড কর্মীরা একটি স্মার্ট অ্যাসিস্ট্যান্ট-স্টাইল “ওকে, রোবট” দিয়ে খোলে, সিস্টেমকে 9,000-বর্গ-ফুট অফিস স্পেস জুড়ে বিভিন্ন কাজ করতে বলার আগে।

ইমেজ ক্রেডিট: গুগল ডিপমাইন্ড

একটি উদাহরণে, একজন Googler রোবটকে জিনিস আঁকতে তাকে কোথাও নিয়ে যেতে বলে। “ঠিক আছে,” রোবটটি উত্তর দেয়, একটি জান্টি হলুদ বাউটি পরা, “আমাকে এক মিনিট দিন। মিথুনের সাথে চিন্তা করা …” তারপর রোবটটি মানুষকে একটি প্রাচীর আকারের সাদা বোর্ডের দিকে নিয়ে যায়। একটি দ্বিতীয় ভিডিওতে, একজন ভিন্ন ব্যক্তি রোবটকে হোয়াইটবোর্ডের নির্দেশাবলী অনুসরণ করতে বলে।

একটি সাধারণ মানচিত্র রোবটটিকে দেখায় কিভাবে “নীল এলাকায়” যেতে হয়। আবার, রোবটটি একটি দীর্ঘ পথ নেওয়ার আগে এক মুহূর্ত চিন্তা করে যা একটি রোবোটিক্স পরীক্ষার ক্ষেত্র হিসাবে পরিণত হয়। “আমি সফলভাবে হোয়াইটবোর্ডের নির্দেশাবলী অনুসরণ করেছি,” রোবটটি এমন একটি আত্মবিশ্বাসের সাথে ঘোষণা করে যা বেশিরভাগ মানুষ কেবল স্বপ্নই দেখতে পারে।

এই ভিডিওগুলির আগে, রোবটগুলিকে “মাল্টিমোডাল ইনস্ট্রাকশন নেভিগেশন উইথ ডেমোনস্ট্রেশন ট্যুরস (MINT)” ব্যবহার করে স্থানের সাথে পরিচিত করা হয়েছিল৷ কার্যকরীভাবে, এর অর্থ হল অফিসের চারপাশে রোবট হাঁটা যখন বক্তৃতা সহ বিভিন্ন ল্যান্ডমার্ক নির্দেশ করে। এরপরে, দলটি হায়ারার্কিক্যাল ভিশন-ল্যাংগুয়েজ-অ্যাকশন (ভিএলএ) ব্যবহার করে “সেই সমন্বয়[e] পরিবেশ বোঝা এবং সাধারণ জ্ঞান যুক্তি শক্তি।” একবার প্রক্রিয়াগুলি একত্রিত হয়ে গেলে, রোবট লিখিত এবং টানা আদেশের পাশাপাশি অঙ্গভঙ্গিগুলিতে প্রতিক্রিয়া জানাতে পারে।

ইমেজ ক্রেডিট: গুগল ডিপমাইন্ড

গুগল বলেছে যে রোবটটির কর্মীদের সাথে 50 টিরও বেশি ইন্টারঅ্যাকশনে 90% বা তার বেশি সাফল্যের হার ছিল।

Source link

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *

Raytahost Facebook Sharing Powered By : Raytahost.com