মানুষ নয়, ট্যুর গাইড করবে রোবট, চাকরি যাবে বহু গাইডের

Boston Dynamics ইঞ্জিনিয়াররা একটি একটি ট্যুর গাইড রোবট কুকুর তৈরি করেছে, যার নাম হল স্পট। একটি বিশিষ্ট ব্রিটিশ উচ্চারণ, একটি টুপি, একটি গোঁফ, এবং এর…

Boston Dynamics ইঞ্জিনিয়াররা একটি একটি ট্যুর গাইড রোবট কুকুর তৈরি করেছে, যার নাম হল স্পট। একটি বিশিষ্ট ব্রিটিশ উচ্চারণ, একটি টুপি, একটি গোঁফ, এবং এর গোল চোখ দিয়ে মানুষকে গাইড করার সময় স্পট হাঁটতে, কথা বলতে, এমনকি বিভিন্ন জায়গাগুলিতে ভ্রমণ করতে পারে। Spot ChatGPT এবং অন্যান্য ওপেন সোর্স বৃহৎ ভাষা মডেল (LLM) এর সঙ্গেও সংহত করা হয়েছে যাতে এর প্রতিক্রিয়াগুলিকে সাবধানে প্রশিক্ষণ দেওয়া যায়।

বোস্টন ডাইনামিক্সের প্রকৌশলীরা প্রকাশ করেছেন যে তাদের রোবট কুকুর, স্পট, একটি স্ক্রিপ্টেড সংলাপ এবং ভিজ্যুয়াল প্রশ্নের উত্তর দেওয়ার মডেলগুলির সংমিশ্রণ ব্যবহার করে তার আশেপাশের বিষয়ে প্রশ্নের উত্তর দিতে পারে। ইউটিউবে পোস্ট করা একটি ডেমো ভিডিওতে, স্পটকে বোস্টন ডায়নামিক্স সুবিধার চারপাশে হাঁটতে, একটি সফর দিতে এবং ঘরের চারপাশে জিনিসগুলি দেখাতে দেখা যায়।

বোস্টন ডায়নামিক্সের প্রধান সফ্টওয়্যার প্রকৌশলী ম্যাট ক্লিনজেনস্মিথ প্রকাশ করেছেন যে প্রতিটি কক্ষের জন্য, স্পটের প্রকৌশলীরা এটিকে একটি সংক্ষিপ্ত স্ক্রিপ্ট প্রদান করেছেন। তারপরে স্পট তার গ্রিপার এবং বডিতে থাকা ক্যামেরাগুলিকে ঘরের ছবি সংগ্রহ করতে ব্যবহার করে, যা এটি প্রতিক্রিয়া তৈরি করার আগে এটি কী দেখে সে সম্পর্কে আরও তথ্য পেতে ব্যবহার করে। ভিজ্যুয়াল প্রশ্নের উত্তর দেওয়ার মডেলগুলি Spot-কে মূলত ছবিগুলির ক্যাপশন এবং সেগুলি সম্পর্কে প্রশ্নের উত্তর দেওয়ার অনুমতি দেয়৷

Boston Dynamics-এর রোবটগুলিকে প্রায়ই তাদের নাচ এবং পার্কুর দক্ষতা প্রদর্শন করতে দেখা গিয়েছে, কিন্তু জেনারেটিভ AI এর সাহায্যে তাদের রোবটগুলি এখন মানুষের ইনপুট সরাসরি শুনতে এবং প্রতিক্রিয়া জানাতে পারে। রোবটগুলির একাধিক ব্যক্তিত্ব রয়েছে, যার মধ্যে একটি “মূল্যবান ধাতব কাউগার্ল” রয়েছে যিনি উত্তেজিতভাবে সেই সমস্ত পাথরের নীচে পাওয়া সম্ভাব্য খনিজগুলি সম্পর্কে কথা বলেন।

বোস্টন ডায়নামিক্স ওয়েবসাইটে অফিসিয়াল ব্লগে ক্লিনজেনস্মিথ লিখেছেন, “আমরা কৃত্রিম বুদ্ধিমত্তা এবং রোবোটিক্সের সংযোগস্থল অন্বেষণ চালিয়ে যেতে উত্তেজিত” এই মডেলগুলি [LLMs] সাংস্কৃতিক প্রেক্ষাপট, সাধারণ সাধারণ জ্ঞান এবং নমনীয়তা প্রদান করতে সাহায্য করতে পারে যা অনেক রোবোটিক্স কাজের জন্য উপযোগী হতে পারে।

এদিকে, OpenAI সম্প্রতি তার চ্যাটবট, ChatGPT-তে ভয়েস এবং ইমেজ শনাক্তকরণ ক্ষমতা যুক্ত করেছে। এর মানে হল ChatGPT এখন বাস্তব জীবনের ভয়েস অভিনেতাদের কণ্ঠ থেকে সংশ্লেষিত এআই-জেনারেটেড ভয়েস লাইন তৈরি করতে পারে, মূলত এটি ব্যবহারকারীদের সঙ্গে কথা বলার অনুমতি দেয়। উপরন্তু, ChatGPT এখন ছবি চিনতে পারে এবং সেগুলির মধ্যে কী আছে সে সম্পর্কে তথ্য প্রদান করতে পারে৷ এই আপডেটটি বোস্টনের রোবো কুকুরের ক্ষেত্রে সহ সমস্ত AI যা করতে পারে তার সম্ভাবনাও উন্মুক্ত করেছে, যা এখন শুনতে এবং কথা বলতে পারে।