বিশ্বের কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে নতুন মাত্রা যোগ করেছে ডিপমাইন্ড (DeepMind)। সম্প্রতি প্রতিষ্ঠানটি উন্মোচন করেছে জিনি ২ (Genie 2) নামের এক অভিনব এআই মডেল, যা টেক্সট প্রম্পট বা ছবির সাহায্যে সম্পূর্ণ ইমার্সিভ ও প্লেবেল ৩ডি জগৎ তৈরি করতে সক্ষম।
জিনি ২ তার পূর্বসূরি জিনির থেকেও অনেক বেশি উন্নত। যেখানে জিনি শুধু একক ছবি থেকে ইন্টারঅ্যাকটিভ পরিবেশ তৈরি করতে পারত, সেখানে জিনি ২ টেক্সট প্রম্পটের মাধ্যমে পূর্ণাঙ্গ, বাস্তবসম্মত, এবং গতিশীল ভার্চুয়াল জগৎ তৈরি করে।
কেমন কাজ করে জিনি ২?
ডিপমাইন্ডের এক ব্লগ পোস্টে উল্লেখ করা হয়েছে যে, জিনি ২ হলো একটি বৃহৎ-স্কেল ফাউন্ডেশন মডেল, যা জটিল ৩ডি সিমুলেশন তৈরি করতে সক্ষম। উদাহরণস্বরূপ, ব্যবহারকারী যদি প্রম্পট দেন, “একজন যোদ্ধা তুষারের মধ্যে,” তবে মডেলটি এমন একটি বিশাল ভার্চুয়াল পরিবেশ তৈরি করবে, যেখানে ব্যবহারকারী তুষারে ঘেরা একটি পরিবেশে যোদ্ধা চরিত্রের সাথে ইন্টারঅ্যাক্ট করতে পারবেন।
তৈরি করা এই পরিবেশে ফিজিক্স-ভিত্তিক ইন্টারঅ্যাকশনও অন্তর্ভুক্ত থাকে। যেমন, ব্যবহারকারী সেখানে সাঁতার কাটতে, লাফ দিতে বা বস্তু সরাতে পারবেন। এর সাথে পরিবেশে থাকবে বাস্তবসম্মত আলোর প্রতিফলন ও ছায়ার মতো জটিল বৈশিষ্ট্য।
উন্নত প্রযুক্তি ও মডেলের বৈশিষ্ট্য
জিনি ২ মডেলের শক্তিশালী ক্ষমতার মূল কারণ হলো এর বিশাল ভিডিও ডেটাসেটে প্রশিক্ষণ। এর ফলে মডেলটি এমন জগৎ তৈরি করতে পারে, যা ভিজ্যুয়ালি সমৃদ্ধ ও পারস্পরিক সংযুক্ত। এটি ফার্স্ট-পারসন ও আইসোমেট্রিক ভিউ উভয় ধরণের দৃষ্টিকোণ থেকে পরিবেশ তৈরি করতে পারে।
মডেলটি একটি অটো-রিগ্রেসিভ পদ্ধতিতে কাজ করে, যেখানে ভিডিওর প্রতিটি ফ্রেম ধাপে ধাপে তৈরি হয়। ব্যবহারকারী যখন একটি টেক্সট বা ছবি প্রদান করেন, তখন জিনি ২ ডিপমাইন্ডের আরেকটি জেনারেটিভ মডেল ইমেজেন ৩ (Imagen3)-এর সহায়তায় সেই প্রম্পটের জন্য ভিজ্যুয়াল পরিবেশ তৈরি করে। ব্যবহারকারীরা কিবোর্ডের সাহায্যে তৈরি পরিবেশে নেভিগেট ও ইন্টারঅ্যাক্ট করতে পারেন।
অ্যাকশন কন্ট্রোলে বিশেষ পারদর্শিতা
জিনি ২ এর অন্যতম বৈশিষ্ট্য হলো এর অ্যাকশন কন্ট্রোল। এটি ব্যবহারকারীর নির্দেশ বুঝে কাজ করে। যেমন, ব্যবহারকারী যদি কোনো রোবট চরিত্রের দিক নির্দেশনা দেন, তবে এটি শুধুমাত্র সেই রোবটকে পরিচালিত করবে, অন্য বস্তু (যেমন মেঘ বা গাছ) নয়।
এছাড়া এর দীর্ঘমেয়াদী স্মৃতি ক্ষমতা মডেলটিকে বাস্তবসম্মত পরিবেশ তৈরিতে সহায়তা করে। কোনো অংশ যখন দ্বিতীয়বার দেখা যায়, তখন এটি সঠিকভাবে রেন্ডার করে এবং পরিবেশের ধারাবাহিকতা বজায় রাখে।
সম্ভাব্য ব্যবহার ক্ষেত্র
জিনি ২ কেবল গেমিং জগতে বিপ্লব ঘটাবে না, এটি সৃজনশীল এবং গবেষণামূলক ক্ষেত্রেও নতুন দিগন্ত উন্মোচন করবে। ডিজিটাল আর্ট, ডিজাইন, এবং সিমুলেশনের ক্ষেত্রে এটি হতে পারে একটি যুগান্তকারী টুল।
ডিপমাইন্ড জানিয়েছে, কনসেপ্ট আর্ট বা ড্রয়িং থেকে ইন্টারঅ্যাকটিভ পরিবেশ তৈরির ক্ষমতা ডিজাইনার ও আর্টিস্টদের জন্য এক বিশাল সুবিধা হবে। এমনকি এটি সম্পূর্ণ নতুন ধরনের ভিডিও গেম তৈরিরও সম্ভাবনা দেখাচ্ছে, যেখানে চরিত্র এবং পরিবেশ বাস্তব সময়ে তৈরি হতে পারে।
গেমিং ও গবেষণায় সম্ভাবনার নতুন দিগন্ত
গেমিং জগতে, বিশেষ করে ওপেন ওয়ার্ল্ড গেম তৈরিতে জিনি ২ একটি বড় ভূমিকা পালন করতে পারে। ব্যবহারকারীরা টেক্সট প্রম্পটের মাধ্যমে তাদের কল্পনার জগৎ তৈরি করতে পারবেন এবং সেখানে ইন্টারঅ্যাক্ট করতে পারবেন।
অন্যদিকে, গবেষণায় এটি বাস্তব-জীবনের সিমুলেশন তৈরির জন্য অত্যন্ত কার্যকর হতে পারে। যেমন, স্থপতি, ইঞ্জিনিয়ার, এবং বৈজ্ঞানিক গবেষণায় এই মডেলটি বাস্তবসম্মত পরিবেশ তৈরিতে সাহায্য করবে।
ভবিষ্যতের সম্ভাবনা
ডিপমাইন্ডের মতে, জিনি ২ এর ব্যবহারিক ক্ষেত্র অদূর ভবিষ্যতে আরও বিস্তৃত হবে। এটি এআই ও ভার্চুয়াল রিয়েলিটির সংমিশ্রণে মানবজাতিকে নতুন প্রযুক্তির সঙ্গে আরও বেশি সংযুক্ত করবে।
সৃজনশীল ক্ষেত্র থেকে শুরু করে গেমিং এবং গবেষণার মতো বৈচিত্র্যময় ক্ষেত্রগুলোতে জিনি ২ যে কৃত্রিম বুদ্ধিমত্তার একটি শক্তিশালী উদাহরণ হয়ে থাকবে, তা নিশ্চিত। এটি কেবল একটি মডেল নয়, বরং প্রযুক্তির একটি নতুন যুগের সূচনা।