মাইক্রোসফটের নতুন এআই টুল চোখের পলকে ফটো থেকে তৈরি করবে GIF

মাইক্রোসফ্ট (microsoft) এর গবেষণা কেন্দ্র একটি নতুন এআই মডেল চালু করেছে যাতে সেকেন্ডের মধ্যে স্টিলের ছবিগুলিকে Pix2Gif এ রূপান্তর করা যায়। এই নতুন সর্বজনীনভাবে উপলব্ধ…

Microsoft Surface Laptops

মাইক্রোসফ্ট (microsoft) এর গবেষণা কেন্দ্র একটি নতুন এআই মডেল চালু করেছে যাতে সেকেন্ডের মধ্যে স্টিলের ছবিগুলিকে Pix2Gif এ রূপান্তর করা যায়। এই নতুন সর্বজনীনভাবে উপলব্ধ AI টুল, Pix2Gif, অন্যান্য টেক্সট-টু-ভিডিও AI মডেলগুলিতে পাওয়া একই ধরণের বৃত্তাকার মডেল ব্যবহার করে। এটি লক্ষ করা গুরুত্বপূর্ণ যে Pix2Gif একটি “চিত্র অনুবাদ” পদ্ধতি গ্রহণ করে। ছবিটি জমা দেওয়ার পরে, ব্যবহারকারীরা পাঠ্যে সম্পাদনার দিকনির্দেশও দিতে পারেন।

এআই টুল কিভাবে কাজ করে?

মডেলের একটি গবেষণাপত্রে, গবেষকরা ব্যাখ্যা করেছেন যে ব্যবহারকারীদের চিত্র ইনপুট সহ একটি পাঠ্য প্রম্পটের মাধ্যমে গতি সম্পর্কে মডেলটিকে গাইড করতে হবে। এটি একটি পাঠ্য প্রম্পটের উপর ভিত্তি করে একটি মৌলিক চিত্রের বৈশিষ্ট্যগুলিকে “স্থানিকভাবে পরিবর্তন” করার অনুমতি দেবে। AI টুলটি স্টিল ইমেজ থেকে 2-সেকেন্ডের GIF তৈরি করতে প্রায় এক মিনিট সময় নিয়েছে। টুলটি একটি দ্রুততর GPU দিয়ে আরও দ্রুত GIF তৈরি করতে পারে।

গবেষকরা দাবি করেছেন যে মডেলটিকে প্রশিক্ষণ দেওয়ার জন্য প্রয়োজনীয় ক্যাপশন সহ 100,000 অ্যানিমেটেড GIF ব্যবহার করেছেন৷ এর পরে, তারা gifs থেকে ফ্রেমগুলি বের করেছে এবং ক্যাপশনগুলিকে পাঠ্য প্রম্পট হিসাবে ব্যবহার করেছে।

টমস গাইডের রিপোর্ট অনুসারে, এই এআই মডেলটি একটি গবেষণা প্রকল্প এবং এটি Microsoft থেকে সর্বজনীনভাবে উপলব্ধ পণ্যে পরিণত নাও হতে পারে এবং একটি স্বতন্ত্র সরঞ্জাম হিসাবে কপিলটে প্রবেশ করতে পারে না। এখানে, ব্যবহারকারীরা টুলটিকে একটি ইমেজ বা একটি টেক্সট প্রম্পট দিতে পারেন এবং একটি GIF পেতে পারেন। প্রতিবেদন অনুসারে, মাইক্রোসফ্ট এই সরঞ্জামটিকে ডিজাইনার বা পেইন্টে অন্তর্ভুক্ত করতে পারে যাতে এটি অ্যানিমেট করা সহজ হয় এবং এআই ব্যবহার করে একটি চিত্রের সাথে সামঞ্জস্য করা যায়।

গবেষকরা মডেলের প্রশিক্ষণের জন্য ব্যবহৃত GIF-এর উৎসও প্রকাশ করেননি। মডেলটি সর্বজনীনভাবে উপলব্ধ এবং বাণিজ্যিক হওয়ার জন্য, প্রশিক্ষণের জন্য লাইসেন্সপ্রাপ্ত ডেটার প্রয়োজন হবে, বিশেষ করে যদি এটি একটি Microsoft পণ্যের মধ্যে তৈরি করা হয়।