Google Veo উন্মোচন করেছে, একটি হাই-ডেফিনিশন এআই ভিডিও জেনারেটর যা সোরাকে প্রতিদ্বন্দ্বিতা করতে পারে

By infobangla May16,2024

বড় করা / Google Veo দ্বারা জেনারেট করা ভিডিও থেকে নেওয়া স্টিল ছবি।

গুগল / বেঞ্জ এডওয়ার্ডস

মঙ্গলবার Google I/O 2024 এ, Google ঘোষণা করেছে ভিওএকটি নতুন এআই ভিডিও সংশ্লেষণ মডেল যা OpenAI এর অনুরূপ পাঠ্য, চিত্র বা ভিডিও প্রম্পট থেকে HD ভিডিও তৈরি করতে পারে সোরা. এটি এক মিনিটের বেশি স্থায়ী 1080p ভিডিও তৈরি করতে পারে এবং লিখিত নির্দেশাবলী থেকে ভিডিও সম্পাদনা করতে পারে, তবে এটি এখনও ব্যাপক ব্যবহারের জন্য প্রকাশ করা হয়নি।

Veo কথিত আছে যে টেক্সট কমান্ড ব্যবহার করে বিদ্যমান ভিডিওগুলি সম্পাদনা করার ক্ষমতা, ফ্রেম জুড়ে ভিজ্যুয়াল সামঞ্জস্য বজায় রাখা এবং একটি একক প্রম্পট বা প্রম্পটগুলির একটি সিরিজ থেকে 60 সেকেন্ড পর্যন্ত স্থায়ী ভিডিও সিকোয়েন্স তৈরি করা যা একটি বর্ণনা তৈরি করে। সংস্থাটি বলেছে যে এটি বিশদ দৃশ্য তৈরি করতে পারে এবং সিনেমাটিক প্রভাব যেমন টাইম-ল্যাপস, এরিয়াল শট এবং বিভিন্ন ভিজ্যুয়াল শৈলী প্রয়োগ করতে পারে।

চালু হওয়ার পর থেকে DALL-E 2 এপ্রিল 2022-এ, আমরা নতুন চিত্র সংশ্লেষণ এবং ভিডিও সংশ্লেষণ মডেলগুলির একটি প্যারেড দেখেছি যার লক্ষ্য যে কেউ লিখিত বিবরণ টাইপ করতে পারে এমন কাউকে একটি বিশদ চিত্র বা ভিডিও তৈরি করার অনুমতি দেওয়া। যদিও কোনো প্রযুক্তিই পুরোপুরি পরিমার্জিত হয়নি, এআই ইমেজ এবং ভিডিও জেনারেটর উভয়ই ক্রমাগতভাবে আরও সক্ষম হয়ে উঠছে।

ফেব্রুয়ারিতে, আমরা এর একটি প্রিভিউ কভার করেছি OpenAI এর Sora ভিডিও জেনারেটর, যা সেই সময়ে অনেকেই বিশ্বাস করেছিল যে শিল্পটি অফার করতে পারে এমন সেরা এআই ভিডিও সংশ্লেষণের প্রতিনিধিত্ব করে। এটি টাইলার পেরিকে যথেষ্ট প্রভাবিত করেছিল যে সে তার ফিল্ম স্টুডিও সম্প্রসারণ করা স্হগিত. যাইহোক, এখনও পর্যন্ত, ওপেনএআই টুলটিতে সাধারণ অ্যাক্সেস প্রদান করেনি – পরিবর্তে, তারা এটির ব্যবহার সীমিত করেছে পরীক্ষকদের একটি নির্বাচিত গ্রুপে।

এখন, Google এর Veo প্রথম নজরে সোরার মতো ভিডিও তৈরি করতে সক্ষম বলে মনে হচ্ছে। আমরা নিজেরা এটি চেষ্টা করিনি, তাই আমরা শুধুমাত্র কোম্পানির দেওয়া চেরি-পিকড ডেমোনস্ট্রেশন ভিডিওগুলির মাধ্যমে যেতে পারি এর ওয়েবসাইটে. এর মানে যে কেউ এগুলি দেখছে তার Google-এর দাবিগুলিকে প্রচুর পরিমাণে লবণের সাথে গ্রহণ করা উচিত, কারণ প্রজন্মের ফলাফলগুলি সাধারণ নাও হতে পারে৷

Veo-এর উদাহরণ ভিডিওগুলির মধ্যে রয়েছে একটি কাউবয় ঘোড়ায় চড়ে, একটি শহরতলির রাস্তায় একটি দ্রুত-ট্র্যাকিং শট, গ্রিলের উপর কাবাব ভাজা, একটি সূর্যমুখী খোলার সময় শেষ হয়ে যাওয়া এবং আরও অনেক কিছু। মানুষের কোনো বিশদ চিত্র স্পষ্টভাবে অনুপস্থিত, যা ঐতিহাসিকভাবে এআই ইমেজ এবং ভিডিও মডেলের জন্য সুস্পষ্ট বিকৃতি ছাড়াই তৈরি করা কঠিন ছিল।

গুগল বলেছে যে Veo কোম্পানির পূর্ববর্তী ভিডিও জেনারেশন মডেলগুলির উপর তৈরি করে, যার মধ্যে জেনারেটিভ কোয়েরি নেটওয়ার্ক (GQN), DVD-GAN, ছবি-ভিডিও, ফেনাকিWALT, VideoPoet, এবং লুমিয়ের. গুণমান এবং দক্ষতা বাড়ানোর জন্য, Veo-এর প্রশিক্ষণ ডেটাতে আরও বিস্তারিত ভিডিও ক্যাপশন অন্তর্ভুক্ত রয়েছে এবং এটি সংকুচিত “সুপ্ত” ভিডিও উপস্থাপনা ব্যবহার করে। Veo-এর ভিডিও প্রজন্মের গুণমান উন্নত করতে, Google Veo-কে প্রশিক্ষণের জন্য ব্যবহৃত ভিডিওগুলির জন্য আরও বিশদ ক্যাপশন অন্তর্ভুক্ত করেছে, যাতে AI-কে আরও সঠিকভাবে প্রম্পট ব্যাখ্যা করতে পারে৷

Veo এও উল্লেখযোগ্য বলে মনে হয় যে এটি ফিল্ম মেকিং কমান্ড সমর্থন করে: “যখন একটি ইনপুট ভিডিও এবং সম্পাদনা উভয় কমান্ড দেওয়া হয়, যেমন একটি উপকূলরেখার একটি বায়বীয় শটে কায়াক যোগ করা, Veo এই কমান্ডটি প্রাথমিক ভিডিওতে প্রয়োগ করতে পারে এবং একটি নতুন, সম্পাদিত ভিডিও তৈরি করতে পারে, “কোম্পানি বলে।

যদিও ডেমোগুলি প্রথম নজরে চিত্তাকর্ষক বলে মনে হচ্ছে (বিশেষত এর তুলনায় উইল স্মিথ স্প্যাগেটি খাচ্ছেন), Google স্বীকার করেছে AI ভিডিও তৈরি করা কঠিন। “ভিজ্যুয়াল সামঞ্জস্য বজায় রাখা ভিডিও প্রজন্মের মডেলগুলির জন্য একটি চ্যালেঞ্জ হতে পারে,” কোম্পানি লিখেছেন। “অক্ষর, বস্তু বা এমনকি সম্পূর্ণ দৃশ্যগুলি ফ্রেমের মধ্যে অপ্রত্যাশিতভাবে ঝিকিমিকি করতে পারে, লাফ দিতে পারে বা রূপান্তর করতে পারে, দেখার অভিজ্ঞতাকে ব্যাহত করে।”

গুগল “কাটিং-এজ সুপ্ত ডিফিউশন ট্রান্সফরমার” দিয়ে সেই ত্রুটিগুলি প্রশমিত করার চেষ্টা করেছে, যা মূলত সুনির্দিষ্ট ছাড়াই অর্থহীন বিপণন আলোচনা। তবে কোম্পানিটি মডেলটিতে যথেষ্ট আত্মবিশ্বাসী অভিনেতা ডোনাল্ড গ্লোভারের সাথে কাজ করছেন এবং তার স্টুডিও, গিলগা, একটি এআই-জেনারেটেড ডেমোনস্ট্রেশন ফিল্ম তৈরি করতে যা শীঘ্রই আত্মপ্রকাশ করবে।

প্রাথমিকভাবে, Veo এর মাধ্যমে নির্বাচিত নির্মাতাদের কাছে অ্যাক্সেসযোগ্য হবে ভিডিওএফএক্স, একটি নতুন পরীক্ষামূলক টুল Google-এর AI টেস্ট কিচেন ওয়েবসাইট, labs.google-এ উপলব্ধ৷ আগামী সপ্তাহগুলিতে Veo-এর বৈশিষ্ট্যগুলিতে সম্ভাব্য অ্যাক্সেস পেতে নির্মাতারা VideoFX-এর জন্য একটি অপেক্ষা তালিকায় যোগ দিতে পারেন। Google ভবিষ্যতে ইউটিউব শর্টস এবং অন্যান্য পণ্যগুলিতে Veo-এর কিছু সক্ষমতা একীভূত করার পরিকল্পনা করছে।

Google Veo-এর প্রশিক্ষণের ডেটা কোথায় পেয়েছে সে সম্পর্কে এখনও কোনও শব্দ নেই (যদি আমাদের অনুমান করতে হয়, ইউটিউব সম্ভবত জড়িত ছিল)। কিন্তু গুগল জানিয়েছে যে এটি Veo এর সাথে একটি “দায়িত্বপূর্ণ” পদ্ধতি গ্রহণ করছে। কোম্পানির মতে, “ভিও দ্বারা তৈরি ভিডিওগুলি ব্যবহার করে ওয়াটারমার্ক করা হয় সিনথআইডিএআই-জেনারেটেড কন্টেন্ট ওয়াটারমার্কিং এবং শনাক্ত করার জন্য আমাদের অত্যাধুনিক টুল, এবং নিরাপত্তা ফিল্টার এবং মেমোরাইজেশন চেকিং প্রক্রিয়ার মধ্য দিয়ে পাস করে যা গোপনীয়তা, কপিরাইট এবং পক্ষপাতের ঝুঁকি কমাতে সাহায্য করে।”

Source link

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *