Google I/O 2024 – জেমিনি থেকে অ্যান্ড্রয়েড 15 পর্যন্ত 7টি বৃহত্তম এআই ঘোষণা

By infobangla May15,2024

ধুলো এখন থিতু হয়েছে Google I/O 2024 মূল বক্তব্য এবং বড় থিমটি কী ছিল তাতে কোন সন্দেহ নেই – গুগল মিথুন এবং নতুন AI সরঞ্জামগুলি সম্পূর্ণরূপে ঘোষণাগুলিতে আধিপত্য বিস্তার করে, আমাদের ডিজিটাল জীবন কোন দিকে যাচ্ছে তার আভাস দেয়। সিইও সুন্দর পিচাই ইভেন্টটিকে দ্য ইরাস ট্যুরের সংস্করণ হিসাবে বর্ণনা করতে সঠিক ছিলেন – বিশেষত, “জেমিনি যুগ” – একেবারে শীর্ষে৷

আগের বছরের মত নয়, পুরো মূল বক্তব্যটি ছিল মিথুন এবং এআই সম্পর্কে; আসলে, গুগল পরেরটি মোট 121 বার বলেছেন। “প্রজেক্ট অ্যাস্ট্রা” নামে একটি ভবিষ্যত AI সহকারী উন্মোচন করা থেকে শুরু করে যা একটি ফোনে চলতে পারে – এবং সম্ভবত স্মার্ট চশমা, একদিন – জেমিনি প্রায় প্রতিটি পরিষেবা বা পণ্যের সাথে যুক্ত হওয়া পর্যন্ত, কৃত্রিম বুদ্ধিমত্তা অবশ্যই প্রভাবশালী থিম ছিল৷

দুই ঘন্টার মূল বক্তব্যটি সবচেয়ে প্রবল LLM উত্সাহী বাদে সকলের মন গলানোর জন্য যথেষ্ট ছিল, তাই আমরা 7টি সবচেয়ে গুরুত্বপূর্ণ জিনিস ভেঙে দিয়েছি যা Google তার প্রধান I/O 2024 কীনোটের সময় ঘোষণা করেছিল – এবং কখন সর্বশেষ খবর অন্তর্ভুক্ত করে আমরা আসলে এই নতুন টুলগুলি দেখতে পারি…

1. Google প্রজেক্ট Astra বাদ দিয়েছে – দৈনন্দিন জীবনের জন্য একটি “AI এজেন্ট”৷

সুতরাং দেখা যাচ্ছে যে Google এর একটি উত্তর আছে OpenAI এর GPT-4o এবং মাইক্রোসফটএর কো-পাইলট। প্রকল্প Astraদৈনন্দিন জীবনের জন্য একটি “AI এজেন্ট” হিসাবে ডাব করা হয়, মূলত গুগল লেন্স স্টেরয়েডগুলিতে এবং গুরুতরভাবে চিত্তাকর্ষক দেখায়, বুঝতে, যুক্তি দিতে এবং লাইভ ভিডিও এবং অডিওতে প্রতিক্রিয়া জানাতে সক্ষম।

একটি রেকর্ড করা ভিডিওতে একটি পিক্সেল ফোনে ডেমো করা হয়েছে, ব্যবহারকারীকে একটি অফিসের চারপাশে হাঁটতে দেখা গেছে, পিছনের ক্যামেরার একটি লাইভ ফিড সরবরাহ করছে এবং কফ বন্ধ করে Astra প্রশ্ন জিজ্ঞাসা করছে। জেমিনি প্রশ্নগুলি মোকাবেলা করার সময় ভিজ্যুয়ালগুলি দেখছিলেন এবং বুঝতে পারছিলেন।

এটি মিথুনের ব্যাকএন্ডে বহু-মডেল এবং দীর্ঘ-প্রসঙ্গের সাথে কথা বলে, যা দ্রুত একটি প্রতিক্রিয়া সনাক্ত করতে এবং প্রদান করার জন্য নিমিষেই কাজ করে। প্রদর্শনীতে, এটি জানত যে একজন স্পিকারের একটি নির্দিষ্ট অংশ কী এবং এমনকি লন্ডনের একটি প্রতিবেশীকে চিহ্নিত করতে পারে। এটিও জেনারেটিভ কারণ এটি দ্রুত একটি স্টাফড প্রাণীর পাশে একটি সুন্দর কুকুরছানার জন্য একটি ব্যান্ড নাম তৈরি করেছে (উপরের ভিডিওটি দেখুন)।

এটি অবিলম্বে চালু হবে না, তবে টেকরাডারে আমাদের মতো বিকাশকারীরা এবং প্রেস আই/ও 2024-এ এটি ব্যবহার করে দেখতে পাবেন। এবং যখন Google স্পষ্ট করেনি, তখন Astra-এর জন্য চশমার একটি টিজার ছিল, যার অর্থ হতে পারে Google গ্লাস একটি প্রত্যাবর্তন করতে পারে.

তবুও, এমনকি Google I/O এর সময় একটি ডেমো হিসাবে, এটি গুরুতরভাবে চিত্তাকর্ষক এবং সম্ভাব্যভাবে খুব বাধ্যতামূলক। এটি স্মার্টফোন এবং বর্তমান সহকারীগুলিকে সুপারচার্জ করতে পারে যা আমাদের কাছে গুগল থেকে রয়েছে এবং এমনকি আপেল. তদ্ব্যতীত, এটি Google-এর সত্যিকারের AI উচ্চাকাঙ্ক্ষাগুলিও দেখায়, এমন একটি টুল যা অত্যন্ত সহায়ক হতে পারে এবং ব্যবহার করার জন্য কোনও কাজ নেই৷

  • কখন এটি চালু হবে? এখন অজানা – গুগল এটিকে “এআই সহকারীর ভবিষ্যতের জন্য আমাদের দৃষ্টিভঙ্গি” হিসাবে বর্ণনা করেছে

2. Google Photos Gemini থেকে একটি সহায়ক AI বুস্ট পেয়েছে৷

আমি সত্যিই জানতে চাই যে এটি একজন Google কর্মচারীর প্রকৃত সন্তান নাকি এটি একটি মিথুন-উত্পন্ন শিশু… (ছবির ক্রেডিট: গুগল)

সুদূর অতীতের কোনো এক সময়ে ক্যাপচার করা একটি নির্দিষ্ট ছবি কি কখনো দ্রুত খুঁজে পেতে চেয়েছিলেন? হতে পারে এটি একটি প্রিয়জনের কাছ থেকে একটি নোট, একটি কুকুরছানা হিসাবে একটি কুকুরের একটি প্রাথমিক ছবি, বা এমনকি আপনার লাইসেন্স প্লেট। ঠিক আছে, গুগল একটি বড় আপডেটের মাধ্যমে সেই ইচ্ছাকে বাস্তবায়িত করছে গুগল ফটো এটি মিথুনের সাথে মিশে যায়। এটি এটিকে আপনার লাইব্রেরিতে অ্যাক্সেস দেয়, এটি এটি অনুসন্ধান করতে দেয় এবং আপনি যে ফলাফলটি খুঁজছেন তা সহজেই সরবরাহ করে৷

মঞ্চে একটি ডেমোতে, সুন্দর পিচাই প্রকাশ করেছেন যে আপনি এটিকে আপনার লাইসেন্স প্লেটের জন্য জিজ্ঞাসা করতে পারেন, এবং ফটোগুলি এটিকে দেখানো একটি চিত্র এবং আপনার প্লেট তৈরি করা অঙ্ক/অক্ষরগুলি সরবরাহ করবে। একইভাবে, আপনি আপনার সন্তান কখন সাঁতার শিখেছে তার সাথে আরও নির্দিষ্ট কিছুর ছবি চাইতে পারেন। এটি এমনকি সবচেয়ে অসংগঠিত ফটো লাইব্রেরিগুলিকে অনুসন্ধান করা কিছুটা সহজ করে তুলবে৷

Google এই বৈশিষ্ট্যটিকে “Ask Photos” নামে ডাকা হয়েছে এবং “আসন্ন সপ্তাহে” সকল ব্যবহারকারীর কাছে এটি চালু করবে। এবং এটি প্রায় অবশ্যই কাজে আসবে, এবং যারা ব্যবহার করে না তাদের তৈরি করবে গুগল ফটো একটু ঈর্ষান্বিত

3. নোটবুক এলএম-এর জন্য আপনার বাচ্চার হোমওয়ার্ক অনেক সহজ হয়েছে৷

একজন ব্যক্তি Google I/O 2024 এ NotebookLM উপস্থাপন করছেন

(ছবির ক্রেডিট: গুগল)

সমস্ত বাবা-মায়েরা বাড়ির কাজে বাচ্চাদের সাহায্য করার চেষ্টা করার ভয়াবহতা জানবেন; আপনি যদি অতীতে এই জিনিসগুলি সম্পর্কে কখনও জানতেন তবে 20 বছর পরেও আপনার মস্তিষ্কে জ্ঞান লুকিয়ে থাকার কোন উপায় নেই। কিন্তু Google হয়তো কাজটিকে অনেক সহজ করে দিয়েছে, তার NotebookLM নোট-টেকিং অ্যাপে আপগ্রেড করার জন্য ধন্যবাদ।

NotebookLM-এর এখন Gemini 1.5 Pro-এ অ্যাক্সেস রয়েছে এবং I/O 2024-এ প্রদত্ত ডেমোর উপর ভিত্তি করে, এটি এখন আপনার আগের চেয়ে আরও ভাল শিক্ষক হবে। ডেমোতে দেখানো হয়েছে যে গুগলের জোশ উডওয়ার্ড একটি শেখার বিষয় সম্পর্কে নোটে ভরা একটি নোটবুক লোড করছেন – এই ক্ষেত্রে, বিজ্ঞান। একটি একক বোতাম টিপে, তিনি একটি বিস্তারিত শেখার গাইড তৈরি করতে সক্ষম হন, যার মধ্যে আরও আউটপুট সহ কুইজ এবং প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী, সমস্ত উৎস উপাদান থেকে নেওয়া হয়।

চিত্তাকর্ষক – কিন্তু এটা অনেক ভাল পেতে সম্পর্কে ছিল. একটি নতুন বৈশিষ্ট্য – এখনও একটি প্রোটোটাইপ – অডিও হিসাবে সমস্ত সামগ্রী আউটপুট করতে সক্ষম হয়েছিল, মূলত একটি পডকাস্ট-শৈলী আলোচনা তৈরি করে৷ আরও কী, অডিওটিতে একাধিক স্পিকার রয়েছে, এই বিষয় সম্পর্কে স্বাভাবিকভাবে এমনভাবে চ্যাট করছে যা অবশ্যই একজন হতাশ অভিভাবক শিক্ষকের ভূমিকা পালন করার চেষ্টা করার চেয়ে বেশি সহায়ক হবে।

উডওয়ার্ড এমনকি বাধা দিতে এবং একটি প্রশ্ন জিজ্ঞাসা করতে সক্ষম হয়েছিলেন, এই ক্ষেত্রে “আমাদের একটি বাস্কেটবল উদাহরণ দিন” – এই সময়ে এআই ট্যাক পরিবর্তন করে এবং বিষয়টির জন্য চতুর রূপক নিয়ে আসে, তবে একটি অ্যাক্সেসযোগ্য প্রসঙ্গে। TechRadar টিমের পিতামাতারা এটি চেষ্টা করার জন্য চুলকাচ্ছেন।

  • কখন এটি চালু হবে? এই মুহূর্তে অজানা

4. আপনি শীঘ্রই একটি ভিডিও সহ Google অনুসন্ধান করতে সক্ষম হবেন৷

গুগল আইও 2024

(ছবির ক্রেডিট: গুগল)

রেকর্ড প্লেয়ারের সাথে একটি অদ্ভুত অন-স্টেজ ডেমোতে, Google একটি খুব চিত্তাকর্ষক নতুন অনুসন্ধান কৌশল দেখিয়েছে। আপনি এখন একটি ভিডিও রেকর্ড করতে পারেন, এবং ফলাফল পেতে এটি অনুসন্ধান করতে পারেন, এবং আশা করি একটি উত্তর৷

এই ক্ষেত্রে, গুগলারই ভাবছিলেন যে কীভাবে একটি রেকর্ড প্লেয়ার ব্যবহার করবেন; তিনি কিছু জিজ্ঞাসা করার সময় প্রশ্নবিদ্ধ ইউনিট ফিল্ম রেকর্ড হিট এবং তারপর এটি বিদায় করা. গুগল তার অনুসন্ধান জাদু কাজ করেছে এবং পাঠ্যের মধ্যে একটি উত্তর প্রদান করেছে, যা উচ্চস্বরে পড়া যেতে পারে। এটি অনুসন্ধান করার সম্পূর্ণ নতুন উপায়, যেমন গুগল লেন্স ভিডিওর জন্য, এবং আসন্ন প্রোজেক্ট অ্যাস্ট্রা প্রতিদিনের এআই থেকে স্বতন্ত্রভাবে আলাদা, কারণ এটি রেকর্ড করা প্রয়োজন এবং তারপর অনুসন্ধান করা বনাম রিয়েল-টাইমে কাজ করা।

তবুও, এটি একটি মিথুনের অংশ এবং Google অনুসন্ধানের সাথে জেনারেটিভ এআই ইনফিউশন, যার লক্ষ্য আপনাকে সেই পৃষ্ঠায় রাখা এবং উত্তর পাওয়া সহজ করে তোলা। ভিডিও সহ অনুসন্ধানের এই ডেমোর আগে, Google রেসিপি এবং ডাইনিংয়ের জন্য একটি নতুন জেনারেটিভ অভিজ্ঞতা দেখিয়েছে। এটি আপনাকে প্রাকৃতিক ভাষায় কিছু অনুসন্ধান করতে এবং ফলাফলের পৃষ্ঠায় রেসিপি বা এমনকি খাবারের সুপারিশ পেতে দেয়।

সহজভাবে, ফলাফলের জন্য এবং ফলাফল পাওয়ার বিভিন্ন উপায় উভয়ের জন্যই, অনুসন্ধানে জেনারেটিভ এআই সহ Google-এর সম্পূর্ণ থ্রোটল চলছে।

  • কখন এটি চালু হবে? গুগল বলেছে যে “মার্কিন যুক্তরাষ্ট্রে ইংরেজিতে অনুসন্ধান ল্যাব ব্যবহারকারীদের জন্য ভিডিও সহ অনুসন্ধান শীঘ্রই উপলব্ধ হবে” এবং “সময়ের সাথে সাথে আরও অঞ্চলে প্রসারিত হবে”

আমরা এর সৃষ্টিতে বিস্মিত হয়েছি OpenAIএর টেক্সট-টু-ভিডিও টুল সোরা গত কয়েক মাস ধরে, এবং এখন গুগল Veo নামক তার নতুন টুলের সাথে জেনারেটিভ ভিডিও পার্টিতে যোগদান. Sora এর মত, Veo 1080p গুণমানে মিনিট-দীর্ঘ ভিডিও তৈরি করতে পারে, সবই একটি সাধারণ প্রম্পট থেকে।

সেই প্রম্পটে সিনেমাটিক ইফেক্ট অন্তর্ভুক্ত থাকতে পারে, যেমন একটি টাইম-ল্যাপস বা এরিয়াল শটের জন্য অনুরোধ, এবং প্রাথমিক নমুনাগুলি চিত্তাকর্ষক দেখায়. আপনাকে স্ক্র্যাচ থেকে শুরু করতে হবে না – একটি কমান্ড সহ একটি ইনপুট ভিডিও আপলোড করুন এবং Veo আপনার অনুরোধের সাথে মেলে ক্লিপটি সম্পাদনা করতে পারে৷ মাস্ক যোগ করার এবং একটি ভিডিওর নির্দিষ্ট অংশগুলিকে টুইক করার বিকল্পও রয়েছে।

খারাপ খবর? Sora মত, Veo এখনও ব্যাপকভাবে উপলব্ধ নয়. Google বলেছে যে এটি ভিডিওএফএক্সের মাধ্যমে নির্মাতাদের নির্বাচন করার জন্য উপলব্ধ হবে, এটির একটি পরীক্ষামূলক ল্যাব বৈশিষ্ট্য, “আসন্ন সপ্তাহগুলিতে।” আমরা একটি বিস্তৃত রোলআউট দেখতে না হওয়া পর্যন্ত এটি কিছুটা সময় হতে পারে, তবে Google বৈশিষ্ট্যটি আনার প্রতিশ্রুতি দিয়েছে YouTube শর্টস এবং অন্যান্য অ্যাপ। এবং যে হবে অ্যাডোব এর AI-উত্পাদিত চেয়ারে অস্বস্তিকরভাবে স্থানান্তরিত হচ্ছে।

  • কখন এটি চালু হবে? এখন তুমি পারো Veo অপেক্ষা তালিকায় যোগ দিন, Google বলেছে যে এটি “ভিডিওএফএক্স-এ ব্যক্তিগত প্রিভিউতে নির্মাতাদের নির্বাচন করার জন্য উপলব্ধ” হবে। Google আরও বলে যে “ভবিষ্যতে, আমরা YouTube Shorts-এ Veo-এর কিছু ক্ষমতাও আনব” এবং অন্যান্য পণ্য

6. অ্যান্ড্রয়েড একটি বড় মিথুন আধান পেয়েছে

গুগল আইও 2024

(ছবির ক্রেডিট: গুগল)

অনেকটা যেমন Google-এর “সার্কেল টু সার্চ” বৈশিষ্ট্যটি একটি অ্যাপ্লিকেশনের উপরে থাকে, জেমিনি এখন আপনার প্রবাহের সাথে একীভূত হওয়ার জন্য Android এর মূল অংশে একত্রিত হচ্ছে৷ যেমন দেখানো হয়েছে, মিথুন এখন আপনার ফোনের স্ক্রিনে কী আছে তা দেখতে, পড়তে এবং বুঝতে পারে, আপনি যা দেখবেন সে সম্পর্কে প্রশ্নগুলিকে পূর্বাভাস দিতে দেয়।

সুতরাং এটি আপনি যে ভিডিওটি দেখছেন তার প্রসঙ্গ পেতে পারে, একটি দীর্ঘ পিডিএফ দেখার সময় একটি সংক্ষিপ্তকরণের অনুরোধের প্রত্যাশা করতে পারে, অথবা আপনি যে অ্যাপটিতে আছেন সে সম্পর্কে অগণিত প্রশ্নের জন্য প্রস্তুত থাকতে পারেন। একটি ফোনের OS-এ একটি বিষয়বস্তু-সচেতন AI বেক করা হয় না ‘কোন প্রসারিত দ্বারা একটি খারাপ জিনিস না এবং সুপার দরকারী প্রমাণ করতে পারে.

সিস্টেম স্তরে Gemini একীভূত হওয়ার পাশাপাশি, মাল্টিমোডালিটি সহ জেমিনি ন্যানো পিক্সেল ডিভাইসে এই বছরের শেষের দিকে লঞ্চ হবে। এটা কি সক্ষম হবে? ঠিক আছে, এটি জিনিসগুলির গতি বাড়াতে হবে, তবে ল্যান্ডমার্ক বৈশিষ্ট্যটি, আপাতত, মিথুন কলগুলি শুনছে এবং এটি স্প্যাম হলে আপনাকে রিয়েল টাইমে সতর্ক করতে সক্ষম হবে৷ এটি বেশ দুর্দান্ত এবং কল স্ক্রীনিং এর উপর ভিত্তি করে তৈরি করা হয়েছে, পিক্সেল ফোনের একটি দীর্ঘস্থায়ী বৈশিষ্ট্য। এটি ক্লাউডে পাঠানোর চেয়ে দ্রুততর এবং ডিভাইসে আরও প্রক্রিয়া করার জন্য প্রস্তুত।

  • কখন এটি চালু হবে? গুগল বলেছে যে ‘মাল্টিমোডালিটি সহ জেমিনি ন্যানো’ “এই বছরের শেষের দিকে পিক্সেলে” উপলব্ধ হবে। সার্কেল টু সার্চের উন্নতি এবং ফোন কলের জন্য নতুন ব্যাঙ্ক স্ক্যাম বৈশিষ্ট্যও “এই বছরের শেষের দিকে” আসবে

7. Google Workspace অনেক বেশি স্মার্ট হয়ে উঠবে

গুগল আইও 2024

(ছবির ক্রেডিট: গুগল)

ওয়ার্কস্পেস ব্যবহারকারীরা মিথুন একীভূতকরণ এবং দরকারী বৈশিষ্ট্যের ভান্ডার পাওয়া যা দৈনিক একটি বড় প্রভাব ফেলতে পারে। মেইলের মধ্যে, বাম দিকে একটি নতুন সাইড প্যানেলের জন্য ধন্যবাদ, আপনি জেমিনিকে একজন সহকর্মীর সাথে সাম্প্রতিক কথোপকথনের সারসংক্ষেপ করতে বলতে পারেন। ফলাফল তারপর সবচেয়ে গুরুত্বপূর্ণ দিক হাইলাইট বুলেট পয়েন্ট সঙ্গে সংক্ষিপ্ত করা হয়.

Google Meet-এ মিথুন আপনাকে মিটিংয়ের হাইলাইট বা কলে থাকা অন্য লোকেরা কী জিজ্ঞাসা করতে পারে তা দিতে পারে। সেই কলের সময় আপনাকে আর নোট নিতে হবে না, এটি দীর্ঘায়িত হলে সহায়ক হতে পারে। Google Sheets-এর মধ্যে, Gemini ডেটা বোঝাতে সাহায্য করতে পারে এবং একটি নির্দিষ্ট যোগফল বা ডেটা সেট টানার মতো অনুরোধগুলি প্রক্রিয়া করতে পারে৷

ভার্চুয়াল টিমমেট “চিপ” সবচেয়ে ভবিষ্যত উদাহরণ হতে পারে। এটি একটি জি-চ্যাটে থাকতে পারে এবং বিভিন্ন কাজ বা প্রশ্নের জন্য ডাকা হতে পারে। যদিও এই টুলগুলি ওয়ার্কস্পেসে প্রবেশ করবে, সম্ভবত প্রথমে ল্যাবসের মাধ্যমে, অবশিষ্ট প্রশ্ন হল তারা কখন নিয়মিত Gmail এবং ড্রাইভ গ্রাহকদের কাছে আসবে। Google-এর সকলের জন্য AI-এর পদ্ধতি বিবেচনা করা এবং অনুসন্ধানের সাথে এটিকে এত কঠিনভাবে চাপ দেওয়া, এটি সম্ভবত সময়ের ব্যাপার।

  • কখন এটি চালু হবে? Gmail, Docs, Drive, Slides এবং Sheets-এ Gemini এর সাইড প্যানেল Gemini 1.5 Pro তে আপগ্রেড করা হবে “আজ থেকে” (14 মে)। Gmail অ্যাপের জন্য, ‘সংক্ষেপিত ইমেল’ বৈশিষ্ট্যটি ওয়ার্কস্পেস ল্যাব ব্যবহারকারীদের জন্য “এই মাসে” (মে) এবং ওয়ার্কস্পেস গ্রাহকদের জন্য জেমিনি এবং Google One AI প্রিমিয়াম গ্রাহকদের জন্য “আগামী মাসে” উপলব্ধ হবে।

তুমি এটাও পছন্দ করতে পারো

Source link

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *