OpenAI শীঘ্রই একটি মাল্টিমডাল AI ডিজিটাল সহকারী আত্মপ্রকাশ করতে পারে

By infobangla May12,2024

ওপেনএআই তার কিছু গ্রাহককে একটি নতুন মাল্টিমডাল এআই মডেল দেখাচ্ছে যা আপনার সাথে কথা বলতে এবং বস্তু চিনতে পারে, থেকে নতুন রিপোর্ট তথ্য. নাম প্রকাশে অনিচ্ছুক সূত্রের উদ্ধৃতি দিয়ে যারা এটি দেখেছেন, আউটলেট বলেছে যে এটি কোম্পানির অংশ হতে পারে সোমবার দেখানোর পরিকল্পনা রয়েছে.

নতুন মডেলটি এর বিদ্যমান পৃথক ট্রান্সক্রিপশন এবং টেক্সট-টু-স্পীচ মডেলগুলি যা করতে পারে তার চেয়ে দ্রুত, চিত্র এবং অডিওর আরও সঠিক ব্যাখ্যা প্রদান করে বলে জানা গেছে।. এটি স্পষ্টতই গ্রাহক পরিষেবা এজেন্টদের সাহায্য করতে সক্ষম হবে “কলারদের কণ্ঠস্বর বা তারা ব্যঙ্গাত্মক হচ্ছে কিনা তা আরও ভালভাবে বুঝতে” এবং “তাত্ত্বিকভাবে,” মডেলটি শিক্ষার্থীদের গণিত বা বাস্তব-বিশ্বের লক্ষণ অনুবাদ করতে সাহায্য করতে পারে, লিখেছেন তথ্য.

আউটলেটের সূত্রগুলি বলছে যে মডেলটি GPT-4 Turbo-কে ছাড়িয়ে যেতে পারে “কিছু ধরণের প্রশ্নের উত্তর দিতে” কিন্তু এখনও আত্মবিশ্বাসের সাথে কিছু ভুল হওয়ার জন্য সংবেদনশীল।

এটা সম্ভব যে ওপেনএআই ফোন কল করার জন্য একটি নতুন বিল্ট-ইন চ্যাটজিপিটি ক্ষমতাও প্রস্তুত করছে, ডেভেলপার অনয় অরোরার মতে, যিনি কল-সম্পর্কিত কোডের উপরের স্ক্রিনশট পোস্ট করেছেন। আরোরাও দাগযুক্ত প্রমাণ যে ওপেনএআই রিয়েল-টাইম অডিও এবং ভিডিও যোগাযোগের উদ্দেশ্যে সার্ভারের ব্যবস্থা করেছে।

এর কোনোটিই GPT-5 হবে না, যদি এটি আগামী সপ্তাহে উন্মোচিত হয়। সিইও স্যাম অল্টম্যান আছে স্পষ্টভাবে অস্বীকার করা হয়েছে যে মডেলের সাথে এর আসন্ন ঘোষণার কোনো সম্পর্ক আছে যা হওয়ার কথা “বস্তুগতভাবে ভালGPT-4 এর চেয়ে। তথ্য লিখেছেন GPT-5 বছরের শেষ নাগাদ সর্বজনীনভাবে প্রকাশিত হতে পারে।

Source link

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *