OpenAI يمنح ChatGPT صوتًا للرد على المطالبات والأوامر

OpenAI يمنح ChatGPT صوتًا للرد على المطالبات والأوامر
القراء مثلك يساعدون في دعم MUO. عند إجراء عملية شراء باستخدام الروابط الموجودة على موقعنا، قد نكسب عمولة تابعة. اقرأ أكثر.

تم إعداد ChatGPT ليصبح تجربة ذكاء اصطناعي تفاعلية. كشفت OpenAI أن برنامج الدردشة الآلي الرائد في العالم الذي يعمل بالذكاء الاصطناعي سيكون قادرًا على التحدث والرد على استفسارات المستخدم باستخدام صوت مركب، يُفترض أنه تم إنشاؤه بواسطة الذكاء الاصطناعي.





إلى جانب صوته المكتشف حديثًا، سيتمكن ChatGPT أيضًا من الرد ومناقشة صور معينة تم تحميلها عليه أو التقاطها أثناء استخدام تطبيق ChatGPT Android أو iOS. تبدو ميزة التعرف على الصور مشابهة لـ Google Lens والتطبيقات الأخرى التي تستخدم الشبكات العصبية لاكتشاف البيانات والمعلومات بدقة.





OpenAI يمنح ChatGPT صوتًا

في 25 سبتمبر 2023، قام مطور ChatGPT كشفت OpenAI من شأنه أن يمنح برنامج الدردشة الآلي الرائد عالميًا صوتًا. يمكن لمستخدمي ChatGPT التحدث مباشرة إلى chatbot ومطالبته بالرد، مما يسمح لـ ChatGPT بالتحدث مباشرة بالصوت لأول مرة.





يُظهر مقطع نموذج OpenAI امرأة تطلب من ChatGPT إنشاء قصة فريدة قبل النوم، والتي يستجيب لها ChatGPT على النحو الواجب بصوت نسائي مركب.

وفق سلكي ، تم تطوير نموذج تحويل النص إلى كلام الجديد داخليًا. يمكنه إنشاء صوت 'شبيه بالإنسان' من النص وبضع ثوانٍ من عينة الكلام ( باستخدام نموذج OpenAI Whisper ) والتحدث بألوان وأساليب مختلفة. يمكنك العثور على مجموعة من العينات الصوتية على مدونة OpenAI .



بدأت بعض الشركات بالفعل في استخدام النموذج الصوتي الجديد لـ OpenAI. على سبيل المثال، يستخدم Spotify نموذج تحويل النص إلى كلام الخاص بـ OpenAI لترجمة البودكاست إلى لغات مختلفة، ويجمع بين براعة ترجمة اللغة في ChatGPT وقدرته الجديدة على التحدث.

نموذج ChatGPT الجديد لتحويل النص إلى كلام متاح فقط لمشتركي Plus وEnterprise الذين يستخدمون تطبيقات Android وiOS الرسمية ومن المتوقع طرحه خلال الأسبوعين المقبلين (بدءًا من 25 سبتمبر 2023). علاوة على ذلك، تقتصر ميزة الصوت الجديدة على اللغة الإنجليزية في البداية، على الرغم من أننا نتوقع أن يتغير هذا بسرعة.





يمكن لـ ChatGPT التعرف على الصور الفوتوغرافية

الجزء الثاني من تحديث ChatGPT الخاص بـ OpenAI هو القدرة على تحليل الصور التي تم تحميلها إلى الأداة والتحدث عنها. تم عرض خيار تحليل الصور المرئية في مقاطع فيديو تحديث GPT-4 ولكن لم تتم مناقشته كثيرًا منذ ذلك الوقت ( مترجم رمز ChatGPT جانبًا ).

الآن، يكتسب ChatGPT وظائف مشابهة لـ Google Lens. يمكنك تحميل صورة إلى ChatGPT أو التقاط صورة باستخدام كاميرا هاتفك الذكي في تطبيق ChatGPT، وسيقوم التطبيق بإظهار تفاصيل الصورة وإضافة المزيد من السياق عند الحاجة.





إن وصفها بأنها 'شبيهة بـ Google Lens' يعد ظلمًا حقًا. إن القدرة على الدردشة ذهابًا وإيابًا حول الصورة للحصول على مزيد من المعلومات والسياق تجعلها مفيدة للغاية لمجموعة واسعة من الإعدادات. ومع ذلك، من المهم ملاحظة التفاصيل الدقيقة، حيث أوضح OpenAI أنه قد حد من 'قدرة ChatGPT على التحليل والإدلاء ببيانات مباشرة عن الأشخاص' لأسباب تتعلق بالخصوصية والدقة. ومع ذلك، هل يمكن أن تكون أداة 'من هذا' التي تعمل بنظام OpenAI قيد العمل في المستقبل؟ (دعونا نأمل لا!)

كيف ترى ما تحب على كرمة

مثل نموذج تحويل النص إلى كلام الجديد، ستطرح OpenAI ميزة التعرف على الصور في الأسبوعين المقبلين، على الرغم من أنها ستكون متاحة على جميع الأنظمة الأساسية، وليس فقط تطبيق ChatGPT.

الخصوصية والأمن وقضايا أخرى

إن الآثار المترتبة على تطبيق ChatGPT الذي يعمل بالطاقة الصوتية صارخة. بالتأكيد، إنه أمر مثير. ومع ذلك، فإن القدرة على إنشاء صوت مركب بشكل فريد باستخدام مقتطف قصير فقط كمثال ينطوي على مشكلات كبيرة تتعلق بالخصوصية والأمان. إن احتمال قيام الجهات الفاعلة الخبيثة باستغلال هذه الأدوات هائل، وكما هو الحال مع أي أداة توليدية للذكاء الاصطناعي، بمجرد خروج الجني من القمقم، فلن يعود إليه مطلقًا. ولا يمكن لأي قدر من تنظيم الذكاء الاصطناعي من جانب الحكومات أو قادة الفكر التراجع. المد.

حتى تحذير OpenAI حول هذا الموضوع يبدو وكأنه يلتف حول ما هو واضح على الرغم من ذكر المشكلات:

ومع ذلك، فإن هذه القدرات تمثل أيضًا مخاطر جديدة، مثل احتمال قيام الجهات الفاعلة الخبيثة بانتحال شخصيات عامة أو ارتكاب عمليات احتيال. ولهذا السبب نستخدم هذه التقنية لتشغيل حالة استخدام محددة، ألا وهي الدردشة الصوتية.

نظرًا لأن هذا هو غيض من فيض، توقع معارضة لصوت ChatGPT المكتشف حديثًا، خاصة عندما يكون هناك ارتفاع متوقع في العناوين الرئيسية البغيضة التي تدعي أن ChatGPT يُستخدم لارتكاب عمليات احتيال وما إلى ذلك.

OpenAI تجعل ChatGPT تطبيق Go-To AI

كلما أضاف OpenAI ميزات سهلة الاستخدام إلى ChatGPT، أصبح تطبيق الذكاء الاصطناعي المولد الأكثر استخدامًا. باعتباره أول من وصل إلى شهرة واسعة النطاق خلال طفرة الذكاء الاصطناعي الأولية، لا يزال ChatGPT يقود الطريق وهو التطبيق الوحيد الذي يستخدمه البعض، على الرغم من المنافسة من أمثال Google Bard (وربما Google Gemini) وAnthropic's Claude.

وطالما أن OpenAI يمكنه الاستمرار في إضافة ميزات تجعل ChatGPT أسهل في الاستخدام، فسوف يبقي الأشخاص مدمنين ويدفعهم إلى الاقتراب أكثر من هدفه المتمثل في أداة ذكاء اصطناعي متعددة الوسائط حقًا.