Skip to content
Electronix.ma logo Electronix: Le Premier Guide Marocain des Produits électroniques

  • Blog
    • News
    • Energie
    • Gaming
    • Maison
    • Multimédia
    • Objets Connectés
    • Photo & Caméscopes
    • Réseaux
    • PC
      • Informatique
      • Composant PC
      • Pc Portable
      • Pc fixe
      • Stockage
    • Téléphonie
      • Accessoires Téléphonie
      • Smartphone
      • Téléphones fixes
      • Tablette
    • TV
    • Voiture
  • Contactez Nous
  • à propos
  • Politique de Confidentialité
Electronix.ma logo
Electronix: Le Premier Guide Marocain des Produits électroniques

ChatGPT déploie des fonctionnalités voix et image

electronix, 26 September 2023

Le chatbot préféré de tous peut désormais voir, entendre et parler. Lundi, OpenAI a annoncé de nouvelles capacités multimodales pour ChatGPT. Les utilisateurs peuvent désormais avoir des conversations vocales ou partager des images avec ChatGPT en temps réel.

Les fonctionnalités audio et multimodales sont devenues la prochaine étape dans une concurrence féroce en matière d’IA générative. Meta récemment lancée AudioCraft pour générer de la musique avec l’IA et Google Bard et Microsoft Bing ont tous deux déployé des fonctionnalités multimodales pour leurs expériences de chat. La semaine dernière, Amazon a présenté en avant-première une version remaniée d’Alexa qui sera alimentée par son propre LLM (grand modèle de langage), et même Apple expérimente la voix générée par l’IA, avec Personal Voice.

Les capacités vocales seront disponibles sur iOS et Android. Comme Alexa ou Siri, vous pouvez appuyer pour parler à ChatGPT et il vous répondra dans l’une des cinq options vocales préférées. Contrairement aux assistants vocaux actuels, ChatGPT est alimenté par des LLM plus avancés, vous entendrez donc le même type de réponse conversationnelle et créative que les GPT-4 et GPT-3.5 d’OpenAI sont capables de créer avec du texte. L’exemple partagé par OpenAI dans l’annonce consiste à générer une histoire au coucher à partir d’une invite vocale. Ainsi, les parents épuisés à la fin d’une longue journée peuvent confier leur créativité à ChatGPT.

La reconnaissance multimodale est quelque chose qui était prévu depuis un certain temps et qui est désormais lancée de manière conviviale pour ChatGPT. Quand GPT-4 est sorti En mars dernier, OpenAI a démontré sa capacité à comprendre et interpréter des images et des textes manuscrits. Cela fera désormais partie de l’utilisation quotidienne de ChatGPT. Les utilisateurs peuvent télécharger une image de quelque chose et en parler à ChatGPT – en identifiant un nuage ou en élaborant un plan de repas basé sur une photo du contenu de votre réfrigérateur. Le multimodal sera disponible sur toutes les plateformes.

Comme pour toute avancée en matière d’IA générative, de graves problèmes d’éthique et de confidentialité doivent être pris en compte. Pour atténuer les risques de deepfakes audio, OpenAI affirme n’utiliser sa technologie de reconnaissance audio que pour le cas d’utilisation spécifique du « chat vocal ». En outre, il a été créé avec des doubleurs avec lesquels ils ont « directement travaillé ». Cela dit, l’annonce ne précise pas si les voix des utilisateurs peuvent être utilisées pour entraîner le modèle, lorsque vous optez pour le chat vocal. Concernant les capacités multimodales de ChatGPT, OpenAI affirme avoir « pris des mesures techniques pour limiter considérablement la capacité de ChatGPT à analyser et à faire des déclarations directes sur les personnes, car ChatGPT n’est pas toujours précis et ces systèmes doivent respecter la vie privée des individus ». Mais le véritable test des utilisations néfastes ne sera connu qu’après sa libération dans la nature.

Le chat vocal et les images seront déployés auprès des utilisateurs de ChatGPT Plus et Enterprise au cours des deux prochaines semaines, et de tous les utilisateurs « peu de temps après ».

News ChatGPTdéploiedesFonctionnalitésImageVoix

Post navigation

Previous post
Next post

Related Posts

News

L’avenir de l’iPhone : le modem 5G personnalisé d’Apple devrait modifier sa conception et son utilisation

20 September 2024

Apple alloue des milliards de dollars au développement d’un modem cellulaire interne ; cependant, les utilisateurs ne doivent pas s’attendre à des améliorations immédiates de cette initiative. A lire aussi : Fausse alerte ! La fuite d’une affiche de lancement de l’iPhone 16 est démystifiée comme une farce Un modem…

Read More
News

ChatGPT va-t-il commencer à diffuser des publicités auprès des utilisateurs américains dans les semaines à venir ? Voici ce que vous devez savoir

21 April 2026

OpenAI a confirmé qu’il commencerait à afficher des publicités. L’information a été confirmée par un porte-parole de l’entreprise à Reuters dans un e-mail, qui mentionnait que le déploiement serait applicable aux utilisateurs de la version Free and Go de ChatGPT aux États-Unis dans les semaines à venir. Ce déploiement étend…

Read More
News

La fonction iPhone Emergency SOS d’Apple a sauvé une femme et son chien pris dans une crue soudaine

5 September 2023

Une femme et son chien ont été secourus après une crue soudaine dans l’Utah grâce à une fonction d’urgence sur son iPhone. Une femme de 38 ans a pu envoyer ses coordonnées GPS via la fonction SOS d’urgence par satellite d’Apple après avoir été emportée par les eaux de crue,…

Read More

Leave a Reply Cancel reply

You must be logged in to post a comment.

©2026 Electronix: Le Premier Guide Marocain des Produits électroniques | WordPress Theme by SuperbThemes