L’IA générative ChatGPT d’OpenAI peut désormais parler avec les utilisateurs

Par Florentin 4 Min de Lecture

OpenAI continue d’améliorer son chatbot ChatGPT en ajoutant de nouvelles fonctionnalités qui rapprochent l’expérience utilisateur de celle d’une conversation humaine. Les utilisateurs de ChatGPT peuvent désormais interagir avec l’IA de manière vocale et même lui montrer des images pour enrichir leurs échanges.

Conversation vocale avec ChatGPT

L’une des avancées majeures est la capacité de ChatGPT à maintenir une conversation vocale. Cette fonctionnalité est rendue possible grâce à un modèle de synthèse vocale avancé, capable de générer des voix humaines à partir de texte. OpenAI a collaboré avec des professionnels de la voix pour créer différentes voix, offrant aux utilisateurs un choix varié. Le système de reconnaissance vocale open source de OpenAI, Whisper, est utilisé pour transcrire la parole en texte, facilitant ainsi la communication vocale.

OpenAI ChatGPT parler
Conversation vocale avec ChatGPT

Pour activer la fonction de conversation vocale, les utilisateurs peuvent accéder aux paramètres de l’application mobile, puis sélectionner “Conversations Vocales”. Ils ont ensuite la possibilité de choisir parmi les cinq voix disponibles, rendant l’expérience de conversation encore plus personnalisée.

Annonces

Analyse d’images avec ChatGPT

Une autre innovation majeure est la capacité de ChatGPT à comprendre et analyser les images. Les utilisateurs peuvent désormais montrer des images à ChatGPT pour renforcer leurs discussions. Par exemple, ils peuvent explorer la nature et lui demander des précisions sur une plante quelconque, montrer le contenu de leur réfrigérateur pour décider de leur prochain repas ou analyser des graphiques complexes liés au travail.

OpenAI ChatGPT parler
Générateur d’images ChatGPT

L’analyse d’images est prise en charge par les modèles GPT-3.5 et GPT-4, qui appliquent leur compréhension linguistique au contenu visuel, y compris les photographies, les captures d’écran et les documents mixtes texte-image.

Risques et Utilisation Prudente

Bien que ces avancées offrent des possibilités passionnantes, OpenAI souligne également les nouveaux risques. Il existe la possibilité pour des acteurs malveillants d’usurper l’identité de personnalités publiques ou de commettre des fraudes en utilisant ces habiletés. C’est pourquoi OpenAI limite actuellement l’utilisation de cette technologie à la conversation vocale.

Spotify fait par ailleurs partie des partenaires qui tirent parti de cette capacité en l’intégrant dans son projet pilote de traduction vocale. Cela permet aux podcasteurs de traduire leurs émissions dans d’autres langues tout en conservant leur propre voix.

Déploiement progressif

Cette mise à jour de ChatGPT sera initialement disponible pour les utilisateurs Plus et Enterprise au cours des prochaines semaines. Cependant, OpenAI prévoit d’étendre l’accès à d’autres types d’utilisateurs, y compris les développeurs, à l’avenir.

OpenAI ChatGPT parler
ChatGPT

La fonction vocale est disponible sur les plates-formes iOS et Android, tandis que la potentialité d’analyse d’images sera disponible sur toutes les plates-formes. Il est important de noter que le modèle de ChatGPT a ses limites, notamment en ce qui concerne les langues autres que l’anglais, où ses performances peuvent être moins efficaces.

OpenAI continue de faire évoluer ChatGPT pour offrir une expérience utilisateur plus riche et plus humaine. Avec la conversation vocale et la compréhension des images, ChatGPT se rapproche de plus en plus d’une interaction humaine authentique tout en tenant compte des défis de sécurité potentiels.

Annonces

Ces articles pourraient vous intéresser :

Laisser un commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *