OpenAI est ouvert à autoriser les réponses NSFW générées par ChatGPT et son API, mais le porno est un non catégorique.
Mercredi, la société a publié un Spécification du modèle, un document qui lève un peu le voile sur la manière dont les modèles sont entraînés à répondre à diverses sollicitations. Dans la spécification, OpenAI a partagé des règles sur la manière dont ChatGPT et l'API doivent répondre, y compris des invites pour enfreindre la loi, des questions sur les menaces chimiques, biologiques, radiologiques ou nucléaires (CBRN) et, oui, des invites pour du contenu explicite.
La version GPT-5 d'OpenAI pourrait avoir lieu dès cet été
La politique actuelle d'OpenAI interdit le contenu NSFW. Mais juste en dessous de sa déclaration politique, OpenAI a indiqué qu'elle « étudie si nous pouvons fournir de manière responsable la possibilité de générer du contenu NSFW dans des contextes adaptés à l'âge via l'API et ChatGPT ». Le raisonnement est le suivant : « les développeurs et les utilisateurs devraient avoir la flexibilité d'utiliser nos services comme bon leur semble » tant qu'ils adhèrent aux politiques d'OpenAI. Le contenu NSFW n’est donc pas autorisé pour le moment, mais il pourrait le devenir à l’avenir.
Vitesse de la lumière écrasable
Mais cela ne signifie pas que tout le contenu NSFW pourrait être autorisé. “Nous n'avons pas l'intention de créer de la pornographie générée par l'IA”, a déclaré un porte-parole d'OpenAI à Mashable. “Nous avons des garanties solides dans nos produits pour empêcher les deepfakes, qui sont inacceptables, et nous accordons la priorité à la protection des enfants. Le porte-parole a poursuivi : “Nous croyons également en l'importance d'explorer soigneusement les conversations sur la sexualité dans des contextes adaptés à l'âge”, ce qui correspond à la note dans la spécification du modèle.
La formulation du contenu de NSFW était brève et légèrement ambiguë, ce qui a conduit certains à spéculer qu'OpenAI pourrait bientôt permettre aux utilisateurs de générer du porno IA. La seule mention de types spécifiques de contenu NSFW était dans la déclaration sur ce que les modèles d'IA devraient pas fournir des réponses pour : “L'assistant ne doit pas diffuser de contenu qui n'est pas sûr pour le travail (NSFW) : contenu qui ne serait pas approprié dans une conversation dans un cadre professionnel, qui peut inclure de l'érotisme, du sang extrême, des insultes et des grossièretés non sollicitées.” L'omission notable de la « pornographie » a initialement généré une confusion sur ce qui était autorisé ou qui le serait bientôt.
La pornographie à l’ère de l’IA générative a des conséquences potentiellement dangereuses et désastreuses en raison de la menace de deepfakes non consensuels. UN Etude 2023 de la société de cybersécurité Home Security Heroes a découvert que 98 % de toutes les vidéos deepfakes étaient de la pornographie et que 99 % des sujets étaient des femmes. Même Taylor Swift, une célébrité puissante et reconnaissable, a été victime d'une vague de messages viraux. deepfakes pornographiquessoulignant la prévalence du problème et soulignant l'idée inquiétante selon laquelle cela pourrait arriver à n'importe qui.