Auteur : Frank, PANews
Alors que l'IA passe progressivement de l'effet de mode à l'utilité pratique, le déploiement des applications d'IA s'accélère pour répondre à la demande croissante des consommateurs. Parallèlement, avec l'amélioration continue des capacités des grands modèles, l'IA semble être entrée dans une ère où « tout le monde peut créer un prototype de produit ».
Lors de la muShanghai AI Week, la table ronde "Pratiques innovantes et exploration des voies de l'écosystème de l'IA grand public", animée par PANews, s'est concentrée sur les chemins concrets de déploiement des produits d'IA grand public. Les participants invités comprenaient Feng Wen, responsable produit de la plateforme ouverte MiniMax, Levy, CEO de FateTell, Anita, responsable APAC de Sentient, ainsi que Jiafeng Gao, musicien électronique et développeur indépendant, venant respectivement de domaines variés tels que la plateforme ouverte de modèles, les applications culturelles à l'export, l'écosystème open-source d'IA et la pratique de la création musicale.
Selon les invités, la question centrale de l'IA grand public ne s'est pas simplifiée avec les itérations technologiques. Après le bond en avant des capacités des modèles, les véritables barrières se déplacent vers la compréhension des scénarios, l'organisation des données, l'éducation des utilisateurs, la valeur émotionnelle et la construction d'écosystèmes ouverts.
L'IA n'a pas réduit la difficulté de l'entrepreneuriat, la véritable barrière reste le scénario d'application
Une contradiction courante dans l'industrie de l'IA est la suivante : les modèles deviennent de plus en plus puissants, le seuil d'entrée pour l'entrepreneuriat semble baisser, mais de nombreux produits ont du mal à trouver des scénarios pérennes. Des applications viables aujourd'hui peuvent rapidement perdre leur raison d'être avec la publication de la prochaine version d'un modèle.
Selon Feng Wen, pour un produit d'IA grand public, l'idée du produit et le jugement du scénario restent plus importants. En tant que fournisseur de grands modèles et de plateformes ouvertes, MiniMax met davantage l'accent sur les capacités des modèles fondamentaux, la conception des produits liés aux tokens et l'expérience de bout en bout des développeurs. Mais du point de vue d'un entrepreneur, le produit doit être conçu en fonction du « niveau d'intelligence des modèles dans six mois ».
Son analyse est que, dans un contexte où les lois de mise à l'échelle des modèles restent valables et où leurs capacités continuent de progresser, les entrepreneurs ne doivent pas se limiter excessivement par la vitesse, le coût ou les limites actuelles des modèles, mais doivent plutôt réfléchir plus audacieusement à leurs utilisateurs cibles, aux scénarios concrets et aux problèmes à résoudre. Les fournisseurs de modèles continueront à offrir des capacités moins chères, plus rapides et plus rentables, tandis que la couche applicative doit répondre plus clairement à la question « pourquoi ce scénario ? ».
Levy, de la couche applicative, ajoute une autre source potentielle de barrière. Il estime que la technologie évolue rapidement, mais les données et la compréhension associées à un scénario ne sont pas rapidement nivelées. Beaucoup pensaient autrefois que seuls le fine-tuning des modèles pouvait créer une barrière de données ; mais avec la maturité de l'ingénierie de contexte et de l'ingénierie de prompts, les données et structures accumulées par une application dans la gestion du contexte peuvent également modifier les performances du modèle. En particulier, certaines données hautement spécialisées, liées à la culture ou à des expériences personnalisées, n'entreront pas nécessairement dans les poids d'un modèle généraliste, ce qui pourrait au contraire constituer une base de différenciation pour les produits d'IA grand public face aux itérations des modèles.
Anita émet un avis plus prudent sur "l'IA réduisant le seuil d'entrée entrepreneurial". Elle pense que l'IA facilite effectivement la génération de démos, la construction de prototypes, le lancement rapide d'un produit préliminaire, mais que les véritables difficultés de l'entrepreneuriat ne disparaissent pas, et peuvent même devenir plus saillantes : comment acquérir des clients, comment créer de l'adhésion communautaire, comment réaliser la commercialisation, comment établir des connexions humaines au-delà de la programmation. Elle mentionne que les concepts de "super-individu" et d'"entreprise d'une personne" suscitent un intérêt actuel, mais que les individus qui réussissent vraiment nécessitent souvent des compétences plus composites que le simple fait d'appeler un grand modèle.
De la bazi à la musique : mieux comprendre l'utilisateur devient la barrière de l'IA grand public
Lorsque les capacités technologiques progressent sans cesse, la valeur des produits d'IA grand public doit finalement revenir aux besoins humains.
La pratique de FateTell en est un exemple typique. Levy présente FateTell comme une application de consommation basée sur l'IA et la divination/astrologie chinoise (bazi), destinée aux utilisateurs étrangers, actuellement présente dans plus de 90 pays. L'équipe a dès le départ évité l'orientation des outils purement efficaces, privilégiant la consommation spirituelle et la valeur émotionnelle.
Selon lui, la volonté de connaître son destin, de chercher des explications et du réconfort, est un besoin psychologique fondamental trans-culturel et durable. Il était difficile pour l'IA d'établir la confiance dans ce scénario, mais l'amélioration des capacités de modèles comme DeepSeekR1 aide objectivement les utilisateurs et les investisseurs à comprendre la possibilité que "les grands modèles puissent effectuer des raisonnements et des explications complexes". Le défi pour FateTell n'est pas seulement la capacité du modèle, mais aussi de savoir comment traduire, transposer des concepts culturels chinois comme les tiges célestes et branches terrestres, le Yi Jing, la bazi pour les utilisateurs étrangers, et de leur faire comprendre leur charme par le langage, le visuel et l'interaction.
Jiafeng Gao soulève une question similaire du point de vue du créateur musical : l'IA ne doit pas seulement livrer un résultat, elle doit aussi préserver le processus. Il mentionne que des outils comme Suno rendent la génération musicale très directe, mais sautent aussi le processus créatif, privant les utilisateurs d'un sentiment d'implication et d'appartenance. Pour les musiciens comme pour les utilisateurs ordinaires, la création n'a pas pour seul but d'obtenir une "chanson finie", le processus lui-même fait partie de l'expérience.
Il utilise une analogie avec le football : même si un amateur ne pourra jamais surpasser Messi ou Ronaldo, il continuera à jouer par passion. Il en va de même pour la création musicale. Jiafeng Gao, en développant son MusicAIGameBoy, tente, en s'appuyant sur des grands modèles d'IA ou des petits modèles pour piloter du code musical, combiné à une interaction ludique, de permettre même à des personnes ne connaissant pas la musique de participer à la création en jouant. Pour lui, le véritable scénario n'est pas "générer automatiquement une chanson", mais de restituer à l'utilisateur le processus interactif de création musicale.
Avec l'essor des agents, la logique d'éducation des utilisateurs est en train de changer
Dans les produits d'IA grand public, l'éducation des utilisateurs détermine souvent si le produit sera réellement utilisé.
Feng Wen mentionne que parmi les utilisateurs de la plateforme ouverte MiniMax, certains ont des bases en développement, mais sont encore freinés par la documentation API, les paramètres, les codes d'erreur et les modalités d'utilisation des tokens. À cette fin, la plateforme fournit une plateforme d'essai des modèles, des guides de développement, des démos, des tutoriels vidéo, etc., pour permettre aux développeurs de passer plus rapidement de la compréhension à l'appel.
Avec le développement des agents, les méthodes d'éducation des utilisateurs évoluent également. Auparavant, les utilisateurs devaient lire la documentation, comprendre les interfaces, dépanner les erreurs. Mais avec l'amélioration des performances des agents, aujourd'hui, de nombreux utilisateurs voient les agents lire directement la documentation, rechercher des solutions, choisir le modèle approprié et corriger automatiquement le chemin. Les fournisseurs de modèles doivent bien faire leur travail sur les modèles, la documentation et l'expérience de plateforme, tandis que la communauté, les développeurs et les diverses formes de produits contribueront ensemble à abaisser le seuil d'utilisation.
Pour Sentient, l'écosystème ouvert fait lui-même partie de l'éducation des utilisateurs et du déploiement du produit. Anita explique que Sentient suit l'écosystème open-source de l'IA et les infrastructures associées, et rassemble les développeurs via des hackathons, des programmes de financement, etc. Elle souligne qu'un produit doit d'abord bien identifier ses utilisateurs cibles : qui sont-ils, où se trouvent-ils, par quels canaux établir la confiance. Pour les outils destinés aux développeurs, les hackathons et les partenariats d'écosystème sont des portes d'entrée efficaces ; pour les produits de consommation, les KOL, les KOC et le contenu sur les réseaux sociaux sont tout aussi importants.
Dans un contexte de baisse rapide des coûts de l'AIGC, les équipes entrepreneuriales peuvent produire à moindre coût des bandes-annonces, des supports visuels et du contenu de diffusion, permettant au produit d'acquérir plus rapidement ses premiers utilisateurs. Jiafeng Gao pense également que la conception du produit doit se rapprocher au maximum de l'utilisateur, permettant à l'utilisateur d'apprendre naturellement par l'interaction et le jeu, plutôt que de dépendre de nombreux manuels. Cette méthode d'"apprentissage par l'usage" pourrait être plus adaptée à l'IA grand public que les tutoriels traditionnels.
Le matériel entre dans le monde réel, la personnalisation et la valeur émotionnelle continuent de s'amplifier
Dans les trois à cinq prochaines années, les invités s'accordent généralement à dire que le marché de la consommation d'IA en est encore à un stade de pénétration précoce, mais que les formes de produits évolueront sensiblement.
Feng Wen estime que dans les trois à cinq prochaines années, le matériel intelligent, les robots et l'intelligence incarnée connaîtront un tournant important. Après l'amélioration des capacités des modèles, l'IA n'existera plus seulement dans les interfaces logicielles, mais entrera également dans le monde physique réel pour accomplir davantage d'interactions et de tâches. Certains produits seront destinés aux humains, offrant des gains d'efficacité ou une valeur émotionnelle. D'autres pourraient être destinés aux agents, fournissant à l'IA un environnement, des outils et des infrastructures pour se connecter au monde physique. Mais quelle que soit l'évolution de la forme, le produit doit finalement rester centré sur l'humain, permettant aux personnes de consacrer plus de temps aux connexions humaines, à la famille, au monde réel et à des expériences de vie plus riches.
Levy, quant à lui, pense qu'une prévision sur trois à cinq ans est déjà très difficile dans l'industrie de l'IA, voire même trois à cinq mois sont pleins d'incertitudes. Il estime que bien que les utilisateurs avancés utilisent déjà intensivement des outils comme Claude Code, la majorité des utilisateurs ordinaires en sont encore à un stade de pénétration de l'IA assez précoce. Dans les années à venir, l'IA répondra à des besoins plus fragmentés et plus personnalisés. Comparé aux services relativement "standardisés" de l'ère du mobile, l'IA a la possibilité d'offrir à chacun des services plus concrets et plus spécifiques. Parallèlement, l'anxiété liée au chômage et le sentiment d'incertitude induits par le développement technologique pourraient également amplifier la demande de consommation spirituelle, comme l'accompagnement psychologique.
Anita résume ce changement comme une "démocratisation de la technologie". Elle pense qu'à l'avenir, les distinctions entre littéraire, scientifique, artistique, technique s'estomperont. Un petit commerçant pourra peut-être, grâce à l'IA, créer des publicités, diffuser des informations ciblées, et ainsi améliorer son activité. La valeur de l'IA n'est pas nécessairement de faire de chacun un programmeur de haut niveau, mais d'aider les personnes dans différents scénarios de vie à obtenir de meilleurs outils. Simultanément, la peur du chômage et le sentiment de solitude stimuleront la demande de valeur émotionnelle, et les produits matériels, animaux de compagnie IA, dispositifs d'accompagnement et produits à interaction multi-sensorielle bénéficieront de plus d'opportunités.
Jiafeng Gao part de l'évolution des formes culturelles. Il pense qu'à l'avenir, les formes de contenu comme la musique, le cinéma, la vidéo seront réorganisées, et même l'unité minimale de consommation musicale, la "chanson", n'est pas certaine de perdurer. Les concepts actuels de pistes audio séparées, de canaux sonores, pourraient continuer à être décomposés en unités de création plus atomiques. Mais alors que la forme se dissout, les liens émotionnels portés par les IP, les marques et les personnages concrets gagneront en importance. Ce que les gens recherchent n'est pas toujours une œuvre parfaite, mais un objet imparfait, chaleureux, capable d'établir une relation affective.
Bien que les invités n'aient pas donné une réponse unique à l'IA grand public, les discussions venant de domaines différents - plateforme de modèles, application culturelle, écosystème open-source, création musicale - pointent toutes vers la même tendance : lorsque les capacités des modèles continuent de progresser, la concurrence dans l'IA grand public ne se résume plus à "qui utilise le modèle le plus puissant", mais à savoir qui comprend le mieux les utilisateurs, les scénarios réels et les besoins émotionnels.
Le futur écosystème de consommation d'IA pourrait inclure simultanément des infrastructures ouvertes plus robustes, un seuil de développement plus bas, des services plus personnalisés, des dispositifs matériels plus aptes à l'accompagnement, ainsi que de nouvelles formes de produits centrées sur la culture et le processus de création. Les modèles continueront d'évoluer, mais ce qui restera vraiment, ce sont les produits capables d'être nécessaires, compris et de créer un lien avec les êtres humains.







