Note de la rédaction : Le 14 mai, Cerebras a fait son entrée officielle au Nasdaq sous le symbole CBRS. Sa clôture le premier jour était d'environ 68 % supérieure au prix d'introduction, ce qui en fait l'une des introductions en bourse de matériel IA les plus suivies depuis 2026.
Cet article est écrit par Steve Vassallo, un investisseur précoce de Cerebras. Il retrace la collaboration de dix-neuf ans qu'il a entretenue avec Andrew Feldman, de SeaMicro à Cerebras. En surface, l'histoire raconte le parcours d'un investissement en capital-risque depuis le terme sheet jusqu'à l'introduction en bourse. En réalité, il documente comment une entreprise de matériel de pointe a parié sur une refonte fondamentale de l'architecture de calcul pour l'IA à une époque où le consensus ne lui était pas favorable. De la puce à l'échelle d'une tranche de silicium aux goulets d'étranglement de la bande passante mémoire, en passant par l'alimentation électrique, le refroidissement et la continuité électrique d'une série de points de connexion, les défis auxquels Cerebras a fait face n'étaient pas des problèmes techniques isolés, mais bien une réinvention complète d'un système de calcul moderne.
Le plus remarquable n'est pas que Cerebras ait finalement produit une puce à l'échelle d'une tranche de silicium 58 fois plus grande qu'une puce traditionnelle, mais que cette entreprise a choisi dès le début une direction opposée à l'inertie de l'industrie. Alors que les GPU devenaient la réponse par défaut pour l'entraînement de l'IA, elle a tenté de redéfinir « ce qu'est un ordinateur conçu pour l'IA ». Cela nécessitait à la fois un jugement technique, de la patience de la part des investisseurs et une relation de confiance à long terme et non transactionnelle entre les investisseurs et l'équipe fondatrice.
Pour la concurrence actuelle dans le matériel IA, la signification de Cerebras est de rappeler au marché que la révolution de la puissance de calcul ne vient pas seulement de l'empilement de plus de GPU, mais qu'elle peut aussi naître d'une réimagination de l'architecture de calcul elle-même.
Voici l'article original :
Le vendredi 1er avril 2016, j'ai envoyé un email à Andrew Feldman pour lui dire que j'enjamberais la clôture de son jardin et lui remettrais personnellement notre terme sheet d'investissement dans Cerebras.
C'était le jour du poisson d'avril, mais je ne plaisantais pas.
À strictement parler, ce n'est pas l'opération standard d'une société de capital-risque. Mais à ce moment-là, je connaissais Andrew depuis neuf ans, et nous discutions de sa prochaine entreprise depuis près de deux ans. Je ne pouvais pas manquer cette opportunité à cause d'une phrase d'un contrat que nous retravaillions encore un samedi après-midi.
J'ai rencontré Andrew pour la première fois en octobre 2007. Lui et Gary Lauterbach venaient de fonder SeaMicro. Je n'avais pas investi dans ce tour de table, mais nous nous sommes très bien entendus, et j'admirais particulièrement leur façon d'aborder les problèmes à partir des premiers principes. Depuis lors, je les suivais de près.
Les relations véritablement précieuses ont besoin de temps pour mûrir. Il en va de même pour les entreprises véritablement précieuses. Aujourd'hui, de l'extérieur, Cerebras est une entreprise âgée de dix ans sur le point d'être cotée en bourse. Mais pour moi, c'est une relation de dix-neuf ans qui arrive enfin à son apogée avec la cloche d'ouverture.
Relations profondes et ambition déraisonnable
Lorsque AMD a racheté SeaMicro en 2012, j'avais le pressentiment qu'Andrew ne resterait pas longtemps dans une grande entreprise. Il avait une forte volonté de ne pas se soumettre et un esprit rebelle. Début 2014, il cherchait déjà des opportunités pour partir, et nous commencions à nous rencontrer fréquemment pour discuter de ce qu'il pourrait faire ensuite.
À l'époque, deux choses étaient loin d'être des consensus : premièrement, que l'IA deviendrait vraiment utile ; deuxièmement, que les GPU n'étaient pas l'architecture de calcul la plus adaptée à l'IA.
Concernant la première question, même les personnes intelligentes que je connaissais étaient divisées. Après l'apparition d'AlexNet en 2012, certains cercles de la communauté de recherche commençaient déjà à obtenir des résultats quasi magiques avec les réseaux neuronaux convolutifs. Mais dans l'industrie du logiciel au sens large, l'IA se situait encore entre un mot à la mode marketing et un projet de recherche.
La deuxième question, celle du matériel, n'avait pratiquement pas encore été sérieusement posée. Les GPU étaient devenus le choix par défaut pour l'entraînement des réseaux neuronaux, principalement parce que les chercheurs avaient découvert par hasard qu'ils étaient « moins mauvais » que les CPU pour cela. Créer un nouveau système de calcul spécifiquement conçu pour les charges de travail de l'IA signifiait défier l'architecture dominante utilisée à l'époque par les chercheurs du monde entier.
Mais Andrew, Gary et leurs cofondateurs Sean, Michael et JP voyaient une direction différente. Ils avaient chacun accumulé des décennies d'expérience dans les domaines des puces et des systèmes : Gary venait de travaux pionniers sur le flux de données et l'exécution dans le désordre datant des années 80 ; Sean était spécialisé dans les architectures de serveurs avancées ; Michael s'occupait des logiciels et des compilateurs ; JP était expert en ingénierie matérielle. C'était un groupe de personnes extrêmement rares : prises individuellement, chacune était exceptionnelle ; mises ensemble, leurs capacités se multipliaient. Ils étaient capables d'imaginer un tout nouvel ordinateur.
Ils croyaient que si l'IA libérait son véritable potentiel, le marché qui en résulterait serait bien plus grand que la somme de toutes les formes de calcul existantes.
Ils voyaient aussi clairement la nature des GPU : il s'agissait à l'origine d'une puce conçue pour le traitement graphique, qui avait été réquisitionnée comme outil d'entraînement de l'IA sur un nouveau champ de bataille. Ils étaient en effet meilleurs que les CPU pour le traitement parallèle, mais si l'on concevait une architecture de zéro pour des charges de travail d'IA, personne ne concevrait quelque chose comme un GPU. Ce qui limitait réellement la capacité des réseaux neuronaux n'était pas la puissance de calcul brute, mais la bande passante mémoire. Cela signifiait que la puce qu'ils devaient créer devait optimiser non pas la multiplication matricielle dans des cœurs isolés, mais la manière dont les données circulent efficacement dans toute la structure de calcul.
Au sein de notre fonds, investir dans Cerebras était loin d'être une décision consensuelle. Plusieurs de mes associés avaient vu de près le cycle précédent d'investissements dans les semi-conducteurs ne produire pratiquement que des pertes, et ils avaient exprimé leurs inquiétudes très franchement. Mais finalement, nous nous sommes mis d'accord en tant qu'équipe. Ce week-end d'avril 2016, nous avons clairement dit à Andrew : nous voulions être les premiers investisseurs à lui remettre un terme sheet.
Quelques semaines plus tard, Andrew, Gary, Sean, Michael et JP ont emménagé dans notre espace de bureaux EIR au deuxième étage du 250 Middlefield. Je conserve encore le plan dessiné par le gestionnaire de l'époque. Sur ce plan, Cerebras était assis à côté d'un fondateur de Foundation, et à quelques portes seulement de Bhavin Shah, qui a ensuite fondé Moveworks. C'était un étage idéal pour la croissance d'une startup.
Savoir quelles règles peuvent être pliées, quelles règles doivent être brisées
Avant Cerebras, la plus grande puce de l'histoire de l'informatique mesurait environ 840 mm², soit à peu près la taille d'un timbre-poste. La puce que Cerebras a créée a une surface de 46 000 mm², soit 58 fois plus grande.
Choisir une puce à l'échelle d'une tranche de silicium signifiait également choisir tous les défis de conception en aval qui l'accompagnaient. En près de 80 ans d'histoire de l'informatique, personne n'avait jamais vraiment réussi à le faire. Cela signifiait aussi que personne n'avait jamais résolu de manière systématique ces problèmes : comment alimenter une puce aussi énorme ? Comment la refroidir ? Comment maintenir la continuité électrique entre des dizaines de milliers de points de connexion ?
Pour réaliser le calcul à l'échelle d'une tranche de silicium, Cerebras devait pratiquement réinventer simultanément chaque aspect du calcul moderne : les semi-conducteurs, les systèmes, les structures de données, les logiciels et les algorithmes. Chacune de ces directions aurait pu constituer une startup à elle seule. Andrew et son équipe ont choisi de s'attaquer d'abord aux problèmes techniques les plus ardus. Grâce à leurs efforts intenses et quasi inlassables, ces problèmes ont été progressivement résolus les uns après les autres.
Toutes les six à huit semaines, nous avions une réunion du conseil d'administration. Ils nous présentaient ce qu'ils avaient essayé depuis la dernière réunion : une nouvelle variante de conception système, un nouveau schéma d'alimentation électrique, ou un ajustement de la gestion thermique. En confrontant à maintes reprises les défis systémiques sous tous les angles, ils avaient développé une capacité précieuse et durement acquise à s'exprimer clairement. Ils expliquaient où ils pensaient que le problème se situait, et ce qu'ils comptaient essayer ensuite.
Nous posions des questions, puis creusions avec l'équipe, mobilisant les personnes, les ressources et les relations nécessaires pour les aider à trouver de nouvelles pistes. Six à huit semaines plus tard, lors de la réunion suivante, l'histoire se répétait sur un autre problème technique : une autre frontière à explorer. Chaque solution révélait le problème suivant qu'il fallait résoudre.
Leur premier prototype de tranche de silicium a pris feu dès la première mise sous tension. L'équipe a qualifié cela d'« événement thermique » — c'est généralement le terme qu'on utilise quand on ne veut pas effrayer le conseil d'administration ou le propriétaire des lieux avec le mot « incendie ».
Je calculais constamment la consommation d'énergie par millimètre carré, par curiosité, mais aussi parce que ces chiffres semblaient trop élevés pour être vrais. Nous avons donc fait appel aux ingénieurs d'Exponent. Cette entreprise est spécialisée dans l'analyse des défaillances, et son ancien nom était justement Failure Analysis. Ils ont confirmé que ces chiffres de consommation étaient aussi audacieux qu'ils en avaient l'air, et nous ont aidés à envisager une série de solutions qui ne défiaient pas la seconde loi de la thermodynamique. Après tout, c'était une loi qu'Andrew était suffisamment intelligent pour ne pas vouloir contester.
La discipline d'un ingénieur consiste à savoir quelles règles peuvent être brisées, lesquelles peuvent être pliées et lesquelles doivent être respectées. Andrew et son équipe possédaient un jugement éprouvé sur cette distinction. Ils savaient quand ils défiaient une convention — c'est ce qu'ils voulaient faire — et quand ils défiaient une loi de la physique — ce n'était pas leur objectif.
Quand on construit une technologie de pointe, l'échec est inévitable. La seule façon de traverser les échecs, c'est la discipline, la persévérance, et surtout, la confiance : confiance dans la mission, confiance les uns dans les autres, et confiance dans le fait que, après l'autodestruction du premier prototype, vous serez tous de retour au laboratoire le lendemain matin pour la prochaine itération.
Ce type de travail n'a pas de version transactionnelle. Il n'existe qu'une version à long terme : rester dans la salle, au milieu des solutions encore incomplètes et des explications patientes. Ainsi, quand le succès arrive enfin, vous êtes là pour en être témoin.
Ce moment est arrivé en août 2019. Andrew, Sean et leur équipe se tenaient dans le laboratoire, regardant un tout nouvel ordinateur qu'ils avaient conçu eux-mêmes fonctionner pour la première fois. Pour un profane, en surface, il ne semblait rien faire d'intéressant. Selon Andrew, le spectacle était probablement aussi ennuyeux que de regarder de la peinture sécher. Mais la différence cette fois-ci était la suivante : jamais auparavant un « pot de peinture » de ce type n'avait réellement séché. Ils sont restés ensemble à le regarder pendant 30 minutes, puis sont retournés travailler.
Construire avec qui, c'est crucial
Certaines personnes choisissent les problèmes en fonction de ce qu'elles savent pouvoir résoudre. Andrew choisit les problèmes en fonction de ce qu'il croit valoir la peine d'être résolu. Les itérations progressives ne l'enthousiasment pas, il veut un saut de 1000 fois. Dès le premier jour, il voulait faire de Cerebras une entreprise d'une génération, unique en son genre.
Cette motivation provient en partie de sa personnalité. Andrew la décrit comme une « maladie » d'architecte informatique — être obsédé par une idée pendant des décennies. Mais à mes yeux, c'est plus largement une « maladie » de fondateur. Il examine un problème et se demande d'abord : puis-je créer quelque chose qui apporte une amélioration par bonds ? Ensuite, il se demande : si je réussis, est-ce que quelqu'un s'en souciera ? Si la réponse aux deux questions est oui, il y consacrera les dix prochaines années de sa vie.
L'autre partie de cette motivation vient de son environnement familial. Andrew a grandi entouré de génies aussi naturellement que la plupart des enfants grandissent en regardant la télévision. Son père était un professeur pionnier en biologie de l'évolution. Tous les dimanches, il jouait au tennis en double avec six personnes à tour de rôle. Parmi ces six personnes, trois ont ensuite reçu le prix Nobel, et une a reçu la médaille Fields.
Selon Andrew, ces géants prenaient patiemment le temps de lui expliquer leurs travaux en physique, mathématiques et biologie moléculaire dans un langage qu'un enfant pouvait comprendre. Il en a retiré une impression profante de ce à quoi ressemble une véritable intelligence ; et il a aussi compris, comme le disait sa mère, qu'être intelligent ne signifie pas forcément être un salaud.
J'ai fini par réaliser que c'était l'une des caractéristiques les plus fondamentales d'Andrew, aussi importante que son ambition rebelle et son instinct presque phototropique pour les problèmes qui valent vraiment la peine d'être résolus. Il croit profondément que les personnes les plus remarquables qu'il ait rencontrées sont souvent également exceptionnellement bienveillantes.
Cette conviction a façonné la manière dont son équipe s'est rassemblée pour accomplir ces choses extrêmement difficiles. Les 30 premières personnes recrutées par Cerebras avaient toutes travaillé avec lui auparavant ; certaines le suivaient depuis 1996. Aujourd'hui, Cerebras compte environ 700 employés, dont une centaine l'ont suivi à travers plusieurs entreprises.
Il est important de noter que la bienveillance et l'esprit de compétition ne sont pas contradictoires. Andrew est extrêmement avide de victoire. Il aime dire qu'il est une version professionnelle de David, affrontant Goliath. Goliath est lent et se prépare toujours à une attaque frontale, ce qui laisse de l'espace pour toutes les autres approches. L'avantage de David est d'apparaître de manières et à des endroits où Goliath ne peut pas apparaître.
À l'époque de SeaMicro, le principal partenaire de distribution d'Andrew au Japon était NetOne. Le fournisseur principal de NetOne était Cisco, et Cisco divertissait ses partenaires avec des jets privés et des yachts dont la valeur dépassait celle de la plupart des maisons de Palo Alto. Le budget d'Andrew était beaucoup plus modeste, alors il a invité le PDG de NetOne à un barbecue dans son jardin. Plus tard, ce PDG lui a dit qu'il faisait affaire avec Cisco depuis des décennies, mais qu'il n'avait jamais été invité chez qui que ce soit. Ce geste apparemment petit, mais très humain — un geste auquel Goliath ne penserait même pas — a cimenté leur relation.
Du premier terme sheet à l'introduction en bourse
Ce matin, Andrew a sonné la cloche d'ouverture du Nasdaq. J'étais à ses côtés. Cela fait dix ans et 2 600 miles que tout a commencé dans nos bureaux du 250 Middlefield.
Aujourd'hui, il existe encore des fondateurs rares qui font ce qu'Andrew faisait autrefois : dessiner sur un tableau blanc à trois heures du matin, lutter contre des problèmes techniques qui n'ont pas encore été résolus. Ils ont eux aussi une forte volonté de ne pas se soumettre et un esprit rebelle. Ils cherchent également à trouver un partenaire véritablement prêt à travailler côte à côte : prêt à se pencher sur les problèmes quand le premier prototype ne s'allume pas ; et à rester jusqu'à ce qu'il fonctionne enfin.
C'est exactement le type de fondateurs que je veux soutenir : ceux qui choisissent des problèmes qui valent la peine d'être résolus, imaginent des solutions 1000 fois meilleures que l'état actuel des choses, et s'affinent, persévèrent jusqu'au bout face aux inévitables défis du chemin.
Pour des fondateurs comme Andrew, Gary, Sean, Michael et JP, je suis prêt à enjamber une clôture de jardin un samedi après-midi pour leur remettre personnellement un terme sheet.













