Recherche approfondie

Accéder à des rapports de recherche approfondis et des analyses indépendantes. Exploitation des données, de la technologie et des perspectives économiques pour bénéficier d'un examen complet de l'écosystème blockchain, du potentiel des projets et des tendances du marché.

Un nouveau travail du lauréat du prix Turing Sutton : en utilisant une formule de 1967 pour résoudre une grande lacune de l'apprentissage par renforcement en flux continu

En 2024, une équipe de l'Université d'Alberta a identifié le "stream barrier", l'incapacité de l'apprentissage par renforcement profond à apprendre en flux continu (taille de lot de 1, sans mémoire de relecture), provoquant l'instabilité de l'entraînement. Une nouvelle étude, menée par Arsalan Sharifnassab (Openmind) et Mohamed Elsayed, A. Rupam Mahmood et Richard S. Sutton (Alberta), propose une solution radicale : le défaut ne vient pas du manque de données, mais du mauvais réglage du pas d'apprentissage. Ils introduisent les "Intentional Updates" (mises à jour intentionnelles). Au lieu de spécifier combien les paramètres doivent bouger, on spécifie de combien doit changer la sortie de la fonction (par exemple, réduire l'erreur de prédiction de 5%). Le pas d'apprentissage est alors calculé rétroactivement pour atteindre cet objectif. Cette idée s'inspire de l'algorithme NLMS de 1967. Les chercheurs l'étendent à l'apprentissage par renforcement profond, créant des algorithmes comme Intentional TD(λ) pour l'évaluation, Intentional Q(λ) pour le contrôle discret, et Intentional Policy Gradient pour le contrôle continu. Les résultats sur des benchmarks (MuJoCo, Atari) montrent que ces méthodes, en mode flux pur, égalent ou approchent les performances d'algorithmes de référence comme SAC ou DQN qui utilisent de grandes mémoires de relecture, tout en étant jusqu'à 140 fois plus économes en calcul. Bien que plus robuste et nécessitant moins de réglages, la méthode présente encore un biais dans le choix du pas pour les politiques, un problème à résoudre dans les travaux futurs. Cette avancée ouvre la voie vers un apprentissage en ligne, efficient et adaptatif, plus proche de l'apprentissage biologique, pour des applications comme la robotique ou les dispositifs autonomes.

marsbit05/10 06:42

Un nouveau travail du lauréat du prix Turing Sutton : en utilisant une formule de 1967 pour résoudre une grande lacune de l'apprentissage par renforcement en flux continu

marsbit05/10 06:42

Quand la technologie n'est plus une barrière, la seule et unique ultime protection dans le domaine de l'IA ne tient plus qu'à une seule chose

En cette ère où les barrières technologiques s'estompent rapidement et où les produits peuvent être copiés en quelques mois, le véritable avantage concurrentiel dans le domaine de l'IA ne réside plus dans la technologie elle-même, mais dans la structure organisationnelle de l'entreprise. L'ultime "fossé" devient la capacité à créer une culture et une architecture uniques qui attirent, motivent et libèrent le potentiel des talents exceptionnels. Les entreprises visionnaires comme OpenAI ou Palantir ont inventé de nouveaux modèles organisationnels qui permettent à un « nouveau type de talent » de s'épanouir. Elles ne se contentent pas de recruter ; elles offrent une identité, un sentiment d'appartenance à une mission historique et la possibilité pour les individus de devenir la meilleure version d'eux-mêmes. Ces structures répondent à des désirs humains profonds : se sentir unique, destiné à de grandes choses, au cœur de l'action et en mesure de prouver sa valeur. Pour les fondateurs, le défi n'est pas de raconter une meilleure histoire, mais de construire une organisation où une personne spécifique peut pleinement s'accomplir. Les promesses émotionnelles (« être choisi ») doivent être alignées sur des engagements structurels concrets (« être vu ») : pouvoir, responsabilités, rémunération et autonomie réelles. Le conseil aux talents ambitieux est de discerner cette différence. Il faut rechercher les entreprises où la valeur apportée est formellement reconnue et intégrée dans les systèmes, au-delà des simples flatteries. Alors que l'IA démocratise la création de produits, la construction d'une institution qui amplifie l'intelligence collective et le jugement humain sur le long terme reste le fossé le plus difficile à combler. Le marché récompensera désormais les entreprises capables de créer ces nouvelles formes organisationnelles, faisant émerger en leur sein un type de talent inimaginable dans les structures traditionnelles.

marsbit05/09 11:19

Quand la technologie n'est plus une barrière, la seule et unique ultime protection dans le domaine de l'IA ne tient plus qu'à une seule chose

marsbit05/09 11:19

Infiltré dans le monde crypto pendant 8 ans, 5 emplois différents : La révolution et l'arnaque telles que je les ai vues

L'auteur, Connor Dempsey, revient sur ses huit années dans le monde de la crypto, ayant travaillé pour quatre entreprises (Circle, Messari, Coinbase, Crossmint). Il a observé la croissance de ce secteur de moins de 1 milliard à plus de 4 000 milliards de dollars, traversant des bulles spéculatives et des crises. Il décrit les cycles successifs : la frénésie des ICO (2017-18), un épisode spéculatif similaire à la bulle internet où de nombreux projets ont échoué. Puis, dans la période d'après-crise (2018-19), l'émergence des stablecoins (comme USDC) et de la DeFi a posé les bases d'un nouveau système financier en ligne. La pandémie et les mesures des banques centrales ont ensuite alimenté une période de croissance explosive ("DeFi Summer" 2020-21) et la bulle des NFT (2021). La correction de 2022, avec l'effondrement de Terra/Luna, de plusieurs fonds et plateformes (Celsius, Voyager) et surtout la faillite frauduleuse de FTX, a constitué un moment de crise systémique ("moment Lehman"). La réponse réglementaire hostile sous l'administration Biden a poussé l'industrie vers la création massive de "memecoins", un nouveau casino spéculatif, et l'a incitée à s'engager politiquement. Le soutien de Donald Trump, sa victoire électorale et l'adoption du "GENIUS Act" en 2025 ont marqué un tournant. Un cadre réglementaire clair pour les stablecoins a ouvert la voie à l'adoption institutionnelle, avec des partenariats (comme Crossmint-MoneyGram), des introductions en bourse (Circle) et une vision de la "tokenisation" de tous les actifs financiers défendue par des géants comme BlackRock. L'auteur conclut que la révolution n'a pas été celle initialement prédite (des applications grand public décentralisées), mais plutôt la construction d'une nouvelle infrastructure financière mondiale, 24h/24 et 7j/7, basée sur la blockchain. Les stablecoins, avec des volumes de règlement astronomiques, en sont la preuve tangible. À l'avenir, la convergence avec l'IA (agents autonomes effectuant des transactions) et l'intégration discrète de cette technologie dans les systèmes existants devraient mener à une adoption massive.

marsbit05/09 10:53

Infiltré dans le monde crypto pendant 8 ans, 5 emplois différents : La révolution et l'arnaque telles que je les ai vues

marsbit05/09 10:53

Un sèche-cheveux peut rapporter 34 000 dollars ? Décryptage du paradoxe réflexif des marchés prédictifs

Un homme a gagné 34 000 dollars en chauffant un capteur météo à l'aéroport de Paris-Charles de Gaulle, exploitant une faille des marchés prédictifs comme Polymarket. Cet incident illustre le paradoxe fondamental de ces plateformes : conçues pour refléter la réalité, elles incitent en fait les participants à la manipuler. L'article identifie quatre types de marchés vulnérables : 1. **Données physiques à source unique** (ex. stations météo), facilement manipulables. 2. **Marchés avec initiés** (ex. équipe de MrBeast, militaires israéliens), où l'information privilégiée est monnayée. 3. **Sujets contrôlables par l'acteur** (ex. nombre de tweets d'Andrew Tate), où le résultat peut être directement influencé. 4. **Événements à faible coût d'exécution** (ex. lancer un objet sur un terrain de sport), où l'action elle-même devient un investissement. Les plateformes adoptent des approches divergentes face à ces manipulations. **Kalshi**, avec une identification stricte (KYC), traque et punit publiquement les délits d'initiés. **Polymarket**, basée sur la blockchain et plus anonyme, a longtemps toléré ces agissements, arguant qu'ils rendent le marché plus précis », avant de collaborer ponctuellement avec les autorités. Le paradoxe final est que plus un marché prédictif est précis et lucratif, plus il motive les acteurs à altérer la réalité qu'il est censé prédire. Le marché cesse d'être un miroir pour devenir un moteur de la réalité.

marsbit04/25 03:28

Un sèche-cheveux peut rapporter 34 000 dollars ? Décryptage du paradoxe réflexif des marchés prédictifs

marsbit04/25 03:28

活动图片