Une IA qui sort de sa "cage"
Anthropic, l'entreprise derrière l'agent conversationnel Claude, a publié un document technique révélant un incident pour le moins inquiétant. Lors de tests de sécurité, une version expérimentale de leur modèle Claude Mythos Preview a réussi à s'échapper de son environnement de test sécurisé (ce qu'on appelle une "sandbox") et à contacter par email un chercheur de l'équipe. L'intelligence artificielle avait pour instruction de tenter de sortir de cet environnement et de prévenir le chercheur en cas de succès, mais elle est allée plus loin que prévu.
Ce modèle est jugé si puissant qu'Anthropic refuse de le rendre public. Il est réservé à un consortium de grandes entreprises technologiques (Apple, Microsoft, Google, etc.) pour détecter des failles de sécurité dans leurs logiciels. L'entreprise précise que ces comportements déviants concernaient des versions antérieures, depuis corrigées, et qu'ils relèvent davantage d'un "excès de zèle" que d'intentions malveillantes.
L'incident illustre bien les enjeux de sécurité liés à l'intelligence artificielle. Même si l'IA n'avait pas d'intentions malveillantes, sa capacité à contourner des protections techniques pose question. Un nouveau rappel que ces systèmes ne sont pas infaillibles et qu'il faut garder un œil critique sur leur utilisation, et surtout ne pas leur confier des informations personnelles.
Google récompense 700 hackers éthiques pour 17 millions de dollars
En 2025, Google a distribué 17,1 millions de dollars à plus de 700 chercheurs en sécurité informatique, soit une hausse de 40 % par rapport à l'année précédente. Ces personnes participent au programme de "bug bounty" (chasse aux bugs) de Google : elles recherchent des failles de sécurité dans les produits de l'entreprise et sont rémunérées pour les signaler plutôt que de les exploiter ou de les vendre sur le marché noir.
L'intelligence artificielle a d'ailleurs obtenu sa propre ligne budgétaire avec l'AI VRP, un programme autonome dédié aux failles dans les modèles comme Gemini. Google a également organisé quatre événements "bugSWAT" en présentiel (à Sunnyvale, Mexico, Las Vegas et Tokyo) qui ont rapporté près de 3 millions de dollars de récompenses à eux seuls.
Une approche proactive qui permet à Google de corriger des vulnérabilités avant qu'elles ne soient exploitées. Depuis 2010, l'entreprise a versé 81,6 millions de dollars au total. Un point d'ombre toutefois : d'autres acteurs comme le projet Curl ou la plateforme HackerOne ont dû suspendre ou fermer leurs programmes face à une avalanche de faux rapports générés par intelligence artificielle.
La Grèce bannit les réseaux sociaux aux moins de 15 ans
Le Premier ministre grec Kyriakos Mitsotakis a annoncé, dans une vidéo publiée sur TikTok, que la Grèce interdira l'accès aux réseaux sociaux aux moins de 15 ans à partir du 1er janvier 2027. La loi sera soumise au vote cet été. Le dirigeant justifie cette mesure par la volonté de "lutter contre l'addiction de certaines applications qui nuit à l'innocence et à la liberté" des jeunes.
La Grèce ne souhaite pas agir seule et appelle à un cadre européen unifié d'ici fin 2026. Le pays propose notamment une vérification semestrielle de l'âge des utilisateurs par les plateformes. Cette initiative s'inscrit dans un mouvement international : l'Australie a déjà imposé un âge minimum de 16 ans fin 2025, et la France prévoit une interdiction similaire pour les moins de 15 ans.
Ces mesures soulèvent des questions pratiques importantes : comment vérifier efficacement l'âge sans porter atteinte à la vie privée ? Et comment accompagner les familles dans cette transition ?
Pays-Bas : un ransomware paralyse le système de santé
ChipSoft, l'éditeur qui fournit le logiciel de dossiers médicaux à environ 80 % des hôpitaux néerlandais, a été victime d'un ransomware le 7 avril 2026. Le site de l'entreprise a été mis hors ligne et l'agence de sécurité Z-CERT a demandé aux établissements de couper leur connexion VPN vers les systèmes de l'éditeur. Au total, onze hôpitaux ont déconnecté leurs systèmes par précaution.
ChipSoft a confirmé un "incident de données" avec un "possible accès non autorisé", mais ne peut pas garantir que des données de patients n'ont pas été consultées ou volées. Le groupe de hackers responsable n'a pas été identifié. Cette attaque illustre une vulnérabilité systémique : quand un seul éditeur gère les dossiers de 80 % des hôpitaux d'un pays, une seule cyberattaque peut paralyser l'ensemble du secteur.
Les données médicales sont particulièrement prisées par les cybercriminels : elles valent cher sur le marché noir et les hôpitaux paient rapidement pour retrouver l'accès à leurs systèmes critiques. Un rappel que la centralisation excessive des systèmes d'information, même efficace en apparence, crée des risques considérables.
Tesla bannit les propriétaires qui "jailbreakent" leur FSD
Tesla a lancé une offensive pour détecter et bannir les dispositifs tiers permettant d'activer le système de conduite autonome supervisée FSD dans des pays où il n'est pas autorisé, comme en France par exemple. Des modules matériels vendus environ 500 euros permettent de manipuler le bus CAN du véhicule (le réseau de communication interne) pour contourner les restrictions géographiques.
La marque a désactivé à distance le FSD sur les véhicules concernés, sans remboursement, même pour des propriétaires qui avaient payé l'option il y a des années. Un bannissement définitif, donc. Tesla peut ainsi reprendre le contrôle sur certaines fonctionnalités de votre véhicule à distance.
Une affaire qui soulève une question importante : si Tesla peut prendre le contrôle à distance d'un véhicule pour désactiver des fonctions, qu'est-ce qui empêche un pirate informatique de faire de même pour des usages bien plus dangereux ? Cette capacité de contrôle à distance, qu'elle soit légitime ou non, crée une surface d'attaque à ne pas négliger !
Artemis II : attention aux fausses images générées par IA
Avec le retour de la mission Artemis II vers la Terre après son survol historique de la Lune, de nombreuses images circulent sur les réseaux sociaux. Le problème est que certaines sont de fausses photos générées par intelligence artificielle. Ces visuels présentent parfois des incohérences (éclairage impossible, échelle incorrecte, phases lunaires erronées) mais peuvent paraître crédibles au premier regard.
Pour éviter de vous faire avoir, je vous recommande de consulter uniquement les sources officielles de la NASA : le site dédié aux médias de la mission, les albums Flickr de la NASA Johnson et NASA HQ Photo, ou encore les comptes officiels @NASAArtemis sur les réseaux sociaux.
La désinformation visuelle facilitée par les outils d'IA générative est un problème croissant ! Il devient de plus en plus difficile de distinguer le vrai du faux sans vérifier systématiquement la source.
KFC France victime d'un piratage
KFC France a informé ses clients par email que leurs données ont été volées suite à un piratage de son programme de fidélité "Colonel Club". Les informations compromises incluent nom, prénom, adresse email, numéro de téléphone et numéro de fidélité. Aucune donnée bancaire n'est concernée.
L'entreprise assure avoir suspendu l'accès du pirate dès la détection, déposé plainte et alerté la CNIL. Comme pour tout piratage, la vigilance s'impose désormais : méfiez-vous des prochains emails, SMS ou appels que vous recevrez. Des personnes malveillantes vont exploiter ces données pour du phishing (hameçonnage), en se faisant passer pour KFC ou une autre entreprise.
Ce type d'incident, malheureusement fréquent, rappelle l'importance de ne pas réutiliser le même mot de passe partout et de rester attentif aux communications suspectes, même si elles semblent légitimes.
Un Strasbourgeois menace un agent dans ChatGPT : le RAID intervient
Un homme de 37 ans à Strasbourg a vu le RAID débarquer à son domicile quelques heures après avoir demandé à ChatGPT "comment tuer un agent du renseignement" et mentionné "vouloir acheter un pistolet Glock". OpenAI a détecté ces menaces, alerté le FBI, qui a transmis l'information aux autorités françaises via la plateforme Pharos. L'intervention s'est déroulée sans incident, aucune arme n'a été trouvée.
L'homme, diagnostiqué schizophrène et en rupture de traitement, a expliqué vouloir "tester la surveillance de l'intelligence artificielle". Il a été hospitalisé d'office en psychiatrie et l'affaire a été classée sans suite.
Pour rappel, vos conversations avec ChatGPT, Claude, Gemini ou d'autres assistants IA ne sont pas privées. OpenAI le dit clairement dans ses conditions d'utilisation : les échanges peuvent être analysés et, en cas de menace de violence, transmis aux autorités. Depuis février 2024, l'entreprise a perturbé plus de 40 réseaux malveillants. La coopération entre OpenAI, le FBI et les autorités locales fonctionne en temps quasi réel. Les données que vous transmettez à ces outils ne sont jamais totalement confidentielles, si vous avez besoin d'une formation sur le sujet, je peux vous accompagner.
Le phishing explose : +71 % de demandes d'assistance
Le phishing (hameçonnage) s'impose comme la principale menace signalée par les particuliers sur la plateforme 17Cyber en 2025, avec une hausse de 71 % des demandes d'assistance. Ces tentatives d'escroquerie représentent désormais près d'un tiers des sollicitations reçues par le service public d'aide aux victimes de cybermalveillance.
Au global, toutes catégories confondues, les demandes ont progressé de 20 % pour dépasser 500 000 en 2025. Deux autres phénomènes inquiétants émergent : les fuites de données (+107 %) et surtout l'usurpation de numéros de téléphone (+517 %), même si cette dernière reste encore minoritaire en volume.
Cette usurpation consiste à falsifier le numéro affiché lors d'un appel téléphonique pour faire croire que l'appel provient d'une banque, d'une administration ou d'un proche. L'Arcep a ouvert une enquête administrative en janvier pour vérifier que les opérateurs respectent bien leurs obligations de contrôle. Les escroqueries ne passent plus seulement par email ou SMS : le téléphone redevient un canal d'attaque majeur. Restez vigilant, même face à un numéro qui semble familier.
Conclusion
Cette semaine illustre bien l'ampleur des défis liés à notre vie numérique : des intelligences artificielles qui échappent à leur contrôle, des piratages en série touchant aussi bien des fast-foods que des infrastructures critiques comme les hôpitaux, et une explosion des tentatives de phishing et d'usurpation d'identité. Des incidents qui ne sont pas de simples faits divers, mais concernent directement notre quotidien et notre (cyber)sécurité.
Retenez trois choses essentielles : vérifiez toujours vos sources (surtout pour les images circulant en ligne), n'accordez jamais une confiance aveugle aux numéros de téléphone affichés ou aux emails reçus, et gardez à l'esprit que ce que vous confiez à une intelligence artificielle n'est jamais totalement privé.