Sama est une société américaine à qui Meta, Google ou Microsoft sous-traitent l’étiquetage de quantités de données (images, vidéos, textes, audios, …) pour le bon fonctionnement de leurs IA génératives. En avril 2026, elle a licencié plus de 1.100 d’employés au Kenya. Un métier précaire méconnu.
Sama (ex-Samasource Impact Sourcing) ne vous dit rien. C’est normal. Cette entreprise américaine – dont le siège social est situé dans la Silicon Valley, à San Francisco depuis sa création en 2008 – prospère dans l’ombre des Gafam et plus encore des nouvelles Big Tech de l’IA. Il s’agit d’un sous-traitant majeur dans le numérique et l’intelligence artificielle, qui emploie des milliers d’« étiqueteurs de données » (ou data labelers en anglais). Ce sont les « petites mains » chargées d’étiqueter des milliers, des millions voire des milliards de données brutes (images, textes, vidéos, sons, etc.).
« Histoire conflictuelle » de Sama (Ecofin)
Leur labeur est indispensable pour donner à ces monceaux de données du sens, afin que les modèles de langage des IA puissent les exploiter et répondre aux requêtes de millions d’utilisateurs du monde entier de façon plus pertinente. Ce métier dédié à l’annotation de data s’est développé à vitesse grand-V à travers la planète, notamment en Afrique et en Asie, souvent en exploitant ces travailleurs précaires et mal payés, victimes d’un nouveau « colonialisme numérique », voire d’un nouvel « esclavagisme moderne ». La société Sama que dirige Wendy Gonzalez (photo) se défend, elle, d’exploiter ses salariés et affirme leur accorder salaires décents et avantages sociaux (couverture médicale, congés payés, indemnités maladie, …).
Pour autant, l’entreprise – active principalement en Afrique de l’Est, avec son centre de Nairobi au Kenya comme plaque tournante – a annoncé le 16 avril 2026 le licenciement de 1.108 employés dans la capitale kényane en respectant l’Employment Act de ce pays (1). Et ce, a-t-elle justifié, à la suite de la fin d’un important contrat avec Meta Platforms lié à l’annotation de données pour Meta AI et anciennement à la modération de contenu. Les implantations de Sama en (suite)
Les quatre opérateurs télécoms français, que sont Orange, Bouygues Telecom, SFR et Free, sont plus que jamais exposés à des cyberattaques de leurs systèmes d’information, où sont gérées et stockées des milliards de données personnelles de leurs plusieurs dizaines de millions d’abonnés mobiles et fixes. Devenus encore plus redoutables et imprévisibles avec l’intelligence artificielle, ces cyberpiratages massifs inquiètent de plus en plus leurs clients.
Ils s’appellent Amazon Data Services (AWS), Equinix, OVHcloud, Data4, Telehouse, Digital Realty, Atos, Scaleway, ou encore Microsoft Azure. Ce sont les opérateurs de centres de données, dont le marché français – à l’instar de ce qui se passe dans le monde – explose pour répondre à la forte demande de l’intelligence artificielle et des services de cloud. « On entend par centres de données les installations accueillant des équipements de stockage de données numériques », définit officiellement le code des postes et des communications électroniques (CPCE). Et « on entend par opérateur de centre de données toute personne assurant la mise à la disposition des tiers d’infrastructures et d’équipements hébergés dans des centres de données » (
Après avoir sanctionné OpenAI en décembre 2024 pour ses manquements au RGPD en lien avec son IA générative ChatGPT (