Ce message est une contribution invitée de George Siosi Samuels, directeur général de Faiā. Découvrez comment Faiā s’engage à rester à l’avant-garde des progrès technologiques ici.
Pourquoi la qualité des données – pas la quantité – fera ou défiera vos projets d’IA
En tant que chef d’entreprise naviguant dans les paysages de l’intelligence artificielle (IA) ou de la blockchain, vous êtes probablement confronté à une réalité préoccupante : 78 % des projets d’IA échouent en raison d’une mauvaise qualité des données. Les chiffres ne mentent pas, mais la solution n’est pas non plus en attente.
Je propose un cadre « Traiter les données comme les aliments », qui offre une analogie simple pour faire face à cette crise, bien que des lacunes importantes persistent. En tant que personne ayant passé des années à étudier ces modèles, je vais décomposer comment transformer cette métaphore convaincante en une stratégie prête pour l’entreprise qui fournit des résultats mesurables.
La métaphore alimentaire : engageante mais incomplète
L’analogie des données comme « nutrition » simplifie brillamment des concepts complexes, ce qui la rend idéale pour l’adhésion des cadres et l’alignement organisationnel. Cependant, comme toute métaphore puissante, elle risque de simplifier les problèmes critiques auxquels les entreprises font face quotidiennement :
- Provenance des données : Tout comme vous pouvez suivre le parcours de la ferme à la table d’une tomate, les entreprises ont besoin d’outils de traçabilité robustes (par exemple, Collibra, Alation) pour auditer les origines et les transformations des données. Sans cette visibilité, les résultats de l’IA deviennent aussi discutables que la viande mystère.
- Schémas en évolution : Les menus changent de façon saisonnière – donc les modèles de données. Le cadre a besoin d’approches tactiques pour la gouvernance des schémas adaptative, d’autant plus que vos modèles d’IA évoluent aux côtés des exigences commerciales.
- Nuances culturelles : Une approche « de la ferme à la table » s’épanouit dans les environnements de données méticuleux d’Asie, mais crée un frottement avec les buffets de données « All-You-Can-Eat » occidentaux – une tension que de nombreuses entreprises mondiales ont du mal à réconcilier.
Si vous cherchez à agir dans votre entreprise, associez la métaphore à des exemples de mise en œuvre concrets, tels que la façon dont Pfizer (NASDAQ : PFE) a utilisé des outils de traçabilité pour accélérer la recherche et le développement des vaccins (R&D) en garantissant la qualité des données à chaque étape – des essais cliniques à la soumission réglementaire.
De la théorie à la pratique : la mise à l’échelle de la qualité des données
Les directives en 5 étapes du cadre fournissent une base, mais les entreprises mondiales ont besoin de mécanismes d’évolutivité qui fonctionnent dans divers écosystèmes. Transformons la théorie en pratique :
Étape 1 : Automatiser les vérifications des données « nutrition » (hygiène)
Déployez des outils tels que Great Expectations ou Monte Carlo pour une surveillance de la qualité en temps réel dans votre paysage de données. Un bon exemple est Netflix, qui a utilisé la validation automatisée pour signaler le prétraitement des données de la visionneuse incohérente, réduisant les besoins de recyclage du modèle de 40 %.
Étape 2 : Mettre en œuvre des modèles de gouvernance hybride
Fusionnez l’agilité « à volonté » (par exemple, les lacs de données cloud) avec une rigueur « de la ferme à la table » (par exemple, pipelines conformes au RGPD) pour une gestion équilibrée des données. Le modèle hybride d’Unilever (NASDAQ : UL) a réduit les erreurs de données de la chaîne d’approvisionnement de 40 % tout en conservant la flexibilité nécessaire aux informations spécifiques au marché.
Étape 3 : Standardiser les « étiquettes de nutrition des données »
Aligner les étiquettes avec les références de l’industrie (par exemple, le modèle d’évaluation des capacités de gestion des données (DCAM) pour les services financiers) afin de créer une compréhension universelle. Incluez la fraîcheur des données, la fiabilité de la source, l’évaluation des risques de biais et les indicateurs d’état de conformité.
Bridger la fracture culturelle dans la gestion des données
Les entreprises mondiales font face à des philosophies de données fondamentalement contradictoires qui reflètent les approches culturelles de la nourriture :
- Ouest : L’ingestion rapide, la dépendance du système hérité et les approches de quantité.
- Est : Méthodologies centrées sur la précision avec validation méticuleuse mais plus lentes à l’échelle.
Alors, quelle est la solution ? Adoptez une stratégie de « cuisine de fusion » qui tire parti des forces des deux approches :
- Utilisez des interfaces de programmation d’applications ou des API (et plus récemment, des protocoles de contexte de modèle ou des MCP) pour harmoniser les systèmes hérités (SAP) avec des entrepôts de données modernes (Snowflake, Google (NASDAQ : GOOGL) BigQuery) pour une intégration transparente.
- Déployez des niveaux de gouvernance spécifiques à la région – par exemple, suivi plus strict de provenance dans les pôles de l’Union européenne tout en maintenant l’agilité dans les marchés en développement.
Le lien manquant : opérationnaliser la qualité des données
La transition d’une quantité d’abord à un état d’esprit de qualité nécessite une discipline opérationnelle qui manque à de nombreuses organisations. Le chemin vers l’avant comprend :
- Migration progressive : Commencez par des ensembles de données non critiques et utilisez des outils tels que AWS Glue ou Talend pour les processus ETL à faible risque avant de s’attaquer aux données critiques de mission.
- Métriques de ROI : Suivre le succès du projet via une réduction du temps de prétraitement et une précision améliorée du modèle. Par exemple, Toyota (NASDAQ : TM) a réduit de 30 % ses coûts de formation en IA à la suite de son initiative de migration de qualité des données.
L’avenir : les « étiquettes de nutrition des données » générées par IA
Pour innover véritablement au-delà des fondations du cadre, tirez parti de l’IA générative pour créer automatiquement des étiquettes de nutrition, signaler les biais potentiels et suggérer des opportunités d’enrichissement. Un exemple de cela comprend Watson d’IBM (NASDAQ : IBM), qui vérifie désormais les ensembles de données de soins de santé pour les lacunes de représentation démographique, aidant à traiter les biais potentiels avant que les modèles ne soient formés.
Résumé : votre feuille de route pour la qualité des données
Le cadre « Traiter les données comme des aliments » offre un point de départ convaincant, mais les chefs d’entreprise doivent l’étendre par :
- Automatisation : Contrôles de qualité et suivi de la traçabilité tout au long du cycle de vie des données.
- Personnalisation : Approches de gouvernance pour les besoins régionaux et les environnements réglementaires.
- Mesure : Successions grâce à une latence réduite, un taux d’erreur et une fréquence de recyclage du modèle.
En relevant des défis d’évolutivité, des différences culturelles et des opportunités d’automatisation, vous transformez ce cadre de conceptuel à opérationnel – positionnant vos initiatives d’IA pour réussir là où 78 % échouent actuellement.
Prêt à commencer ? Téléchargez mon modèle d’étiquette de nutrition de données gratuits pour commencer à auditer vos entrées d’IA aujourd’hui et faites le premier pas vers la qualité des données qui nourrit plutôt que contamine votre écosystème d’IA.
Pour que l’intelligence artificielle (IA) fonctionne directement dans la loi et prospère face à des défis croissants, elle doit intégrer un système de blockchain d’entreprise qui garantit la qualité et la propriété des données, permettant ainsi de protéger les données tout en garantissant leur immuabilité. Découvrez la couverture de CoiingEek sur cette technologie émergente pour en savoir plus Pourquoi la blockchain d’entreprise sera l’épine dorsale de l’IA.
Regarder : utiliser la technologie de la blockchain pour l’intégrité des données