L'intelligence artificielle de 2026, la bataille du "données correctes" commence... La conception basée sur la sémantique déterminera le vainqueur

robot
Création du résumé en cours

2025年 est l’année où l’(IA) générative d’intelligence artificielle devient le sujet central de l’industrie, marquant le début de la “Renaissance des données”. Mais d’ici 2026, son importance dépasse le simple accès à des données de qualité, et la question de comment faire que les modèles d’IA comprennent réellement et utilisent la sémantique des “bonnes” données, notamment au niveau des (couches sémantiques), devient cruciale. Cela marque l’ouverture officielle de l’ère de la conception de données sémantiques, intégrant des graphes de connaissances, des ontologies, capables de clarifier le contexte, la sémantique et l’identité commerciale des données.

L’année dernière, la vague de l’(IA agent intelligent) a balayé toute l’industrie, de nombreuses entreprises espérant automatiser leurs activités et optimiser leurs décisions grâce à cela. Mais la majorité des IA agents n’ont pas atteint les résultats escomptés, et la qualité des données utilisées ainsi que leur contexte d’application ont été identifiés comme causes fondamentales. Une étude de l’Université Carnegie Mellon indique que les agents intelligents actuels n’ont pas encore reçu une formation suffisante pour traiter des tâches complexes, et que les erreurs de raisonnement dues au contexte des données peuvent globalement diminuer leurs performances.

Dans ce contexte, la précision des données(Data Quality) et le système de gouvernance(Data Governance) deviennent des enjeux majeurs pour leur développement vers la maturité. Bien que des fournisseurs de cloud majeurs comme AWS continuent d’offrir un écosystème de données vaste, leurs nouvelles innovations technologiques et plateformes liées aux données, publiées cette année, sont limitées par rapport à l’année précédente. En revanche, l’acquisition de Confluent par IBM, ou le lancement de HorizonDB basé sur PostgreSQL par Microsoft, illustrent la tendance à la reconstruction de la pile technologique des données.

Les architectures sans ETL et les technologies de partage de données sont devenues la norme en 2025. Il s’agit d’une tentative de simplification des pipelines de données complexes et fragiles, par exemple, des plateformes comme Snowflake ou Databricks supportant l’intégration de données SAP ou Salesforce, améliorant ainsi considérablement l’accessibilité aux données métier.

Une autre tendance est la généralisation des technologies de traitement de données vectorielles. La majorité des plateformes de données principales ont renforcé leurs capacités de recherche et d’analyse vectorielle. Oracle a lancé une requête combinant données structurées et non structurées, et AWS a également introduit une couche de stockage S3 optimisée pour les vecteurs. Cela pose les bases pour une utilisation complète de l’IA dans la gestion de documents, d’images, voire de données dispersées en entreprise.

Le changement le plus notable concerne la réévaluation de la valeur de la couche sémantique. Initialement utilisée pour les outils BI ou les systèmes ERP, cette couche, centrée sur des concepts clés tels que “indicateurs”, “dimensions” ou “détails”, a standardisé la signification et l’interprétation des données. Tableau, Databricks, Snowflake, Microsoft, etc., accélèrent l’intégration de couches sémantiques, Microsoft Fabric IQ intégrant même la notion d’ontologie d’entreprise dans cette couche, afin d’assurer la précision du contexte pour l’analyse AI en temps réel.

Dans cette tendance, l’initiative d’échange sémantique ouverte, menée principalement par Snowflake, vise à établir une norme universelle garantissant l’interopérabilité des couches sémantiques entre différentes plateformes d’IA et de données. Cette architecture, basée sur MetricFlow de dbt Labs, définit de manière globale les indicateurs et dimensions via des fichiers YAML. Mais la capacité des projets open source à gérer des actifs sémantiques de grande valeur, notamment la volonté de partage des fournisseurs, reste incertaine.

De plus, les technologies de graphes de connaissances indépendants et GraphRAG sont de plus en plus considérées comme des infrastructures fondamentales pour une compréhension précise du contexte par l’IA. Neo4J, le moteur RAG de Google Vertex AI, ou LazyGraphRAG de Microsoft, s’efforcent de construire la base technologique pour activer ces modèles, avec des cas d’usage concrets qui se multiplient. Des entreprises comme Deloitte ou AdaptX déploient déjà à grande échelle des applications d’IA pilotées par des graphes de connaissances dans des domaines complexes tels que la santé ou la sécurité.

Cependant, le plus grand défi reste la pénurie de talents en modélisation ontologique. Dans un contexte où l’IA ne peut pas concevoir elle-même ses structures sémantiques, la demande en ingénieurs en connaissance et architectes sémantiques explose. Cela rappelle les difficultés rencontrées il y a plusieurs décennies dans la gestion des connaissances. Dans la tendance actuelle, une interprétation sémantique précise et une relation métier sont plus cruciales que la simple collecte de données.

En fin de compte, le cœur de l’ère de l’IA n’est pas la simple accumulation de données, mais la capacité à comprendre précisément leur sémantique et leur contexte. 2026 devrait devenir une année charnière où la puissance de la sémantique se consolide, et où la compétition entre plateformes et applications pour dominer ce domaine s’intensifie. Les modèles de partage et de collaboration de Snowflake, Databricks, SAP, etc., façonnent une nouvelle dynamique autour des standards et de l’écosystème, annonçant que les entreprises capables de fournir des “bonnes” données à l’IA détiendront le pouvoir ultime.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)