Technologies
Les outils technologiques du Big Data et de l’IA sont nombreux. Avec une prépondérance de l’éco-système open-source (autour de Apache Hadoop), le domaine est très innovant. Bases de données NoSQL (MongoDB, HBase, CouchDB ou Redis par exemple), architectures applicatives (Data Lake), infrastructures cloud, outils d’intégration (Talend, Nifi…), outils et langages pour la data science et l’IA (Python, Scala, Knime, Dataiku…), virtualisation des données, in-memory… Les technologies se multiplient et les choix sont complexes à réaliser.
Découvrez les fondamentaux des solutions technologiques, et profitez de nos tutoriels dédiés aux outils et langages Data.
Fondamentaux technologiques data
Voir tous les contenus >
DMP, DataLake, CDP : les solutions pour la qualification des données
Comment choisir la solution la plus adaptée à la qualification des données pour ses projets Data ? Quels sont les critères à prendre en compte ? Les réponses de Didier Gaultier, Directeur...

REPLAY | Maintenez vos données fiables et prêtes pour l'analyse
Vous vous demandez comment maintenir des données fiables et prêtes pour l’analyse ? Dans ce webinar maintenant disponible en replay, vous découvrirez les enjeux de la gestion de données hétérogènes ainsi...

Cartographie et Open Data : comprendre les bases pour votre business
L’Open Data et la Data Science permettent aujourd’hui d’optimiser l’analyse des données géographiques en mesurant des interactions très compliquées à modéliser autrement.

Du datalake au datawarehouse agile : le décisionnel à l'ère du big data
Le concept de datalake lié à la mouvance Big Data est un moyen pour les entreprises de mettre en œuvre une plateforme de stockage de données fédérée s’appuyant sur les...

Maîtriser la qualité de ses (Big) Data avec le marquage
Les Big Data sont en grande partie alimentées par les données du web. Julien Coquet nous explique l'importance de mettre en place des plans de marquage exhaustifs sur les sites...

Les enseignements du Glossaire Big Data de O'Reilly
En 2013, les Big Data faisaient partie des 7 ambitions stratégiques de la France déterminées par la Commission Innovation 2030. Aux côtés du stockage de l’énergie, de la médecine individualisée...

Business Intelligence et Big Data : nouvelle ère technologique
Quand on évoque le sujet des Big Data et de la Business Intelligence (BI), il n'est pas rare d'obtenir deux avis opposés : ceux qui disent que la Business Intelligence va être...

Le Big Data repousse les limites de la loi de Moore
Le Big Data apparaît aujourd'hui comme une continuité logique et une évolution naturelle du décisionnel. Après avoir rappelé dans le précédent article les fondamentaux de la BI, cet article se propose de faire un...

Les fondamentaux de la Business Intelligence
Le Big Data apparaît aujourd'hui comme une continuité logique et une évolution naturelle du décisionnel. Cet article se propose de faire un retour sur les fondamentaux de la Business Intelligence et ce qui a...
Solutions technologiques
Voir tous les contenus >
REPLAY | Data Lakes Hadoop : 3 scénarios d'évolution
L'écosystème Hadoop est dans la tourmente ! Fusion de Cloudera et Hortonworks, quasi-mort de Mapr, nouvelle version CDP complexe à appréhender ! Si votre plateforme data est construite avec cet écosystème,...

REPLAY | Plateforme Management Cloud : Promesse ou réalité ? Quels bénéfices ?
De nouvelles plateformes 100% Cloud Native dédiées au Data Management émergent pour répondre aux nombreux challenges liés à la gestion de données. Nos experts vous en détaillent les enjeux et...

REPLAY | Data / IA dans le Cloud : on fait le point avec Google Cloud
Google Cloud propose l’une des solutions les plus complètes et plus performantes du marché pour valoriser vos données dans le Cloud. Intégration de données, streaming, calcul, IA, analytique, dashboarding, gouvernance…...

REPLAY | Comment Harmonie Mutuelle pilote sa profitabilité avec Board ?
Dans un contexte de maîtrise des coûts, Harmonie Mutuelle a engagé la mise en œuvre, sous Board, d’un modèle de costing et de pilotage de la profitabilité, favorisant une meilleure...

REPLAY | Logical Data Fabric : comment accélérer toutes vos initiatives Data ?
Les projets Data se multiplient mais les cycles de déploiement sont décevants… Les directions métiers s’impatientent et œuvrent en shadow, tandis que les DSI peinent à délivrer, sont confrontées aux...

REPLAY | Utilisation de Dataiku comme plateforme de convergence analytique avancée et Data Science
Avez-vous déjà rêvé que plusieurs services et départements au sein de votre entreprise soient capables de collaborer et de partager aussi bien des données préparées que des modèles d’Intelligence Artificielle,...

Java / Scala / Spark : avez-vous subi la casse de l’année ?
Les dates et l’encodage (ANSI, UTF-8, UTF-16) ont toujours été et restent des épines dans le pied des développeurs. Le bug de l’an 2000 est passé, mais nous avons tout...

REPLAY | Utilisation pratique de Google Cloud Platform pour développer et industrialiser des projets d'IA
L’utilisation des plateformes cloud comme Google Cloud Platform est de plus en plus répandue pour tout développer tout type de projet Data et IT, mais GCP apporte-t-il un plus pour...

REPLAY | Boostez votre stratégie self-care avec Salesforce !
La crise engendrée par le COVID-19 a accéléré l’évolution du comportement des consommateurs dans le domaine du service client. Si le téléphone et l’e-mail restent des canaux privilégiés, d’autres canaux...

REPLAY | Retailers : pourquoi tirer parti de la virtualisation des données ?
Aujourd’hui, les retailers doivent exploiter au mieux un atout stratégique majeur pour atteindre leurs objectifs : la donnée. Cependant, les architectures traditionnelles de gestion de données ont montré leurs limites...

REPLAY | Synerise, une Customer Data & Experience Platform pour révolutionner les E-commerces
Comment rassembler les données client et former un profil client 360° ? Comment accélérer les prises de décision grâce à des technologies d’automatisation avancées ? Dans ce webinar disponible en replay, nous...

REPLAY | Passez à l'action grâce à l'analytique moderne dans le Cloud
Quelles sont les dernières tendances de l'analyse des données ? Comment passer à l’action dans un environnement de type Cloud ? Conseils et retour d’expérience dans ce webinar à revoir en replay...

REPLAY | Industrialisation de la Dataviz sous Azure
Les enjeux de l’industrialisation de la Dataviz sont de plus en plus forts pour les entreprises. Mais des difficultés sont inhérentes à la multiplicité des projets de data visualisation dans...

REPLAY | Comment faciliter l'exploitation de vos données dans votre entreprise ?
Comment simplifier le pilotage d’activités telles que la télémédecine et de téléradiologie ? Comment exploiter son patrimoine de données afin de proposer des statistiques d’utilisation pertinentes à vos clients ? Réponses,...
Tutoriels outils et langages data
Voir tous les contenus >
Move 2 cloud : Tests de non-régression ? Arrêtez de perdre du temps !
De plus en plus d’entreprises migrent vers le cloud pour bénéficier de ses avantages. Elasticité, scalabilité, performances, coût à l’usage… La Data est alors extraite des bases de données On...

TUTORIEL | Utiliser Power BI pour monitorer… Power BI !
Vous êtes responsable de la gestion d’un environnement Power BI ? Des statistiques sur vos rapports Power BI vous aideraient à démontrer votre impact, à prioriser la mise en avant de...

Cas d'usage : créer un accélérateur de migration Data As Code
Dans le cadre d’une migration/standardisation d’un patrimoine applicatif de Cloudera v6 vers Cloudera Data Platform v7, et au vu du nombre de projets (~70) écrits en Spark-Scala ou PySpark-Python à...

EL, ELT et ETL : savez-vous différencier ces processus de traitement de données ?
Dans le monde de la Data, on rencontre régulièrement les termes EL, ELT et ETL. Ce sont 3 acronymes qui se ressemblent, et signifient : Extract and Load (EL), Extract, Load,...

Supervision opérationnelle d'une plateforme Big Data Hadoop : les 5 étapes du processus
Dans ce nouvel article dédié à la question du monitoring technique et opérationnel d’une plateforme Big Data Hadoop, sous Horton Works (HDP) ou Cloudera (CDH), et désormais avec Cloudera Data...

Supervision opérationnelle d'une plateforme Big Data Hadoop : périmètres et grands principes
Dans cet article, nous allons aborder la question du monitoring technique et opérationnel d’une plateforme Big Data Hadoop, sous Hortonworks (HDP) ou Cloudera (CDH), et désormais avec Cloudera Data Platform...

TUTORIEL | Spark Structured Streaming : les tests de performance
Spark est un framework open source de calcul distribué. Plus performant qu'hadoop, disponible avec trois langages principaux (Scala, Java, Python), il s'est rapidement taillé une place de choix au sein...

Apache Kafka expliqué à mes grands-parents
Quand on travaille dans le secteur des nouvelles technologies (souvent abstraites et complexes), ce n'est pas toujours simple d'expliquer le travail que nous réalisons ou encore le fonctionnement d'un programme....

TUTORIEL | Spark Structured Streaming : de la transformation des données aux tests unitaires
Spark est un framework open source de calcul distribué. Plus performant qu'Hadoop, disponible avec trois langages principaux (Scala, Java, Python), il s'est rapidement taillé une place de choix au sein...

TUTORIEL | BigQuery et Data quality testing : comment centraliser vos tests et les industrialiser
Les utilisateurs de la Data ont besoin de données fiables, et pour les satisfaire nous pouvons être amenés à créer des requêtes SQL tous azimuts. On prend alors le risque...

TUTORIEL | Spark Structured Streaming : de la gestion des données à la maintenance des traitements
Spark est un framework open source de calcul distribué. Depuis sa version 2.0, il propose une nouvelle approche pour le streaming : Structured Streaming.

TUTORIEL | Les vues matérialisées avec BigQuery
En arrivant dans le monde de la Big Data en tant que consultant, j’ai été tout de suite confronté à l’un des problèmes majeurs de cette discipline : l’optimisation des requêtes...

TUTORIEL | Deep Learning : le Réseau neuronal convolutif (CNN)
Nous vous avons expliqué dans notre précédents articles la descente de gradient et son utilisation dans la régression linéaire, le fonctionnement et l’intérêt d’un réseau de neurones, mais aussi son...

TUTORIEL | Machine Learning : comment mettre en place l'apprentissage d'un réseau de neurones ?
Nous allons aborder aujourd'hui l’apprentissage d’un réseau de neurones. Cet article fait suite à notre précédent tutoriel "Comprendre ce qu'est un réseau de neurones et en créer un !". Vous...
Informations sur la gestion de vos données et vos droits
- En envoyant vos données vous acceptez qu’elles soient ainsi recueillies et utilisées par Business & Decision aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision
- Vous pourrez à tout moment utiliser le lien de désinscription intégré dans toute communication.
- En savoir plus sur nos engagements et vos droits sur vos données.