Technologies
Les outils technologiques du Big Data et de l’IA sont nombreux. Avec une prépondérance de l’éco-système open-source (autour de Apache Hadoop), le domaine est très innovant. Bases de données NoSQL (MongoDB, HBase, CouchDB ou Redis par exemple), architectures applicatives (Data Lake), infrastructures cloud, outils d’intégration (Talend, Nifi…), outils et langages pour la data science et l’IA (Python, Scala, Knime, Dataiku…), virtualisation des données, in-memory… Les technologies se multiplient et les choix sont complexes à réaliser.
Découvrez les fondamentaux des solutions technologiques, et profitez de nos tutoriels dédiés aux outils et langages Data.
Fondamentaux technologiques data
Voir tous les contenus >Misez sur l'approche Mixture of Experts pour des LLMs plus rapides et plus efficaces
La course est lancée pour construire des modèles de langage de plus en plus grands et meilleurs ! Mais à mesure que les LLMs grandissent, ils deviennent de plus en plus...
DMP, DataLake, CDP : les solutions pour la qualification des données
Comment choisir la solution la plus adaptée à la qualification des données pour ses projets Data ? Quels sont les critères à prendre en compte ? Les réponses de Didier Gaultier, Directeur...
REPLAY | Maintenez vos données fiables et prêtes pour l'analyse
Vous vous demandez comment maintenir des données fiables et prêtes pour l’analyse ? Dans ce webinar maintenant disponible en replay, vous découvrirez les enjeux de la gestion de données hétérogènes ainsi...
Cartographie et Open Data : comprendre les bases pour votre business
L’Open Data et la Data Science permettent aujourd’hui d’optimiser l’analyse des données géographiques en mesurant des interactions très compliquées à modéliser autrement.
Du datalake au datawarehouse agile : le décisionnel à l'ère du big data
Le concept de datalake lié à la mouvance Big Data est un moyen pour les entreprises de mettre en œuvre une plateforme de stockage de données fédérée s’appuyant sur les...
Maîtriser la qualité de ses (Big) Data avec le marquage
Les Big Data sont en grande partie alimentées par les données du web. Julien Coquet nous explique l'importance de mettre en place des plans de marquage exhaustifs sur les sites...
Les enseignements du Glossaire Big Data de O'Reilly
En 2013, les Big Data faisaient partie des 7 ambitions stratégiques de la France déterminées par la Commission Innovation 2030. Aux côtés du stockage de l’énergie, de la médecine individualisée...
Business Intelligence et Big Data : nouvelle ère technologique
Quand on évoque le sujet des Big Data et de la Business Intelligence (BI), il n'est pas rare d'obtenir deux avis opposés : ceux qui disent que la Business Intelligence va être...
Le Big Data repousse les limites de la loi de Moore
Le Big Data apparaît aujourd'hui comme une continuité logique et une évolution naturelle du décisionnel. Après avoir rappelé dans le précédent article les fondamentaux de la BI, cet article se propose de faire un...
Les fondamentaux de la Business Intelligence
Le Big Data apparaît aujourd'hui comme une continuité logique et une évolution naturelle du décisionnel. Cet article se propose de faire un retour sur les fondamentaux de la Business Intelligence et ce qui a...
Solutions technologiques
Voir tous les contenus >Passer du ML au MLOps avec Dataiku
Vous souhaitez utiliser le MLOps dans votre projet d’intelligence artificielle, sans consacrer trop du temps au développement, ou sans avoir les compétences nécessaires en codage ? Rassurez-vous, nul besoin d’être...
REPLAY | Une plateforme pour réunir tous vos portails : Liferay, la solution de vos expériences digitales
Marketplace & e-Commerce, Intranet & Extranet, Partenaires & Fournisseurs, modules de Marketing Analytics ou Relationnels… Orange Business a placé Liferay au cœur de sa stratégie Digitale et réalisé de nombreux...
REPLAY | Cdiscount : les recettes Data & IA du leader e-commerce
Cdiscount a placé la data et les IA au cœur de sa stratégie. Analytique, Intelligence Artificielle, Data Mesh, Big Data, Data Cloud, la démarche du leader e-commerce s'est construit au...
REPLAY | Optimiser, gérer et contrôler ses coûts avec la Plateforme Data Cloud Snowflake
Comment les entreprises peuvent-elles optimiser leurs coûts dans un contexte de besoin d’analyses toujours plus important ? Réponses avec le retour d’expérience de Peaksys, filiale Tech de Cdiscount, présenté lors Data...
REPLAY | MLOps Dataiku : 15 minutes pour déployer un modèle d'IA en production
Le Machine Learning Ops (MLOps) est au cœur de nombreuses problématiques actuelles des entreprises ayant besoin de faire réentraîner régulièrement leurs modèles. Comment déployer un modèle d’intelligence artificielle en production ?...
Fin de Talend Open Studio… comment réagir ?
Talend Open Studio, c’est fini ! Quels impacts pour votre entreprise ? Quelles sont les solutions ? On en discute en détail dans cet article. Décidément le monde de la data est particulièrement...
REPLAY | Data Lakes Hadoop : 3 scénarios d'évolution
L'écosystème Hadoop est dans la tourmente ! Fusion de Cloudera et Hortonworks, quasi-mort de Mapr, nouvelle version CDP complexe à appréhender ! Si votre plateforme data est construite avec cet écosystème,...
REPLAY | Plateforme Management Cloud : Promesse ou réalité ? Quels bénéfices ?
De nouvelles plateformes 100% Cloud Native dédiées au Data Management émergent pour répondre aux nombreux challenges liés à la gestion de données. Nos experts vous en détaillent les enjeux et...
REPLAY | Data / IA dans le Cloud : on fait le point avec Google Cloud
Google Cloud propose l’une des solutions les plus complètes et plus performantes du marché pour valoriser vos données dans le Cloud. Intégration de données, streaming, calcul, IA, analytique, dashboarding, gouvernance…...
REPLAY | Comment Harmonie Mutuelle pilote sa profitabilité avec Board ?
Dans un contexte de maîtrise des coûts, Harmonie Mutuelle a engagé la mise en œuvre, sous Board, d’un modèle de costing et de pilotage de la profitabilité, favorisant une meilleure...
REPLAY | Logical Data Fabric : comment accélérer toutes vos initiatives Data ?
Les projets Data se multiplient mais les cycles de déploiement sont décevants… Les directions métiers s’impatientent et œuvrent en shadow, tandis que les DSI peinent à délivrer, sont confrontées aux...
REPLAY | Utilisation de Dataiku comme plateforme de convergence analytique avancée et Data Science
Avez-vous déjà rêvé que plusieurs services et départements au sein de votre entreprise soient capables de collaborer et de partager aussi bien des données préparées que des modèles d’Intelligence Artificielle,...
Java / Scala / Spark : avez-vous subi la casse de l’année ?
Les dates et l’encodage (ANSI, UTF-8, UTF-16) ont toujours été et restent des épines dans le pied des développeurs. Le bug de l’an 2000 est passé, mais nous avons tout...
REPLAY | Utilisation pratique de Google Cloud Platform pour développer et industrialiser des projets d'IA
L’utilisation des plateformes cloud comme Google Cloud Platform est de plus en plus répandue pour tout développer tout type de projet Data et IT, mais GCP apporte-t-il un plus pour...
Tutoriels outils et langages data
Voir tous les contenus >Snowflake : pourquoi et comment coder directement en Python ?
Snowflake, la plateforme d’hébergement de données dans le cloud est reconnue pour sa puissance, sa flexibilité et sa sécurité. Elle offre un large éventail de services pour stocker, analyser, partager...
Snowflake : les Dynamic Tables peuvent-elles remplacer les ETL/ELT ?
Après toutes les annonces de Snowflake lors du Summit et Snow Day de l'année dernière, les nouvelles fonctionnalités arrivent progressivement en General Availibility. C’est désormais au tour des Dynamic Tables,...
Certification éditeur : vos projets, vos clients et vous avez tout à y gagner
« J’ai le plaisir de vous annoncer que j’ai obtenu une nouvelle certification XX (insérer ici un éditeur ;) ) » est devenu un post récurent sur les réseaux sociaux comme LinkedIn....
Certification Databricks Certified Associate Developer for Apache Spark : comment la passer avec brio ?
Dans ce guide, je vous partage mon expérience personnelle sur la préparation et le passage de la certification Databricks Certified Associate Developer for Apache Spark, ainsi que mes conseils pour...
Move2cloud : et si c'était le moment de repenser vos dashboards ?
Les avantages du cloud ne sont aujourd’hui plus à prouver. L’élasticité, les coûts réduits, la maintenance simplifiée des serveurs ont déjà convaincu grand nombre d’entreprises de migrer leurs plateformes data...
TUTORIEL | Utiliser les API REST de Microsoft Power BI avec Power BI Report Server
Comme promis lors d’un précédent article « Utiliser Power BI pour monitorer… Power BI », voici un tutoriel destiné à vous expliquer comment utiliser les API REST de Microsoft Power BI, mais...
Move2cloud : Tests de non-régression ? Arrêtez de perdre du temps !
De plus en plus d’entreprises migrent vers le cloud pour bénéficier de ses avantages. Elasticité, scalabilité, performances, coût à l’usage… La Data est alors extraite des bases de données On...
TUTORIEL | Utiliser Power BI pour monitorer… Power BI !
Vous êtes responsable de la gestion d’un environnement Power BI ? Des statistiques sur vos rapports Power BI vous aideraient à démontrer votre impact, à prioriser la mise en avant de...
Cas d'usage : créer un accélérateur de migration Data As Code
Dans le cadre d’une migration/standardisation d’un patrimoine applicatif de Cloudera v6 vers Cloudera Data Platform v7, et au vu du nombre de projets (~70) écrits en Spark-Scala ou PySpark-Python à...
EL, ELT et ETL : savez-vous différencier ces processus de traitement de données ?
Dans le monde de la Data, on rencontre régulièrement les termes EL, ELT et ETL. Ce sont 3 acronymes qui se ressemblent, et signifient : Extract and Load (EL), Extract, Load,...
Supervision opérationnelle d'une plateforme Big Data Hadoop : les 5 étapes du processus
Dans ce nouvel article dédié à la question du monitoring technique et opérationnel d’une plateforme Big Data Hadoop, sous Horton Works (HDP) ou Cloudera (CDH), et désormais avec Cloudera Data...
Supervision opérationnelle d'une plateforme Big Data Hadoop : périmètres et grands principes
Dans cet article, nous allons aborder la question du monitoring technique et opérationnel d’une plateforme Big Data Hadoop, sous Hortonworks (HDP) ou Cloudera (CDH), et désormais avec Cloudera Data Platform...
TUTORIEL | Spark Structured Streaming : les tests de performance
Spark est un framework open source de calcul distribué. Plus performant qu'hadoop, disponible avec trois langages principaux (Scala, Java, Python), il s'est rapidement taillé une place de choix au sein...
Apache Kafka expliqué à mes grands-parents
Quand on travaille dans le secteur des nouvelles technologies (souvent abstraites et complexes), ce n'est pas toujours simple d'expliquer le travail que nous réalisons ou encore le fonctionnement d'un programme....
Informations sur la gestion de vos données et vos droits
- En envoyant vos données vous acceptez qu’elles soient ainsi recueillies et utilisées par Business & Decision aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision
- Vous pourrez à tout moment utiliser le lien de désinscription intégré dans toute communication.
- En savoir plus sur nos engagements et vos droits sur vos données.