Using Cloudera Deploy to install Cloudera Data Platform (CDP) Private Cloud

Following our recent Cloudera Data Platform (CDP) overview, we cover how to deploy CDP private Cloud on you local infrastructure. It is entirely automated with the Ansible cookbooks published by Cloudera and it is reproducible on your local host with Vagrant.

CDP is an enterprise data cloud. It provides a powerful Big Data platform, built-in security with automatic compliance and governance of data protection, as well as policy-based, metadata-driven analytics for end users.

Deploying a CDP Private Cloud cluster is not a straightforward task. Therefore, we present a way of getting a local cluster up and running in a few…


Cloudera Deploy pour installer Cloudera Data Platform (CDP) Private Cloud

Suite à notre récente présentation de CDP, passons désormais au déploiement CDP private Cloud sur votre infrastructure locale. Le deploiement est entièrement automatisé avec les cookbooks Ansible édités par Cloudera et il est reproductible sur votre poste local avec Vagrant.

Cloudera Data Platform (CDP) est une solution cloud de données s’adressant aux entreprises. Il fournit une puissante plateforme Big Data, une sécurité intégrée avec une conformité automatique et une gouvernance de la protection des données, ainsi que des analyses basées sur des politiques et des métadonnées pour les utilisateurs finaux.

Le déploiement d’un cluster CDP Private Cloud n’est pas une…


An overview of Cloudera Data Platform (CDP)

Cloudera Data Platform (CDP) is a cloud computing platform for businesses. It provides integrated and multifunctional self-service tools in order to analyze and centralize data. It brings security and governance at the corporate level, all of which hosted on public, private and multi cloud deployments. CDP is the successor to Cloudera’s two previous Hadoop distributions: Cloudera Distribution of Hadoop (CDH) and Hortonworks Data Platform (HDP). In this article, we dive into the new Cloudera Big Data offering and how it differs from its predecessors.

CDP features a unique public-private approach, real-time data analytics, scalable on-premise/on-cloud and hybrid cloud deployment options…


Présentation de Cloudera Data Platform (CDP)

Cloudera Data Platform (CDP) est une plateforme de cloud computing pour les entreprises. CDP fournit des outils intégrés et multifonctionnels en libre-service afin d’analyser et de centraliser les données. Elle apporte sécurité et gouvernance à l’échelle de l’entreprise, tout pouvant être déployé en cloud public, privé et multi-cloud. CDP est le successeur des deux précédentes distributions Hadoop de Cloudera : Cloudera Distribution of Hadoop (CDH) et Hortonworks Data Platform (HDP). Dans cet article, nous nous penchons sur la nouvelle offre Big Data de Cloudera et sur ce qui la différencie de ses prédécesseurs.

CDP propose une approche publique-privée unique, des…


Modern Python part 3: run a CI pipeline & publish your package to PiPy

To propose a well-maintained and usable Python package to the open-source community or even inside your company, you are expected to accomplish a set of critical steps. First ensure that your code is unit tested. Second respect the common writing and format styles. Automate these steps and integrate them in a continuous integration pipeline to avoid any regression that stems from modifications applied to your source code. Finally, provide enough documentation for future users. Once done it is common to publish your Python package on the Python Package Index (PyPI). Here we are going to see how to accomplish each…


Python moderne, partie 3 : établir une chaîne de CI et publier son package sur PiPy

Avant de partager un package Python avec la communauté ou au sein de son organization, il est recommandé d’accomplir un certain nombres de tâches. Elles ont vocation à péréniser le bon fonctionnement du package sur le long terme tout en encourageant de nouvelles contributions. Tout d’abord assurez vous que votre code soit couvert par des tests unitaires. Respectez les conventions de style et de format d’écriture utilisées couramment avec Python. Ensuite Automatisez les tests et l’évaluation de la qualité de votre code afin d’intégrer ces étapes dans une chaîne d’intégration continue pour éviter de quelconques régressions qui émergerait dans cotre…


Modern Python Environment part 2: write unit tests & enforce Git commit conventions

Good software engineering practices always bring a lot of long-term benefits. For example, writing unit tests permits you to maintain large codebases and ensures that a specific piece of your code behaves as expected. Writing consistent Git commits also enhance the collaboration between the project stakeholders. Well-crafted Git commit messages open the door to automatic versioning and generated change log files. Consequently, a lot of attempts are currently ongoing and applied to normalize the messages written in our Git commits.

In the first part of this serie, we setup, our project by installing different Python versions with pyenv, setting a…


Python moderne, partie 2 : écrire les tests unitaires & respecter les conventions Git commit

L’application de bonnes pratiques en ingénierie logicielle apporte une plus-value certaine à vos projets. Par exemple l’écriture de tests unitaires vous permet de maintenir de larges projets en vous assurant que des parties spécifiques de votre code fonctionnent correctement. Écrire des messages Git commit cohérents, lisibles et compréhensibles par tous, améliore le suivi et la compréhension des changements apportés durant le processus de développement et de maintenance de votre projet, tout en fluidifiant la communication entre les différents collaborateurs.

Au cours de l’article précédent nous avons installé différentes version de python à l’aide de pyenv, définit une version locale de…


Modern Python Environment 1: start a project with pyenv & poetry

When learning a programming language, the focus is essentially on understanding the syntax, the code style, and the underlying concepts. With time, you become sufficiently comfortable with the language and you start writing programs solving new exciting problems.

However, when you need to move towards this step, there is an aspect that one might have underestimated which is how to build the right environment. An environment that enforces good software engineering practices, improves productivity and facilitates collaboration. At Adaltas, we manage several open source projects and we welcome a lot of contributions. They are mostly targeting the Node.js platform. …


Environnement de travail Python 1 : création du projet avec pyenv & poetry

L’apprentissage d’un langage de programmation se structure souvent autour de points essentiels : pratiquer la syntaxe du langage, en maîtriser le style, comprendre certains principes et paradigmes sous-jacents pour en exploiter tout le potentiel (e.g., programmation procédurale, orientée objet ou fonctionnelle). Avec un peu de temps et beaucoup de pratique, vous êtes prêt à exploiter vos nouvelles compétences pour écrire des programmes informatiques capables de résoudre de nouveaux problèmes.

Cependant, la maîtrise d’un langage ne fera pas de vous un ingénieur accompli. En effet, un aspect souvent sous-estimé, est d’être capable d’établir un environnement de travail qui respecte les bonnes…

Adaltas

Open Source consulting - Big Data, Data Science, Node.js

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store