scrubadub - anonymize text and replace names, urls, etc with tags
 
 
PrettyPandas - render Pandas dataframe to nice readable table with currency, percent, etc.
 
 
Apache Tika – Tike extracts and tokenizes text from 1400 file formats
Tike extracts and tokenizes text from 1400 file formats, like .doc, .pdf, .html, etc.
 
 
Apache Drill - Aggregate multiple heterogeneous datasource
Schema-free SQL for Hadoop, NoSQL and Cloud Storage
 
 
Trucs et astuces sur MongoDB – Partie 6/6 – Architecture et optimisation
Suite de l’article Trucs et astuces sur MongoDB – Partie 5/6 – Les agrégations Les autres articles : Les bases Réaliser du CRUD Modéliser les données Optimiser la performance avec les indexes Les agrégations Architecture et optimisation 1. La réplication La réplication fournit la haute disponibilité : si un serveur MongoDB crash, les autres prennent […]
Cet article Trucs et astuces sur MongoDB – Partie 6/6 – Architecture et optimisation est apparu en premier sur Fabien Vauchelles.
 
 
Trucs et astuces sur MongoDB – Partie 5/6 – Les agrégations
Suite de l’article Trucs et astuces sur MongoDB – Partie 4/6 – Optimiser la performance avec les indexes Les agrégations fonctionnent en tuyau : on ajoute les phases à la suite des autres. L’ordre est important car il impacte directement les performances. L’optimisation de chaque requête est unique ! 1. Les phases Elles sont : […]
Cet article Trucs et astuces sur MongoDB – Partie 5/6 – Les agrégations est apparu en premier sur Fabien Vauchelles.
 
 
Trucs et astuces sur MongoDB – Partie 4/6 – Optimiser la performance avec les indexes
Suite de l’article Trucs et astuces sur MongoDB – Partie 3/6 – Modéliser les données 1. A quoi servent les indexes ? Les indexes sont utilisés pour optimiser un type de requête. On peut créer plusieurs indexes sur une collection. Ils servent à : retrouver des documents rapidement (find) ; accélérer le tri d’une collection […]
Cet article Trucs et astuces sur MongoDB – Partie 4/6 – Optimiser la performance avec les indexes est apparu en premier sur Fabien Vauchelles.
 
 
Trucs et astuces sur MongoDB – Partie 3/6 – Modéliser les données
Suite de l’article Trucs et astuces sur MongoDB – Partie 2/6 – Réaliser du CRUD Relation 1->1 : Séparé ou imbriqué ? Le choix est réalisé sur les critères suivants : La fréquence d’accès : si 2 types de données sont accédés à des fréquences différentes, on les sépare ; La taille : inutile de […]
Cet article Trucs et astuces sur MongoDB – Partie 3/6 – Modéliser les données est apparu en premier sur Fabien Vauchelles.
 
 
Trucs et astuces sur MongoDB – Partie 2/6 – Réaliser du CRUD
Suite de l’article Trucs et astuces sur MongoDB – Partie 1/6 – Les bases 1. Insérer 1.1. Insérer un document (insert) 2. Modifier 2.1. Remplacer complètement un document (update) Remarque: seul le 1er document est modifié 2.2. Modifier les champs d’un document (update/$set) Remarque: si le document n’existe pas, il n’est pas créé. 2.3. Modifier […]
Cet article Trucs et astuces sur MongoDB – Partie 2/6 – Réaliser du CRUD est apparu en premier sur Fabien Vauchelles.
 
 
Trucs et astuces sur MongoDB – Partie 1/6 – Les bases
La certification MongoDB for Java Developers par Andrew Erlichson et Jeff Yemin, ce qu’il faut en retenir. Plus d’info sur MongoDB ici. Obtenir les informations sur MongoDB 1. Lister les bases de données 2. Utiliser une base de données 3. Lister les collections d’une base de données
Cet article Trucs et astuces sur MongoDB – Partie 1/6 – Les bases est apparu en premier sur Fabien Vauchelles.
 
 
Database Versioning with Ladder Migrations
Concept d'échelle pour créer un système de migration des données (SQL ou noSQL)
Chaque barreau contient une fonction up() pour migrer et une fonction down() pour le rollback.
On monte progressivement les barreaux.
 
 
generatedata.com
 
 
JAVA Data Types