BigQuery
From Wikipedia, the free encyclopedia
BigQuery est un service web RESTful intégré à Google Cloud Plateform qui permet l'analyse des données en collaboration avec l'espace de stockage Google. C'est un logiciel en tant que service (Software as a service : SaaS) qui peut être utilisé en complément de MapReduce.
| Développé par | |
|---|---|
| État du projet | En activité |
| Langues | Anglais |
| Type |
Cloud computing Interface de programmation Logiciel en tant que service |
| Site web | cloud.google.com/bigquery |
BigQuery est également un entrepôt de données de Google, en mode Saas, modifiable dans le langage de requête SQL legacy ou en standard. Celui-si contient des jeux de données (datasets) qui contiennent des tables ou des vues.
Histoire
BigQuery débute en version alpha en . Il est rendu disponible en , lors de la conférence Google Atmosphère[1].
En 2014, MapR présente le projet Apache Drill, qui vise à résoudre des problèmes similaires[2].
En , les utilisateurs européens du service ont subi une interruption de 12 heures[3].
Depuis , les Feuilles de calcul Google peuvent utiliser BigQuery[4].
Conception
BigQuery fournit un accès externe à la technologie Dremel[5],[6], un système évolutif, interactif ad hoc sur le système de requête pour l'analyse de la lecture seule de données imbriquées. Pour utiliser des données dans BigQuery, celles-ci doivent d'abord être téléchargées sur le stockage de Google et ensuite importées à l'aide de l'API HTTP. Il exige que toutes les demandes soient authentifiées via un mécanisme d'authentification OAuth[réf. nécessaire].
Fonctionnalités
- Entrepôt de données sans serveur[7].
- Analyse en temps réel.
- Haute disponibilité automatique.
- Langage SQL standard.
- Requêtes fédérées et entreposage de données logique.
- Séparation du stockage et des calculs.
- Sauvegarde automatique et restauration facile.
- Fonctions et types de données géospatiaux.
- Service de transfert de données.
- Intégration à un écosystème de big data.
- Évolutivité à l'échelle du pétaoctet.
- Modèles tarifaires flexibles.
- Chiffrement des données et sécurité.
- Localité des données.
- Base pour l'IA.
- Base pour la veille stratégique.
- Ingestion flexible des données.
- Gouvernance des données.
- Interaction automatisée.
- Surveillance et journalisation complètes avec Stackdriver.
- Maîtrise des coûts
Caractéristiques
- La gestion des données - créer et supprimer des tables sur la base d'un schéma codé JSON, importer des données codées au format CSV ou JSON à partir de l'espace de stockage Google.
- Requête - les requêtes sont exprimées dans la norme du langage SQL[8] et les résultats sont retournés en JSON avec une réponse de taille maximale de 128 Mo, ou de taille illimitée, lorsque le critère "grands résultats" est activé[9].
- Intégration - BigQuery peut être utilisé à partir de Google Apps Script, les feuilles de calcul Google, ou n'importe quel langage qui peut travailler avec son API REST ou les bibliothèques client[10].
- Contrôle d'accès - il est possible de partager l'accès aux jeux de données avec une personne, un groupe, ou le monde.
- Le service est gratuit jusqu'à 1 To de données analysées par mois et 10 Go de données stockées[7].