BigQuery
From Wikipedia, the free encyclopedia
| Développé par | |
|---|---|
| État du projet | En activité |
| Langues | Anglais |
| Type |
Cloud computing Interface de programmation Logiciel en tant que service |
| Site web | cloud.google.com/bigquery |
BigQuery est un service web RESTful intégré à Google Cloud Plateform qui permet l'analyse des données en collaboration avec l'espace de stockage Google. C'est un logiciel en tant que service (Software as a service : SaaS) qui peut être utilisé en complément de MapReduce.
BigQuery est également un entrepôt de données de Google, en mode Saas, modifiable dans le langage de requête SQL legacy ou en standard. Celui-si contient des jeux de données (datasets) qui contiennent des tables ou des vues.
BigQuery débute en version alpha en . Il est rendu disponible en , lors de la conférence Google Atmosphère[1].
En 2014, MapR présente le projet Apache Drill, qui vise à résoudre des problèmes similaires[2].
En , les utilisateurs européens du service ont subi une interruption de 12 heures[3].
Depuis , les Feuilles de calcul Google peuvent utiliser BigQuery[4].
Conception
BigQuery fournit un accès externe à la technologie Dremel[5],[6], un système évolutif, interactif ad hoc sur le système de requête pour l'analyse de la lecture seule de données imbriquées. Pour utiliser des données dans BigQuery, celles-ci doivent d'abord être téléchargées sur le stockage de Google et ensuite importées à l'aide de l'API HTTP. Il exige que toutes les demandes soient authentifiées via un mécanisme d'authentification OAuth[réf. nécessaire].
Fonctionnalités
- Entrepôt de données sans serveur[7].
- Analyse en temps réel.
- Haute disponibilité automatique.
- Langage SQL standard.
- Requêtes fédérées et entreposage de données logique.
- Séparation du stockage et des calculs.
- Sauvegarde automatique et restauration facile.
- Fonctions et types de données géospatiaux.
- Service de transfert de données.
- Intégration à un écosystème de big data.
- Évolutivité à l'échelle du pétaoctet.
- Modèles tarifaires flexibles.
- Chiffrement des données et sécurité.
- Localité des données.
- Base pour l'IA.
- Base pour la veille stratégique.
- Ingestion flexible des données.
- Gouvernance des données.
- Interaction automatisée.
- Surveillance et journalisation complètes avec Stackdriver.
- Maîtrise des coûts