La science des données est l'étude de l'extraction de connaissances à partir de données. Elle utilise diverses techniques dans de nombreux domaines, notamment le traitement du signal, les mathématiques, les probabilités, l'apprentissage machine, la programmation informatique, les statistiques, l'ingénierie des données, la comparaison de modèles et la visualisation des données, dans le but d'extraire des connaissances utiles des données. Les systèmes informatiques étant capables de traiter davantage de données, les données volumineuses constituent un aspect important de la science des données.

Une personne qui fait de la science des données est appelée un data scientist. Les scientifiques des données résolvent des problèmes de données compliqués en utilisant les mathématiques, les statistiques et l'informatique, bien qu'une très bonne compétence dans ces matières ne soit pas requise. Cependant, un data scientist est très probablement un expert dans seulement une ou deux de ces disciplines, ce qui signifie que les équipes interdisciplinaires peuvent être une composante clé de la science des données.

Les bons spécialistes des données sont capables d'appliquer leurs compétences pour atteindre de nombreux objectifs. Leurs aptitudes et leurs compétences sont très variables.