La conception d'un processeur superscalaire permet une forme de calcul parallèle appelée parallélisme au niveau des instructions à l'intérieur d'un seul processeur, ce qui permet de travailler davantage à la même fréquence d'horloge. Cela signifie que l'unité centrale exécute plus d'une instruction au cours d'un cycle d'horloge en exécutant plusieurs instructions en même temps (appelé dispatching d'instructions) sur des unités fonctionnelles doubles. Chaque unité fonctionnelle n'est qu'une ressource d'exécution à l'intérieur du noyau de l'unité centrale, comme une unité arithmétique et logique (UAL), une unité à virgule flottante (UFP), un décaleur de bits ou un multiplicateur.
La plupart des CPU superscalaires sont également en pipeline, mais il est possible d'avoir un CPU superscalaire non en pipeline ou un CPU non superscalaire en pipeline.
La technique superscalaire est soutenue par plusieurs caractéristiques du cœur du processeur :
Chaque instruction exécutée par un processeur scalaire modifie un ou deux éléments de données à la fois, mais chaque instruction exécutée par un processeur vectoriel traite plusieurs éléments de données à la fois. Un processeur superscalaire est un mélange des deux :
Dans une unité centrale superscalaire, un répartiteur d'instructions lit les instructions en mémoire et décide lesquelles peuvent être exécutées en parallèle, en les répartissant sur les multiples unités fonctionnelles en double disponibles à l'intérieur de l'unité centrale.
La conception de l'unité centrale superscalaire vise à améliorer la précision du répartiteur d'instructions et à lui permettre de maintenir les multiples unités fonctionnelles occupées en permanence. Depuis 2008, toutes les unités centrales à usage général sont superscalaires, une unité centrale superscalaire typique peut comprendre jusqu'à 4 ALU, 2 FPU et deux unités SIMD. Si le répartiteur ne peut pas garder toutes les unités occupées, la performance de l'unité centrale sera moindre.


