Complexité ( ou "coût en temps" ) des algorithmes

Comment mesurer l'efficacité d'un algorithme ?

contrairement à ce que le nom suggère, la complexité n’est pas une mesure de si un algorithme est « simple » ou « complexe » d’un point de vue humain, mais une mesure de sa durée d’exécution ( son "coût" ).

Le temps d’exécution d’un programme dépend :

des données du problème pour cette exécution
de la qualité du code machine engendré par le compilateur
de la nature et de la rapidité des instructions du processeur
de l’efficacité de l’algorithme
de l’encodage des données

... et aussi de la qualité de la programmation !

Beaucoup de paramètres, dont certains ne sont pas faciles à évaluer...Donc :

On oublie tout ce qui est subjectif (programmeur, matériel, ... ) et dont l'influence sur le temps d'exécution est souvent impossible à évaluer.
On cherche une grandeur n pour “mesurer” la quantité de données à traiter.
On calcule les performances uniquement en fonction de n.

Et on parle toujours de la complexité d’un ALGORITHME, pas d’un programme réel.

Que représente le paramètre `n` ?

n est une évaluation de la TAILLE DES DONNÉES, c’est-à-dire le nombre de données que devra manipuler l’algorithme.

On doit essayer de choisir comme taille ( la ou ) les dimensions les plus significatives.

Par exemple, selon que le problème est modélisé par :

des nombres : les valeurs de ces nombres, le nombre de chiffres dans leur codage binaire, ...
des matrices m × n : max(m, n), m.n, m + n, ...
des arbres : la hauteur, le nombre de nœuds, de feuilles, ...
des listes, tableaux, fichiers : nombre de cases, d’éléments, ...
des mots : leur longueur, le nombre de lettres de l’alphabet utilisé pour les écrire, ...

Le choix d’une structure de données à une grande influence sur l’efficacité d’un algorithme ! !

Qu’est ce que l’on compte pour mesurer l'efficacité ?

Dans l’idéal, il faut compter toutes les “opérations” élémentaires impliquées dans l’algorithme.
Cependant, toutes les instructions n’ont pas le même coût en temps !

Il faut donc choisir quelles opérations compter : des opérations simples et indépendantes de l’implantation de l’algorithme : affectations, comparaisons, ....

Il n’est pas toujours évident de compter exactement le nombre d’opérations impliquées dans les algorithmes. On se contente de trouver des approximations.

Et pour simplifier, on fait l’hypothèse que toutes ces opérations élémentaires ont le même coût en temps.

Il n’y a pas que la taille qui compte...

Un même algorithme sert en général à résoudre divers problèmes qui ne présentent pas le même coût en temps :

Par exemple, dans le cas d'un algorithme qui insère une valeur dans un tableau :

si l'insertion se fait en fin de tableau, on est dans le "meilleur cas", car c'est une opération rapide.
si l'insertion se fait au contraire en début de tableau, c'est le "pire cas" car il faut décaler tous les autres éléments du tableau en mémoire, ce qui prend un temps proportionnel à la taille du tableau.
si l'insertion se fait n'importe où dans le tableau, la complexité va dépendre de cette position : il faudrait donc déterminer une complexité "moyenne".

On préfère généralement majorer la complexité d'un algorithme, c’est-à-dire que l’on cherche une borne supérieure que l’on est sûr de ne jamais dépasser : c'est la complexité d’un algorithme dans le PIRE cas.

Complexité asymptotique

Ce n’est pas très intéressant d’étudier la complexité si la taille du problème est petite : l’efficacité d’un algorithme n’est un enjeu important que sur les gros problèmes.

Mais on ne sait pas où est la limite entre "petits" et "gros" problèmes !!

Conséquence : on ne s’intéresse qu'à la complexité asymptotique des algorithmes, c'est à dire quand la taille n du problème tend vers les très grandes valeurs ( voire vers ∞ ).

Définition :

La complexité est exprimée sous la forme O(f(n)) ( "grand O de f de n" ), où f(n) est une fonction de n qui majore le nombre d'opérations élémentaires de l'algorithme, c'est à dire que le nombre d'opérations sera, pour de très grandes valeurs de n, toujours inférieur ou égal à la valeur de f(n) multipliée par une constante :

nombre d'opérations ≤ k . f(n)

Exemples :

Nombre d'opérations	Complexité
1 000 000	`O(1)`
n	`O(n)`
10.n	`O(n)`
5.n³ + 12.n² + 8	`O(n³)`
n¹⁰	`O(2ⁿ)`

Quelques classes de complexité

La connaissance de la complexité d'un algorithme unique n'a pas beaucoup d'intérêt tant qu'on ne la compare pas à celle d'un autre algorithmie faisant le même travail; le classement des complexités en classes de complexité permet de faire cette comparaison et de déterminer quel est l'algorithme le plus efficace.

De la meilleure à la pire :

Nom	Notation	Durée quand on double la taille des données à traiter	Exemple(s)
constant	`O(1)`	durée inchangée !	opérations élémentaires : affectation, comparaison,...
logarithmique	`O(log n)`	prend seulement une étape de plus	recherche dichotomique
linéaire	`O(n)`	prend 2 fois plus de temps	recherche séquentielle, calcul de la longueur d'une liste,...
quasi-linéaire	`O(n.log n)`	prend 2 fois de temps + `n` étapes supplémentaires	tri fusion
quadratique	`O(n²)`	prend 4 fois plus de temps	tri à bulles, tri par insertion,...
polynomial	`O(n^k)`	prend 2^k fois plus de temps	avec `k` fixé ( `k` > 3 )
exponentiel	`O(kⁿ)`	prend tellement de temps que c'en est inconcevable... à fuir !	Fibonacci récursif.
factorielle	`O(n!)`	prend tellement de temps que c'en est inconcevable... à fuir !	Calcul de la factorielle d'un entier

Quelques relations utiles

tout algorithme dont la complexité ne dépend pas de n est en O(1).
k . O(f(n)) = O(f(n)) : quand k opérations de complexité O(f(n)) se succèdent ( par exemple, une boucle de longueur k avec 3 opérations d'affectation ), la complexité globale est aussi de O(f(n)).
O(f(n)) + O(f(n)) = O(f(n)) : même chose pour deux parties successives, de même complexité, d'un algorithme.
O(f₁(n)) + O(f₂(n)) = max(O(f₁(n), O(f₂(n)) : pour deux parties successives de complexité différentes, la complexité globale est égale à la plus grande des deux ( le "maillon faible"... )
O(f₁(n)) x O(f₂(n)) = O(f₁(n) x f₂(n)) : pour deux parties imbriquées de complexité différentes ( par exemple, 2 boucles imbriquées ), la complexité globale est égale au produit des deux.
n . O(f(n)) = O(n.f(n))

Synthèse

Déterminer la TAILLE n du problème.
Choisir les OPÉRATIONS à compter.
Déterminer quel est le PIRE CAS pour l’algorithme.
Ne pas oublier que n est grand.
COMPTER (APPROXIMATIVEMENT) le nombre d’opérations élémentaires en fonction de n.
Donner une borne supérieure la plus précise possible.