Alors, pour mettre un peu de math la dedans.
Tout est question de rapport de distances.
Regardons ma magnifique illustration.
Les distances d1 et d1' représentent la distance de l'œil (ou de la
camera) a l'objet du fond (mettons le mur de la pièce). Les distances
d2,d3,d2',d3' sont celles des objets a l'observateur. Toutes ces distances
varient en fonction de la position de l'observateur. En revanche, les
distances d4 et d5 restent fixes, quelque soit la position de
l'observateur.
On suppose donc que d1<d1', d2<d2' et d3 < d3'.

Quid des rapports : d4/d1', d5/d1', d3'<d1' et d4'/d1' :
Si on suppose que d1' tend vers l'infini (on est donc loin) alors les
rapports tendent tous vers 0. Resultat, impossible de distinguer si le
rond est plus proche ou plus loin que le triangle et on a l'impression
qu'ils sont dans le mur.

En revanche, si on a d3 qui tend vers 0 (donc très proche du rond) et en
supposant que l'on puisse quand même voir les objets derrière le rond.
Nous avons donc les rapport d4/d3, d5/d3 qui tendent vers l'infini. On a
donc l'impression que le triangle et le mur se trouvent très très loin.

Ce qui montre bien que c'est la distance entre l'observateur et les objets
qui définie les perspectives.