Ma réponse est dans l'optique de la recherche de performance sur un traitement d'image, aujourd'hui. Je ne regarde pas le niveau de performance et traitant une image tout en faisant autre chose en même temps. Dans ces cas là d'ailleurs l'évaluation du goulet d'étranglement deviendrait un poil plus difficile, les source de perte de performance devenant innombrable ( accès concurrent à la mémoire, accès concurrent aux DD, au réseau), désoptimisation de cache et autres.

pour ce qui est du lien multithread x64, je ne vois pas le rapport, ni l'OS, ni le CPU n'apportant de nouveautés en gestion multithread. Sous photoshop, le 64bit entraine en soit une forte augmentation des performances ( de l'ordre de 10%)- lié au doublement du nombre de registres, mais rien à voir avec du multithreading.

Pour ce qui est du 'l'utilisation des API intel pour le traitement parallèle et zou", c'est hélas très très loin de la réalité. Multithreader un traitement est très lourd et a un impact fort sur l'architecture d'une application ( repit axe de réflexion : gestion de l'affichage pendant le calcul, gestion de l'interruption de tache, du undo/redo, de scratch disk, de multicouche et en particulier de couches d'effet ...... Donc oui c'est de la R&D, et de la lourde. En comparaison le passage 32->64 est de la rigolade et il n'y a qu'a voir le temps que adobe a mis a sortir cette version 64 )