SSE4

SSE4: Pour les articles homonymes, voir NNI.

SSE4 (pour Streaming SIMD Extensions version 4), aussi connu sous le nom de Nehalem New Instructions (NNI) est un jeu d’instructions supplémentaires pour l’architecture x86. Le jeu complet comprend 54 instructions.

L’annonce de ce nouveau jeu d’instruction fut faite le 27 septembre 2006 à l’Intel Developer Forum d’automne 2006. Ce jeu d’instruction devrait améliorer les performances multimédia, les algorithmes de recherche et de détection, la protection des données (checksum de type CRC) et la vectorisation.

Sommaire

1 Sous-ensembles SSE4

2 Nouvelles instructions

2.1 SSE4.1

3 Voir aussi

3.1 Articles connexes

3.2 Liens externes

3.3 Références

Sous-ensembles SSE4

Le jeu d’instruction SSE4 est constitué de trois sous-ensembles. Deux sont particuliers aux processeurs Intel, et un aux processeurs AMD :

Le sous-ensemble SSE4.1, introduit dans la micro architecture Penryn, qui comprend 47 instructions.

Le sous-ensemble SSE4.2, introduit dans la micro architecture Intel Nehalem, qui comprend 7 instructions.

Le sous-ensemble SSE4a qui comprend 4 instructions.

Les jeux SSE4.x et le jeu SSE4a sont exclusifs. Ainsi, le sous ensemble SSE4a n’est disponible que pour les processeurs AMD, ces derniers ne mettant pas en œuvre les sous ensembles Intel (SSE4.1 et SSE4.2). Les processeurs Intel, quant à eux, ne mettent pas en œuvre le jeu SSE4a.

Nouvelles instructions

À la différence des précédentes implémentations des jeux SSE, le jeu SSE4 présente des instructions n’étant pas spécifiquement dédiées aux applications multimédia.

Ce jeu voit la réapparition d’un opérande implicite pour certaines instructions (cet opérande étant le registre XMM0 en tant que troisième opérande) et la disparition de l’utilisation des opérandes 64 bits (registres MMX) au profit d’opérandes uniquement 128 bits, c’est-à-dire une utilisation exclusive des registres XMM.

Beaucoup de ces instructions profitent d’un atout majeur des architectures Penryn et Nehalem, à savoir le moteur de permutation à un seul cycle (single-cycle shuffle engine).

L’instruction cpuid permet de déterminer si le processeur supporte les instructions.

SSE4.1

Instruction Description

MPSADBW Calcule 8 sommes de différences absolues ( |x₀-y₀|+|x₁-y₁|+|x₂-y₂|+|x₃-y₃|, |x₀-y₁|+|x₁-y₂|+|x₂-y₃|+|x₃-y₄|, ...); Cette opération est extrêmement importante pour les codecs modernes HDTV^[1] et permet de calculer un bloc de différence de 8×8 en moins de 7 cycles. Un bit d’un opérande immédiat de 3 bits indique si y₀ .. y₁₁ ou y₄ .. y₁₅ doit être utilisé depuis l’opérande destination, les deux autres si x₀..x₃, x₄..x₇, x₈..x₁₁ ou x₁₂..x₁₅ doit être utilisé depuis l’opérande source.

PHMINPOSUW Trouve le plus petit mot (16 bits) non signé de l’opérande source et place le résultat dans l’opérande destination (16 bits de poids faible). L’index du mot trouvé dans l’opérande source est placé dans le second mot de l’opérande destination aux bits 16 à 18. Les bits restants de l’opérande destination sont mis à zéro.

PMULDQ Effectue deux multiplications signées de deux paires d’entiers (32 bits) et sauve le résultat (deux produits de 64 bits) dans l’opérande de destination.

PMULLD Effectue une multiplication sur des nombres signés et packés : 4 entiers signés de 32 bits (opérande source) multipliés par 4 entiers signés de 32 bits (opérande destination). Le résultat est placé dans la destination.

DPPS, DPPD Effectue un produit scalaire conditionnel entre deux opérandes de 128 bits. La condition est donnée par un troisième opérande de type immédiat. Le produit est en simple précision pour DPPS et en double pour DPPD.

BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDW Effectue une copie conditionnelle d’un registre XMM vers un autre. La copie est basée soit sur un masque binaire donné par un opérande immédiat (mnémoniques sans le 'v' dans le nom) soit sur un masque binaire donné par le registre XMM0 (mnémoniques avec 'v').

PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINSD, PMAXSD Trouve le minimum ou maximum pour différents types d’opérandes entiers et packés.

ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD Arrondis les valeurs d’un registre à virgule flottante en entiers en utilisant un des quatre modes d’arrondi spécifié par un opérande immédiat.

INSERTPS, PINSRB, PINSRD/PINSRQ, EXTRACTPS, PEXTRB, PEXTRW, PEXTRD/PEXTRQ Extraction et insertion. L’extraction consiste à prendre une partie d’un registre XMM pour la mettre en mémoire, tandis que l’insertion consiste à prendre un contenu mémoire et l’insérer dans un registre XMM.

PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ Extension de signe ou extension à zéro pour des nombres packés vers un type plus grand (correspond peu ou prou à MOVSX ou MOVZX sur l’unité générale).

PTEST Même chose que l’instruction générale TEST, c’est-à-dire qu’elle change les drapeaux ZF et CF de RFLAGS en opérant une conjonction logique (AND) entre les opérandes. L’instruction arme le drapeau ZF si au moins un des bits est armé (résultat du AND), et le drapeau CF si tous les bits correspondent.

PCMPEQQ Compare des quadruples mots (QWORDs - 64 bits) en les testant pour une égalité.

PACKUSDW Convertit des doubles mots (DWORDs - 32 bits) signés en mots (WORDs - 16 bits) non signés avec saturation.

MOVNTDQA Déplace un double quadruple mot (DQWORD - 128 bits) de la mémoire vers un registre XMM en utilisant un non temporal hint. L’opération n’est effectuée que si la mémoire est de type WC (Write Combining). Cette instruction est par exemple utile pour retrouver un résultat depuis des périphériques attachés au bus mémoire.

Voir aussi

Articles connexes

SSE

SSE2

SSE3

SSSE3

SSE5

AVX

Liens externes

(en) Papier d’Intel décrivant en détail le jeu SSE4 [PDF]

Références

↑ (en) Motion Estimation with Intel Streaming SIMD Extensions 4 (Intel SSE4), Intel.

Portail de l’électricité et de l’électronique

Portail de l’informatique

Catégories :
Jeu d'instruction x86
SIMD
Sigle de 4 caractères

Instruction	Description
MPSADBW	Calcule 8 sommes de différences absolues ( \|x₀-y₀\|+\|x₁-y₁\|+\|x₂-y₂\|+\|x₃-y₃\|, \|x₀-y₁\|+\|x₁-y₂\|+\|x₂-y₃\|+\|x₃-y₄\|, ...); Cette opération est extrêmement importante pour les codecs modernes HDTV^[1] et permet de calculer un bloc de différence de 8×8 en moins de 7 cycles. Un bit d’un opérande immédiat de 3 bits indique si y₀ .. y₁₁ ou y₄ .. y₁₅ doit être utilisé depuis l’opérande destination, les deux autres si x₀..x₃, x₄..x₇, x₈..x₁₁ ou x₁₂..x₁₅ doit être utilisé depuis l’opérande source.
PHMINPOSUW	Trouve le plus petit mot (16 bits) non signé de l’opérande source et place le résultat dans l’opérande destination (16 bits de poids faible). L’index du mot trouvé dans l’opérande source est placé dans le second mot de l’opérande destination aux bits 16 à 18. Les bits restants de l’opérande destination sont mis à zéro.
PMULDQ	Effectue deux multiplications signées de deux paires d’entiers (32 bits) et sauve le résultat (deux produits de 64 bits) dans l’opérande de destination.
PMULLD	Effectue une multiplication sur des nombres signés et packés : 4 entiers signés de 32 bits (opérande source) multipliés par 4 entiers signés de 32 bits (opérande destination). Le résultat est placé dans la destination.
DPPS, DPPD	Effectue un produit scalaire conditionnel entre deux opérandes de 128 bits. La condition est donnée par un troisième opérande de type immédiat. Le produit est en simple précision pour DPPS et en double pour DPPD.
BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDW	Effectue une copie conditionnelle d’un registre XMM vers un autre. La copie est basée soit sur un masque binaire donné par un opérande immédiat (mnémoniques sans le 'v' dans le nom) soit sur un masque binaire donné par le registre XMM0 (mnémoniques avec 'v').
PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINSD, PMAXSD	Trouve le minimum ou maximum pour différents types d’opérandes entiers et packés.
ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD	Arrondis les valeurs d’un registre à virgule flottante en entiers en utilisant un des quatre modes d’arrondi spécifié par un opérande immédiat.
INSERTPS, PINSRB, PINSRD/PINSRQ, EXTRACTPS, PEXTRB, PEXTRW, PEXTRD/PEXTRQ	Extraction et insertion. L’extraction consiste à prendre une partie d’un registre XMM pour la mettre en mémoire, tandis que l’insertion consiste à prendre un contenu mémoire et l’insérer dans un registre XMM.
PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ	Extension de signe ou extension à zéro pour des nombres packés vers un type plus grand (correspond peu ou prou à MOVSX ou MOVZX sur l’unité générale).
PTEST	Même chose que l’instruction générale TEST, c’est-à-dire qu’elle change les drapeaux ZF et CF de RFLAGS en opérant une conjonction logique (AND) entre les opérandes. L’instruction arme le drapeau ZF si au moins un des bits est armé (résultat du AND), et le drapeau CF si tous les bits correspondent.
PCMPEQQ	Compare des quadruples mots (QWORDs - 64 bits) en les testant pour une égalité.
PACKUSDW	Convertit des doubles mots (DWORDs - 32 bits) signés en mots (WORDs - 16 bits) non signés avec saturation.
MOVNTDQA	Déplace un double quadruple mot (DQWORD - 128 bits) de la mémoire vers un registre XMM en utilisant un non temporal hint. L’opération n’est effectuée que si la mémoire est de type WC (Write Combining). Cette instruction est par exemple utile pour retrouver un résultat depuis des périphériques attachés au bus mémoire.

Contenu soumis à la licence CC-BY-SA. Source : Article SSE4 de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

SSE4 — SSE4 новый набор команд микроархитектуры Intel Core, впервые реализованный в процессорах серии Penryn (не следует путать с SSE4A от AMD)[1]. Он был анонсирован 27 сентября 2006 года, однако детальное описание стало доступно только весной… … Википедия
SSE4.1 — SSE4 это новый набор команд Intel Core микроархитектуры, впервые реализованный в процессорах серии Penryn (не следует путать с SSE4A от AMD). Он был анонсирован 27 Сентября 2006, однако детальное описание стало доступно только весной 2007, свежее … Википедия
SSE4.2 — SSE4 это новый набор команд Intel Core микроархитектуры, впервые реализованный в процессорах серии Penryn (не следует путать с SSE4A от AMD). Он был анонсирован 27 Сентября 2006, однако детальное описание стало доступно только весной 2007, свежее … Википедия
SSE4.1 — SSE4 Pour les articles homonymes, voir NNI. SSE4 (pour Streaming SIMD Extensions version 4), aussi connu sous le nom de Nehalem New Instructions (NNI) est un jeu d instructions supplémentaires pour l architecture x86. Le jeu complet comprend 54… … Wikipédia en Français
SSE4 — is an instruction set used in the Intel Core microarchitecture and AMD K10 (K8L). It was announced on September 27, 2006 at the Fall 2006 Intel Developer Forum, with vague details in a white paper; [ [http://www.intel.com/technology/architecture… … Wikipedia
SSE4 — In diesem Artikel oder Abschnitt fehlen folgende wichtige Informationen: Was macht SSE 4.2 genau? Vektorisierung ist zu allgemein: was bringt sse4 für Vorteile gegenüber den Vorgängern? Du kannst Wikipedia helfen, indem du sie recherchierst und … Deutsch Wikipedia
SSE4.1 — In diesem Artikel oder Abschnitt fehlen folgende wichtige Informationen: Was macht SSE 4.2 genau? Vektorisierung ist zu allgemein: was bringt sse4 für Vorteile gegenüber den Vorgängern? Du kannst Wikipedia helfen, indem du sie recherchierst und … Deutsch Wikipedia
SSE4.2 — In diesem Artikel oder Abschnitt fehlen folgende wichtige Informationen: Was macht SSE 4.2 genau? Vektorisierung ist zu allgemein: was bringt sse4 für Vorteile gegenüber den Vorgängern? Du kannst Wikipedia helfen, indem du sie recherchierst und … Deutsch Wikipedia
Nehalem New Instructions — SSE4 Pour les articles homonymes, voir NNI. SSE4 (pour Streaming SIMD Extensions version 4), aussi connu sous le nom de Nehalem New Instructions (NNI) est un jeu d instructions supplémentaires pour l architecture x86. Le jeu complet comprend 54… … Wikipédia en Français
SSE-4 — SSE4 Pour les articles homonymes, voir NNI. SSE4 (pour Streaming SIMD Extensions version 4), aussi connu sous le nom de Nehalem New Instructions (NNI) est un jeu d instructions supplémentaires pour l architecture x86. Le jeu complet comprend 54… … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

SSE4

Sommaire

Sous-ensembles SSE4

Nouvelles instructions

SSE4.1

Voir aussi

Articles connexes

Liens externes

Références

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

SSE4

Sommaire

Sous-ensembles SSE4

Nouvelles instructions

SSE4.1

Voir aussi

Articles connexes

Liens externes

Références

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link