CPCRULEZ > AMSTRAD CPC >

★ CODING ★ Apprendre pas à pas la programmation en assembleur Z80 par Roudoudou ★ Programmation avancée, routines utiles ★

Optimisations en vrac
Astuces en vrac d'optimisation de code assembleur Z80
Plutôt que
ld a,0 ; + lent mais ne change pas les flags!
Écrivez ceci
xor a ; 1 octet de moins, 1 nop de moins (change les flags!)
Plutôt que
sla a ; A = A x 2
sla h
rl l ; HL = HL x 2
Écrivez ceci
add a ; A = A x 2
add hl,hl ; HL = HL x 2
Plutôt que
ld b,10
ld c,50
Écrivez ceci
ld bc,(10<<8)|50 ; 1 octet de moins, 1 nop de moins
Plutôt que
ld a,#DD
ld (hl),a
Écrivez directement ceci
ld (hl),#DD ; 1 octet de moins, 1 nop de moins
Plutôt que
ld a,(variable)
inc a
ld (variable),a ; total de 7 octets et 9 nops
Écrivez ceci (vous pouvez même supprimer la dernière ligne si vous n'avez pas besoin de HL ensuite, c'est encore plus rapide)
ld hl,variable
inc (hl)
ld a,(hl) ; total de 5 octets et 8 nops
Plutôt que
ld a,(hl)
ld (de),a
inc hl
inc de ; total de 4 octets et 8 nops
Écrivez ceci
ldi
inc bc ; total de 3 octets et 7 nops
Plutôt que
cp 0
Écrivez ceci
or a
Plutôt que
neg
add valeur
Écrivez ceci
cpl
add valeur+1
Plutôt que
ld a,b
neg
Écrivez ceci
xor a
sub b
Plutôt que
cp valeur
jr c,label
jr z,label ; note: c'est bien deux fois le même label utilisé
Écrivez ceci
cp valeur+1
jr c,label
Plutôt que
call routine
ret
Écrivez ceci
jp routine
Plutôt que
or a : jp z,A_vaut_zero
cp 1 : jp z,A_vaut_un
cp 2 : jp z,A_vaut_deux
...
Écrivez ceci (pour beaucoup de valeurs, utilisez une lookup table)
or a : jp z,A_vaut_zero
dec a : jp z,A_vaut_un
dec a : jp z,A_vaut_deux
...
Avec une lookup
add a
ld (recupSaut+1),a
recupSaut ld hl,(table_de_sauts)
jp (hl)
align 256
table_de_sauts ; table alignée sur 256 octets
defw saut1,saut2,saut3,saut4,saut5,saut6
...
Par extension si on ne part pas de zéro...
Plutôt que
cp 40 : jp z,A_vaut_40
cp 41 : jp z,A_vaut_41
cp 42 : jp z,A_vaut_42
...
Écrivez ceci (pour beaucoup de valeurs, utilisez une lookup table)
sub 40 : jp z,A_vaut_40
dec a : jp z,A_vaut_41
dec a : jp z,A_vaut_42
...
Avec une lookup
sub 40 ; ou alors remplir le début de la table avec 40 sauts factices
add a
ld (recupSaut+1),a
recupSaut ld hl,(table_de_sauts)
jp (hl)
align 256
table_de_sauts ; table alignée sur 256 octets
defw saut1,saut2,saut3,saut4,saut5,saut6
...
Plutôt que
dec bc
ld a,b
or c
ret z ; ou autre saut conditionnel sur zéro
Écrivez ceci
cpi ; incrémentation de HL au passage
ret po
Plutôt que
cp 1
Écrivez ceci
dec a
Plutôt que
bit 0,a
jr z,label
Écrivez ceci
rra
jr nc,label
Plutôt que
bit 7,a
jr z,label
Écrivez ceci
rla
jr nc,label
Plutôt que
ld l,(hl) ; multiplication par 64 d'une valeur
ld h,0 ; pointée par HL
add hl,hl
add hl,hl
add hl,hl
add hl,hl
add hl,hl
add hl,hl
Écrivez ceci
ld h,(hl) ; récupérer dans le poids fort
ld l,0 ; pour multiplier par 256
srl hl
srl hl ; voir chapitre des supers instructions ;)
Pour les grosses copies mémoire, plutôt que
ldir
Écrivez cette fonction
FastLDIR ; thanks grauw
xor a
sub c
and 15
add a
ld (.automod+1),a
.automod jr nz,$ ; code automodifié
.loop
repeat 16 : ldi : rend
jp pe,.loop
Plutôt qu'un LDIR
ldir
Cette version précalcule le saut à la compilation pour être encore plus rapide mais ne traite pas les longueurs dynamiques
repeat 64,x
ldi64_sub{64-x} ldi
rend
jp pe,ldi64
ret
macro ultraFastLDIR longueur
lngmod=longueur%64
ld bc,{longueur}
call ldi64_sub{lngmod}
mend
Évitez de soustraire quand c'est possible
ld de,2000
xor a ; obligé de mettre la carry à zéro!
sbc hl,de
Écrivez ceci
ld de,-2000
add hl,de
Roudoudou
★ ANNÉE: 2025
★ AUTEUR: Roudoudou
Je participe au site:

» Vous avez remarqué une erreur dans ce texte ?
» Aidez-nous à améliorer cette page : en nous contactant via le forum ou par email.
CPCrulez[Content Management System] v8.74-desktop/c
Page créée en 291 millisecondes et consultée 189 fois
L'Amstrad CPC est une machine 8 bits à base d'un Z80 à 4MHz. Le premier de la gamme fut le CPC 464 en 1984, équipé d'un lecteur de cassettes intégré il se plaçait en concurrent du Commodore C64 beaucoup plus compliqué à utiliser et plus cher. Ce fut un réel succès et sorti cette même années le CPC 664 équipé d'un lecteur de disquettes trois pouces intégré. Sa vie fut de courte durée puisqu'en 1985 il fut remplacé par le CPC 6128 qui était plus compact, plus soigné et surtout qui avait 128Ko de RAM au lieu de 64Ko.

Astuces en vrac d'optimisation de code assembleur Z80Plutôt que

ld a,0 ; + lent mais ne change pas les flags!

xor a ; 1 octet de moins, 1 nop de moins (change les flags!)

sla a ; A = A x 2sla hrl l ; HL = HL x 2

add a ; A = A x 2add hl,hl ; HL = HL x 2

ld b,10ld c,50

ld bc,(10<<8)|50 ; 1 octet de moins, 1 nop de moins

ld a,#DDld (hl),a

ld (hl),#DD ; 1 octet de moins, 1 nop de moins

ld a,(variable)inc ald (variable),a ; total de 7 octets et 9 nops

ld hl,variableinc (hl)ld a,(hl) ; total de 5 octets et 8 nops

ld a,(hl)ld (de),ainc hlinc de ; total de 4 octets et 8 nops

ldiinc bc ; total de 3 octets et 7 nops

cp 0

or a

negadd valeur

cpladd valeur+1

ld a,bneg

xor asub b

cp valeurjr c,labeljr z,label ; note: c'est bien deux fois le même label utilisé

cp valeur+1jr c,label

call routineret

jp routine

or a : jp z,A_vaut_zerocp 1 : jp z,A_vaut_uncp 2 : jp z,A_vaut_deux...

or a : jp z,A_vaut_zerodec a : jp z,A_vaut_undec a : jp z,A_vaut_deux...

add ald (recupSaut+1),arecupSaut ld hl,(table_de_sauts)jp (hl)align 256table_de_sauts ; table alignée sur 256 octetsdefw saut1,saut2,saut3,saut4,saut5,saut6...

cp 40 : jp z,A_vaut_40cp 41 : jp z,A_vaut_41cp 42 : jp z,A_vaut_42...

sub 40 : jp z,A_vaut_40dec a : jp z,A_vaut_41dec a : jp z,A_vaut_42...

sub 40 ; ou alors remplir le début de la table avec 40 sauts facticesadd ald (recupSaut+1),arecupSaut ld hl,(table_de_sauts)jp (hl)align 256table_de_sauts ; table alignée sur 256 octetsdefw saut1,saut2,saut3,saut4,saut5,saut6...

dec bcld a,bor cret z ; ou autre saut conditionnel sur zéro

cpi ; incrémentation de HL au passageret po

cp 1

dec a

bit 0,ajr z,label

rrajr nc,label

bit 7,ajr z,label

rlajr nc,label

ld l,(hl) ; multiplication par 64 d'une valeurld h,0 ; pointée par HLadd hl,hladd hl,hladd hl,hladd hl,hladd hl,hladd hl,hl

ld h,(hl) ; récupérer dans le poids fortld l,0 ; pour multiplier par 256srl hlsrl hl ; voir chapitre des supers instructions ;)

ldir

FastLDIR ; thanks grauwxor asub cand 15add ald (.automod+1),a.automod jr nz,$ ; code automodifié.looprepeat 16 : ldi : rendjp pe,.loop

ldir

repeat 64,xldi64_sub{64-x} ldirendjp pe,ldi64retmacro ultraFastLDIR longueurlngmod=longueur%64ld bc,{longueur}call ldi64_sub{lngmod}mend

ld de,2000xor a ; obligé de mettre la carry à zéro!sbc hl,de

ld de,-2000add hl,de

Astuces en vrac d'optimisation de code assembleur Z80
Plutôt que

sla a ; A = A x 2
sla h
rl l ; HL = HL x 2

add a ; A = A x 2
add hl,hl ; HL = HL x 2

ld b,10
ld c,50

ld a,#DD
ld (hl),a

ld a,(variable)
inc a
ld (variable),a ; total de 7 octets et 9 nops

ld hl,variable
inc (hl)
ld a,(hl) ; total de 5 octets et 8 nops

ld a,(hl)
ld (de),a
inc hl
inc de ; total de 4 octets et 8 nops

ldi
inc bc ; total de 3 octets et 7 nops

neg
add valeur

cpl
add valeur+1

ld a,b
neg

xor a
sub b

cp valeur
jr c,label
jr z,label ; note: c'est bien deux fois le même label utilisé

cp valeur+1
jr c,label

call routine
ret

or a : jp z,A_vaut_zero
cp 1 : jp z,A_vaut_un
cp 2 : jp z,A_vaut_deux
...

or a : jp z,A_vaut_zero
dec a : jp z,A_vaut_un
dec a : jp z,A_vaut_deux
...

add a
ld (recupSaut+1),a
recupSaut ld hl,(table_de_sauts)
jp (hl)
align 256
table_de_sauts ; table alignée sur 256 octets
defw saut1,saut2,saut3,saut4,saut5,saut6
...

cp 40 : jp z,A_vaut_40
cp 41 : jp z,A_vaut_41
cp 42 : jp z,A_vaut_42
...

sub 40 : jp z,A_vaut_40
dec a : jp z,A_vaut_41
dec a : jp z,A_vaut_42
...

sub 40 ; ou alors remplir le début de la table avec 40 sauts factices
add a
ld (recupSaut+1),a
recupSaut ld hl,(table_de_sauts)
jp (hl)
align 256
table_de_sauts ; table alignée sur 256 octets
defw saut1,saut2,saut3,saut4,saut5,saut6
...

dec bc
ld a,b
or c
ret z ; ou autre saut conditionnel sur zéro

cpi ; incrémentation de HL au passage
ret po

bit 0,a
jr z,label

rra
jr nc,label

bit 7,a
jr z,label

rla
jr nc,label

ld l,(hl) ; multiplication par 64 d'une valeur
ld h,0 ; pointée par HL
add hl,hl
add hl,hl
add hl,hl
add hl,hl
add hl,hl
add hl,hl

ld h,(hl) ; récupérer dans le poids fort
ld l,0 ; pour multiplier par 256
srl hl
srl hl ; voir chapitre des supers instructions ;)

FastLDIR ; thanks grauw
xor a
sub c
and 15
add a
ld (.automod+1),a
.automod jr nz,$ ; code automodifié
.loop
repeat 16 : ldi : rend
jp pe,.loop

repeat 64,x
ldi64_sub{64-x} ldi
rend
jp pe,ldi64
ret
macro ultraFastLDIR longueur
lngmod=longueur%64
ld bc,{longueur}
call ldi64_sub{lngmod}
mend

ld de,2000
xor a ; obligé de mettre la carry à zéro!
sbc hl,de

ld de,-2000
add hl,de