19 Aurale stylesheets

Inhoud

19.1 Introductie tot aurale stylesheets

De aurale weergave van een document, tegenwoordig algemeen gebruikt door de blinden en print-beperkte gemeenschappen, combineert spraak synthese en "auditory icons." Dergelijke aurale presentatie komt dikwijls voor bij omzetting van het document in plain tekst en bij doorsturen naar een screen reader -- software of hardware die eenvoudigweg alle karakters op het scherm leest. Dit resulteert in minder effectieve presentatie dan het geval zou zijn als de document structuur behouden werd. Stylesheet eigenschappen voor aurale presentatie kunnen samen gebruikt worden met visuele eigenschappen (gemengde media) of als een auraal alternatief voor visuele presentatie.

Naast de vanzelfsprekende toegankelijkheidsvoordelen, zijn er andere grote markten voor luisteren naar informatie, inclusief in-de-auto gebruik, industriële en medische documentatiesystemen (intranetten), home entertainment en om gebruikers te helpen leren of voor iemand die moeilijkheden heeft om te lezen.

Wanneer aurale eigenschappen gebruikt worden, bestaat de canvas uit een drie-dimensionale fysieke ruimte (geluidsomgeving) en een tijdelijke ruimte (men kan geluiden specificeren voor, tijdens en na andere geluiden). De CSS eigenschappen laten auteurs ook toe om de kwaliteit van gesyntheseerder spraak te variëren (stemtype, frequentie, inflectie, etc.).

H1, H2, H3, H4, H5, H6 {
    voice-family: paul;
    stress: 20;
    richness: 90;
    cue-before: url("ping.au")
}
P.heidi { azimuth: center-left }
P.peter { azimuth: right }
P.goat  { volume: x-soft }

Dit zal de spraaksynthesizer instructie geven om koppen in een stem (een soort "audio font") genoemd "paul", uit te spreken op een vlakke toon, maar in een zeer rijke stem. Voor de koppen uitgesproken worden zal een geluidssample gespeeld worden waarvan de URL gegeven is. Alinea's met class "heidi" zullen overkomen alsof ze van linksvooraan komen (als het geluidssysteem in staat is om geluiden ruimtelijk weer te geven) en alinea's met class "peter" lijken van rechts te komen. Alinea's met class "goat" zullen zeer zacht zijn.

19.2 Volume eigenschappen: 'volume'

'volume'

Waarde:	<number> \| <percentage> \| silent \| x-soft \| soft \| medium \| loud \| x-loud \| inherit
Startwaarde:	medium
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	verwijst naar geëfde waarde
Media:	aural

Volume verwijst naar het gemiddelde volume van de golfvorm. In andere woorden, een hoge stem op een volume van 50 kan gerust hierboven uitkomen. De waarden zijn waarschijnlijk aan te passen door de mens voor comfort, bijvoorbeeld met een fysieke volume regelaar (welke zowel de 0 als 100 waarden proportioneel zou verhogen); wat deze eigenschap doet is het aanpassen van het dynamische bereik.

Waarden hebben de volgende betekenissen:

<number>: Elk getal tussen '0' en '100'. '0' komt overeen met het minimum hoorbare volume niveau en '100' komt overeen met het maximum comfortabele niveau.
<percentage>: Percentage waarden worden berekend relatief ten opzichte van de geërfde waarde en worden dan geclipped op het bereik '0' tot '100'.
silent: Geen geluid. De waarde '0' betekent niet hetzelfde als 'silent'.
x-soft: Zelfde als '0'.
soft: Zelfde als '25'.
medium: Zelfde als '50'.
loud: Zelfde als '75'.
x-loud: Zelfde als '100'.

User agents zouden moeten toelaten dat de waarden overeenkomend met '0' en '100' ingesteld worden door de luisteraar. Geen enkele instelling is universeel toepasbaar; geschikte waarden hangen af van de uitrusting die gebruikt wordt (speakers, headphones), de omgeving (in de auto, home theater, bibliotheek) en persoonlijke voorkeur. Enkele voorbeelden:

Een browser voor in-de-auto gebruik heeft een instelling voor de situatie waar er veel achtergrondlawaai is. '0' zou moeten overeenkomen met een redelijk hoog niveau en '100' tot een behoorlijk hoog niveau. De spraak is eenvoudig hoorbaar boven het weglawaai maar het overall dynamischbereik is beperkt. Auto's met betere isolatie kunnen een breder dynamisch bereik toelaten.
Een andere spraakbrowser wordt laat op de avond gebruikt in een apartement, of in een gedeelde studeerkamer. '0' wordt ingesteld op een zeer stil niveau en '100' ook op een behoorlijk stil niveau. Zoals bij het eerste voorbeeld is er een lage helling; het dynamisch bereik wordt beperkt. De eigenlijke volumes worden hier laag, waar ze hoog waren in het eerste voorbeeld.
In een stille en geïsoleerd huis, wordt een duur hi-fi home theater opgesteld. '0' is ingesteld als behoorlijk laag en '100' op redelijk hoog; er is een breed dynamisch bereik.

Hetzelfde auteur-stylesheet zou kunnen gebruikt worden in alle gevallen, door de '0' en '100' punten eenvoudig geschikt te mappen aan de client side.

19.3 Speaking eigenschappen: 'speak'

'speak'

Waarde:	normal \| none \| spell-out \| inherit
Startwaarde:	normal
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Deze eigenschap specificeert of tekst auraal weergegeven wordt en als dit het geval is, op welke manier (ongeveer analoog aan de 'display' eigenschap). De mogelijke waarden zijn:

none: Onderdrukt aurale weergave zodat het element geen tijd vereist om weer te geven. Merk echter op dat nakomelingen deze waarde kunnen overriden en uitgesproken zullen worden. (Om er zeker van te zijn dat weergave van een element en zijn nakomelingen onderdrukt wordt, wordt beste de de 'display' eigenschap gebruikt).
normal: Gebruikt taal-afhankelijke uitspraakregels voor weergave van een element en de kinderen ervan.
spell-out: Spelt de tekst letter per letter (bruikbaar voor acronymen en afkortingen).

Merk het verschil op tussen een element waarvan de 'volume' eigenschap de waarde 'silent' heeft en een element waarvan de 'speak' eigenschep de waarde 'none' heeft. Het eerste neemt even veel tijd in beslag alsof het uitgeproken werd, inclusief elke pause voor en achter het element, maar er wordt geen geluid gegenereerd. Het tweede vereist geen tijd en wordt niet weergegeven (hoewel de nakomelingen ervan wel weergegeven kunnen worden).

19.4 Pause eigenschappen: 'pause-before', 'pause-after' en 'pause'

'pause-before'

Waarde:	<time> \| <percentage> \| inherit
Startwaarde:	hangt af van user agent
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	zie tekst
Media:	aural

'pause-after'

Waarde:	<time> \| <percentage> \| inherit
Startwaarde:	hangt af van user agent
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	zie tekst
Media:	aural

Deze eigenscheppen specificeren een pause die waargenomen kan worden voor (of na) het uitspreken van de inhoud van een element. Waarden hebben de volgende betekenissen:

<time>: Drukt de pause in absolute tijdseenheden (seconden en milliseconden).
<percentage>: Verwijst naar het omgekeerde van de waarde van de 'speech-rate' eigenschap. Als bijvoorbeeld de speech-rate 120 woorden per minuut is (hetgeen wil zeggen dat een woord een halve seconde of 500ms in beslag neemt) dan betekent een 'pause-before' van 100% een pauze van 500ms en een 'pause-before' van 20% betekent 100ms.

De pause wordt ingevoegd tussen de inhoud van het element en elke 'cue-before' of 'cue-after' inhoud.

Auteurs zouden relatieve eenheden moeten gebruiken om meer robuste stylesheets te maken met het vooruitzicht van grote wijzigingen in speech-rate.

'pause'

Waarde:	[ [<time> \| <percentage>]{1,2} ] \| inherit
Startwaarde:	hangt af van user agent
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	zie omschrijving van 'pause-before' en 'pause-after'
Media:	aural

De 'pause' eigenschap is een afkorting voor het instellen van 'pause-before' en 'pause-after'. Als twee waarden gegeven worden, is de eerste waarde 'pause-before' en de tweede is 'pause-after'. Als enkel één waarde gegeven is, geldt het voor beide eigenschappen.

H1 { pause: 20ms } /* pause-before: 20ms; pause-after: 20ms */
H2 { pause: 30ms 40ms } /* pause-before: 30ms; pause-after: 40ms */
H3 { pause-after: 10ms } /* pause-before: ?; pause-after: 10ms */

19.5 Cue eigenschappen: 'cue-before', 'cue-after' en 'cue'

'cue-before'

Waarde:	<uri> \| none \| inherit
Startwaarde:	none
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	N/A
Media:	aural

'cue-after'

Waarde:	<uri> \| none \| inherit
Startwaarde:	none
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	N/A
Media:	aural

Hoorbare iconen zijn een andere manier om semantische elementen te onderscheiden. Geluiden kunnen afgespeeld worden voor en/of na het element om het af te bakenen. Waarden hebben de volgende betekenissen:

<uri>: De URI moet een hoorbare icon bron toewijzen. Als de URI naar iets anders wijst dan een audio bestand, zoals een figuur, moet de bron genegeerd worden en behandeld worden alsof het de waarde 'none' had.
none: Geen hoorbaar icon wordt gespecificeerd.

A {cue-before: url("bell.aiff"); cue-after: url("dong.wav") }
H1 {cue-before: url("pop.au"); cue-after: url("pop.au") }

'cue'

Waarde:	[ <'cue-before'> \|\| <'cue-after'> ] \| inherit
Startwaarde:	niet gedefinieerd voor verkorte eigenschappen
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	N/A
Media:	aural

De 'cue' eigenschap is een verkorting voor het instellen van 'cue-before' en 'cue-after'. Als twee waarden gegeven zijn, is de eerste waarde 'cue-before' en de tweede 'cue-after'. Als enkel één waarden gegeven is, geldt het voor beide eigenschappen.

De volgende twee regels zijn equivalent:

H1 {cue-before: url("pop.au"); cue-after: url("pop.au") }
H1 {cue: url("pop.au") }

Als een user agent een hoorbaar icon niet kan weergeven (bijvoorbeeld wanneer de gebruikersomgeving het niet toelaat), raden we aan om een alternatieve cue te produceren (bijvoorbeeld het tonen van een waarschuwing, een waarschuwingsgeluid, enz.)

Raadpleeg de delen over de :before en :after pseudo-elementen voor informatie over andere inhoudsgeneratietechnieken.

19.6 Mixing eigenschappen: 'play-during'

'play-during'

Waarde:	<uri> mix? repeat? \| auto \| none \| inherit
Startwaarde:	auto
Van toepassing op:	alle elementen
Geërfd:	nee
Percentages:	N/A
Media:	aural

Vergelijkbaar met de 'cue-before' en 'cue-after' eigenschappen, specificeert deze eigenschap een geluid dat afgespeeld moet worden als een achtergrond terwijl de inhoud van een element element uitgesproken wordt. Waarden hebben de volgende betekenissen:

<uri>: Het geluid toegewezen bij deze <uri> wordt afgespeeld als een achtergrond terwijl de inhoud van het element uitgesproken wordt.
mix: Indien aanwezig, betekent dit sleutelwoord dat het geluid dat geërfd wordt van de 'play-during' eigenschap van het ouderelement verder blijft spelen en het geluid toegewezen door de <uri> wordt ermee gemixed. Als 'mix' niet gespecificeerd wordt, vervangt het achtergrondgeluid van het element het geluid van de ouder.
repeat: Indien aanwezig, betekent dit sleutelwoord dat het geluid blijft herhalen als het te kort is om de hele duur van het element te vullen. In het andere geval speelt het geluid slechts één keer en stopt dan. Dit is vergelijkbaar met de 'background-repeat' eigenschap. Als het geluid te lang is voor het element, wordt het geclipt zodra het element uitgesproken is.
auto: Het geluid van het ouderelement gaat verder met spelen (het wordt niet opnieuw gestart, wat wel het geval zou zijn als deze eigenschap geërfd wordt).
none: Dit sleutelwoord betekent dat er een stilte is. Het geluid van de ouderelement (als aanwezig) is stil gedurende het huidige element en gaat verder na het huidige element.

BLOCKQUOTE.sad { play-during: url("violins.aiff") }
BLOCKQUOTE Q   { play-during: url("harp.wav") mix }
SPAN.quiet     { play-during: none }

19.7 Ruimtelijke eigenschappen: 'azimuth' en 'elevation'

Ruimtelijk geluid is een belangrijke stylistische eigenschap voor aurale weergave. Het biedt een natuurlijke manier om verschillende stemmen van elkaar te onderscheiden, zoals in real life (mensen staan zelden allemaal op dezelfde plaats in een kamer). Stereo luidsprekers produceren een lateraal geluidsniveau. Binaurale hoofdtelefoons of de populairder wordende 5-luidspreker home theater opstellingen kunnen volledig surround sound genereren en multi-luidspreker opstellingen kunnen een waarheidsgetrouw 3D geluidsniveau weergeven. VRML 2.0 biedt ook ruimtelijk geluid, wat impliceert dat in afzienbare tijd consument-geprijsde ruimtelijke audio hardware meer beschikbaar zal worden.

'azimuth'

Waarde:	<angle> \| [[ left-side \| far-left \| left \| center-left \| center \| center-right \| right \| far-right \| right-side ] \|\| behind ] \| leftwards \| rightwards \| inherit
Startwaarde:	center
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Waarden hebben de volgende betekenissen:

<angle>: Positie wordt omschreven in een hoek binnen het bereik '-360deg' tot '360deg'. De waarde '0deg' betekent recht vooruit in het midden van de geluidsbron. '90deg' is naar rechts, '180deg' achteraan en '270deg' (of gelijk en eenvoudiger '-90deg') naar links.
left-side: Zelfde als '270deg'. Met 'behind', '270deg'.
far-left: Zelfde als '300deg'. Met 'behind', '240deg'.
left: Zelfde als '320deg'. Met 'behind', '220deg'.
center-left: Zelfde als '340deg'. Met 'behind', '200deg'.
center: Zelfde als '0deg'. Met 'behind', '180deg'.
center-right: Zelfde als '20deg'. Met 'behind', '160deg'.
right: Zelfde als '40deg'. Met 'behind', '140deg'.
far-right: Zelfde als '60deg'. Met 'behind', '120deg'.
right-side: Zelfde als '90deg'. Met 'behind', '90deg'.
leftwards: Beweegt het geluid naar links, relatief tot de huidige hoek. Preciezer, trekt 20 graden af. De berekening wordt uitgevoerd modulo 360 graden. Merk op dat 'leftwards' nauwkeuriger omschreven is dan "turned counter-clockwise," omdat het altijd 20 graden aftrekt, zelfs als de geërfde azimuth al achter de luisteraar staat (in welk geval het geluid eigenlijk naar rechts lijkt te gaan).
rightwards: Beweegt het geluid naar rechts, relatief tot de huidige hoek. Preciezer, telt 20 graden bij. Zie 'leftwards' voor de berekeningswijze.

Deze eigenschap wordt meestal geïmplementeerd door mixen van hetzelfde signaal in verschillende kanalen op verschillende volumes. Het mag eventueel ook faseverschuiving, digitale delay en andere vergelijkbare technieken gebruiken om de illusie van een geluidsbron na te bootsen. De exacte methode die gebruikt wordt om dit effect te bekomen en het aantal luidsprekers dat dat gebruikt wordt zijn afhankelijk van de user agent; deze eigenschap identificeert enkel het gewenste eindresultaat.

H1   { azimuth: 30deg }
TD.a { azimuth: far-right }          /*  60 graden */
#12  { azimuth: behind far-right }   /* 120 graden */
P.comment { azimuth: behind }        /* 180 graden */

Als ruimtelijke-azimuth gespecificeerd wordt en het uitvoerapparaat kan de geluiden achter de luisterpositie niet genereren, zouden user agenten de waarden in het achterwaardse luistergebied moeten converteren naar waarden voor het voorwaartse luistergebied. Een methode is als volgt:

if 90deg < x <= 180deg then x := 180deg - x
if 180deg < x <= 270deg then x := 540deg - x

'elevation'

Waarde:	<angle> \| below \| level \| above \| higher \| lower \| inherit
Startwaarde:	level
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Waarden voor deze eigenschap hebben de volgende betekenissen:

<angle>: Specificeert de hoogte als een hoek tussen '-90deg' en '90deg'. '0deg' betekent een voorwaartse horizon, welke los betekent op het niveau van de luisteraar. '90deg' betekent recht boven en '-90deg' betekent recht onder.
below: Zelfde als '-90deg'.
level: Zelfde als '0deg'.
above: Zelfde als '90deg'.
higher: Voegt 10 graden toe aan de huidige hoogte.
lower: Trekt 10 graden af van de huidige hoogte.

De precieze manier die gebruikt wordt om dit effect te bekomen en het aantal luidsprekers gebruikt om dit te doen zijn ongedefinieerd. Deze eigenschap identificeert enkel het gewenste resultaat.

H1   { elevation: above }
TR.a { elevation: 60deg }
TR.b { elevation: 30deg }
TR.c { elevation: level }

19.8 Stemkarakteristieke eigenschappen: 'speech-rate', 'voice-family', 'pitch', 'pitch-range', 'stress' en 'richness'

'speech-rate'

Waarde:	<number> \| x-slow \| slow \| medium \| fast \| x-fast \| faster \| slower \| inherit
Startwaarde:	medium
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Deze eigenschap specificeert het spraaksnelheid. Merk opdat zowel absolute als relatieve sleutelwoordwaarden toegestaan zijn (vergelijk met 'font-size'). Waarden hebben de volgende betekenissen:

<number>: Specificeert de uitspreeksnelheid in woorden per minuut, een aantal dat licht varieert per taal maar dat evenzeer goed verspreid is door spraaksynthesizers.
x-slow: Zelfde als 80 woorden per minuut.
slow: Zelfde als 120 woorden per minuut.
medium: Zelfde als 180 - 200 woorden per minuut.
fast: Zelfde als 300 woorden per minuut.
x-fast: Zelfde als 500 woorden per minuut.
faster: Voegt 40 woorden per minuut toe aan de huidige uitspreeksnelheid.
slower: Trekt 40 woorden per minuut af van de huidige uitspreeksnelheid.

'voice-family'

Waarde:	[[<specific-voice> \| <generic-voice> ],]* [<specific-voice> \| <generic-voice> ] \| inherit
Startwaarde:	hangt af van de user agent
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

De waarde is een door komma's gescheiden, geprioritiseerde lijst van stemfamilienamen (vergelijk met 'font-family'). Waarden hebben de volgende betekenissen:

<generic-voice>: Waarden zijn stemfamilies. Mogelijke waarden zijn 'male', 'female' en 'child'.
<specific-voice>: Waarden zijn specifieke gevallen (zoals komiek, trinoids, carlos, lani).

H1 { voice-family: announcer, male }
P.part.romeo  { voice-family: romeo, male }
P.part.juliet { voice-family: juliet, female }

Namen van specifiek stemmen mogen tussen aanhalingstekens staan en moeten tussen aanhalingstekens staan als één van de woorden die de naam vormen niet voldoet aan de syntaxregels voor identificatoren. Het wordt ook aangeraden om specifieke stemmen met een naam die bestaat uit meer dan een woord tussen aanhalingstekens te zetten. Als aanhalingstekens weggelaten worden worden alle witruimtetekens voor en na de stemnaam genegeerd en elke reeks van witruimtetekens binnen de stemnaam wordt geconverteerd naar één witruimte spatie.

'pitch'

Waarde:	<frequency> \| x-low \| low \| medium \| high \| x-high \| inherit
Startwaarde:	medium
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Specificeert de gemiddelde pitch (een frequentie) van de stem. De gemiddelde pitch van een stem hangt af van de stemfamilie. De gemiddelde pitch voor bijvoorbeeld een standaard mannenstem is rond 120Hz, maar voor een vrouwenstem is het rond 210Hz.

Waarden hebben de volgende betekenissen:

<frequency>: Specificeert de gemiddelde pitch van de stem in hertz (Hz).
x-low, low, medium, high, x-high: Deze waarden kunnen niet gekoppeld worden aan absolute frequenties omdat deze waarden afhangen van de stemfamilie. User agenten zouden deze waarden moeten koppelen aan de geschikte frequenties gebaseerd op de stemfamilie en gebruikersomgeving. User agenten moeten deze waarden echter in volgorde houden (hetgeen wil zeggen 'x-low' is een lagere frequentie dan 'low', enz.).

'pitch-range'

Waarde:	<number> \| inherit
Startwaarde:	50
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Specificeert variatie in gemiddelde pitch. De waargenomen pitch van een menselijke stem wordt bepaald door de fundamentele frequentie en heeft gewoonlijk aan waarde van 120Hz voor een mannenstem en 210Hz voor een vrouwenstem. Mensentalen worden uitgesproken met wisselende inflectie en pitch; deze variaties dragen aanvullende betekenis en nadruk. Een sterk geanimeerde stem, zoals een stem die sterk geïnflecteerd is, geeft een hoog pitch bereik. Deze eigenschap specificeer het bereik waarover deze variaties voorkomen, zoals hoeveel de basisfrequentie kan afwijken van de gemiddelde pitch.

Waarden hebben de volgende betekenissen:

<number>: Een waarde tussen '0' en '100'. Een pitchbereik van '0' produceert een platte monotone stem. Een pitchbereik van 50 produceert normale inflectie. Pitchbereiken groter dan 50 produceren geanimeerde stemmen.

'stress'

Waarde:	<number> \| inherit
Startwaarde:	50
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Specificeert de hoogte van "plaatselijke pieken (local peaks)" in de intonatievorm van een stem. Engels is bijvoorbeeld een benadrukte taal en verschillende delen van een zin worden aangeduid als primair, secondair of tertiar benadrukt. De waarde van 'stress' bepaalt de grootte van inflectie die resulteert van deze nadrukmarkeerpunten. Deze eigenschap is gekoppeld aan de 'pitch-range' eigenschap en wordt voorzien om ontwikkelaars toe te laten om higher-end auditieve weergaven uit te baten.

Waarden hebben de volgende betekenissen:

<number>: Een waarde tussen '0' en '100'. De betekenis van waarden hangt af van de taal die gesproken wordt. Een niveau van '50' voor een standaard Engels sprekende mannenstem (gemiddelde pitch = 122Hz), uitgesproken met normale intonatie en nadruk zal een andere betekenis hebben dan '50' voor een Italiaanse stem.

'richness'

Waarde:	<number> \| inherit
Startwaarde:	50
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Specificeert de rijkheid, of helderheid, van de stem. Een rijke stem zal "gedragen" worden in een grote kamer, een zachte stem niet. (De term "zacht" verwijst naar hoe de golfvorm uitziet wanneer deze getekend wordt.)

Waarden hebben de volgende betekenissen:

<number>: Een waarde tussen '0' en '100'. Hoe hoger de waarde, hoe beter de stem gedragen zal worden. Een lagere waarde zal een zachte stem produceren.

19.9 Speech eigenschappen: 'speak-punctuation' and 'speak-numeral'

Een aanvullende speech eigenschap, speak-header wordt in het hoofdstuk over tabellen besproken.

'speak-punctuation'

Waarde:	code \| none \| inherit
Startwaarde:	none
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Deze eigenschap specificeert hoe punctuatie uitgesproken wordt. Waarden hebben de volgende betekenissen:

code: Punctuatie zoals puntkomma's, haken en zo voort worden letterlijk uitgesproken.
none: Punctuatie wordt niet uitgesproken, maar in de plaats op natuurlijke manier weergegeven als variërende pauzes.

'speak-numeral'

Waarde:	digits \| continuous \| inherit
Startwaarde:	continuous
Van toepassing op:	alle elementen
Geërfd:	ja
Percentages:	N/A
Media:	aural

Deze eigenschap bepaalt hoe getallen uitgesproken worden. Waarden hebben de volgende betekenissen:

digits: Spreek het getal uit als individuele getallen. "237" wordt dus uitgesproken als "Twee Drie Zeven".
continuous: Spreek het getal uit als een volledig nummer. "237" wordt dus uitgesproken als "Tweehonderd zeven en dertig". Woord weergaven zijn taalafhankelijk.