Synteza mowy, a WCAG 2.1 – czy to ma sens?

Czy na stronie zgodnej z WCAG 2.1 należy zapewnić czytnik tekstu w formie możliwości odczytywania treści przez lektora lub syntezator mowy? Zgodnie z manierą panującą obecnie w Internecie konkluzja powinna znaleźć się na początku testu, aby nie trzeba było go czytać, zatem do konkluzji: odpowiedź brzmi – nie. WCAG 2.1 nie stawia takiego wymagania, gdyż zwyczajnie nie ma takiej potrzeby.

Jest to jedno z najczęściej mylonych pojęć, gdy przychodzi do rozważań nad dostosowaniem strony WWW do potrzeb osób niepełnosprawnych zgodnie ze specyfikacją WCAG 2.1 – zapewnienie możliwości odczytu tekstu, alternatyw tekstowych, deskrypcji multimediów nie oznacza zapewnienia mechanizmu odczytującego te teksty. Innymi słowy – zapewnienie możliwości odczytu tekstu na głos, nie oznacza zapewnienia jego odczytywania na głos. Osoby niepełnosprawne są wyposażone w dedykowane technologie asystujące mające wbudowane mechanizmy odczytujące treść strony głosem lektora – administrator strony zgodnej z WCAG 2.1 ma jedynie zapewnić, aby te mechanizmy mogły działać bez przeszkód.

WCAG 2.1 na żadnym poziomie zgodności, nawet najwyższym AAA, nie wymaga obecności na stronie internetowej mechanizmu odczytywania tekstu na głos. Zapewnić należy, że informacje – normalnie pisane zwykłym tekstem oraz inne treści na stronie – będą możliwe do odczytania na głos przez czytniki używane przez osoby niewidome. Stąd konieczność opisywania obrazków, grafik  i zdjęć tekstami alternatywnymi, zapewniania napisów do filmów, zamieszczania deskrypcji nagrań audio itd. Jeśli na stronie jest zamieszczony tekst w formie możliwej do odczytania (w praktyce po prostu w postaci kodu HTML), czytnik osoby niepełnosprawnej sobie z nim doskonale poradzi. Warto natomiast niewątpliwie zadbać o to, aby tekst był pisany z poszanowaniem zasad interpunkcji języka określonego jako język danej strony. Stosowanie kropek, przecinków i znaków interpunkcyjnych charakterystycznych dla danego języka sprawia, że tekst syntezowany przez czytnik osoby niewidomej brzmi bardziej naturalnie. Oprogramowanie to podczas interpretacji tekstu stara się bowiem naśladować czytającego na głos człowieka – znaki interpunkcyjne stosowane w tekście, zgodnie z zasadami interpunkcji, powodują, że „lektor” robi naturalnie brzmiące pauzy w zdaniu i pomiędzy zdaniami, a tak odczytywany tekst jest łatwy do zrozumienia. Brak znaków interpunkcyjnych sprawia, iż odczytywany tekst „zlewa się” w niezrozumiały potok słów, pozbawiony przerw pomiędzy zdaniami i w zdaniach wielokrotnie złożonych, co bardzo utrudnia jego odbiór.