Используя VBS можно воспроизводить речь в необходимых местах.
В обработке пример для преобразования текста в голос.
При желании можно избавиться от английского акцента, наверное, прикрутив нужные библиотеки русской речи.
Сейчас текст в транслите засылается в sapi.spvoice
Код для воспоизведения текста
oVoice = Новый COMОбъект("SAPI.SpVoice");
oVoice.Speak ("privet");
Если нужна обработка преобразования в транслит, она есть в примерчике.