Speechz Tekst aan toespraak
Spraaksynthese is de kunstmatige productie van menselijke spraak. Een computersysteem dat voor dit doel wordt gebruikt, wordt een spraaksynthesizer genoemd en kan worden geïmplementeerd in software- of hardwareproducten. Een TTS-systeem (text-to-speech) zet normale taaltekst om in spraak; andere systemen maken symbolische taalkundige voorstellingen zoals fonetische transcripties in spraak. [1] Gesynthetiseerde spraak kan worden gemaakt door stukjes opgenomen spraak te samenvoegen die in een database zijn opgeslagen. Systemen verschillen in de grootte van de opgeslagen spraakeenheden; een systeem dat telefoons of diphones opslaat biedt het grootste outputbereik, maar kan onduidelijkheid missen. Voor specifieke gebruiksdomeinen zorgt de opslag van hele woorden of zinnen voor uitvoer van hoge kwaliteit. Als alternatief kan een synthesizer een model van het stemkanaal en andere menselijke stemkenmerken opnemen om een volledig "synthetische" stemoutput te creëren. [2] De kwaliteit van een toespraaksynthesizer wordt beoordeeld door zijn gelijkenis aan de menselijke stem en door zijn capaciteit om worden begrepen. Een begrijpelijke tekst-naar-spraak programma stelt mensen met een visuele beperking of leeshandige om te luisteren naar geschreven werken op een computer thuis. Veel computer besturingssystemen hebben opgenomen spraaksynthesizers sinds het begin van de jaren 1990.
Overzicht van een typisch TTS-systeem
Automatische aankondiging MENU0:00 Een synthetische stem die een aankomende trein in Zweden aankondigt. Problemen met het afspelen van dit bestand? Zie mediahelp.
Voorbeeld van Microsoft Sam MENU0:00 Microsoft Windows XP's standaard spraak synthesizer stem te zeggen "De snelle bruine vos springt over de luie hond 1.234.567.890 keer. soi" Problemen met het afspelen van dit bestand? Zie mediahelp. Een tekst-naar-spraaksysteem (of "motor") bestaat uit twee delen:[3] een front-end en een back-end. De front-end heeft twee grote taken. Ten eerste zet het ruwe tekst met symbolen zoals getallen en afkortingen om in het equivalent van uitgeschreven woorden. Dit proces wordt vaak tekstnormalisatie, voorverwerking of tokenisatie genoemd. De front-end wijst vervolgens fonetische transcripties toe aan elk woord en verdeelt en markeert de tekst in prosodische eenheden, zoals zinnen, clausules en zinnen. Het proces van het toewijzen van fonetische transcripties aan woorden wordt tekst-naar-foneem of grapheme-to-phoneme conversie genoemd. Fonetische transcripties en prosodie-informatie vormen samen de symbolische taalkundige representatie die wordt uitgevoerd door de front-end. De back-end—vaak aangeduid als de synthesizer—zet vervolgens de symbolische linguïstische representatie om in geluid. In bepaalde systemen omvat dit deel de berekening van de doelprosodie (toonhoogtecontour, foneemduur),[4] die vervolgens wordt opgelegd aan de uitvoerspraak.
versiegeschiedenis
- Versie 1.0 geplaatst op 2013-10-06
Programmadetails
- Categorie: Audio & Multimedia > Audio-bestandsspelers
- Publisher: Phelipe Maia
- Licentie: Gratis
- Prijs: N/A
- Versie: 1.0
- Platform: android