Page Index Toggle Pages: 1 [2]  Send TopicPrint
Hot Topic (More than 10 Replies) Interessantes zum Thema TTS (Read 38461 times)
Phoner Admin
YaBB Administrator
*****
Offline



Posts: 11421
Location: Germany
Joined: 12. Oct 2003
Gender: Male
Re: Interessantes zum Thema TTS
Reply #15 - 19. Apr 2005 at 08:55
Print Post  
Ja, so ein Setup währe dann interessant, wenn man es denn im Downloadbereich von Phoner.de zur Verfügung stellen könnte. Ich selber bekomme das sicherlich auch ohne ein neues setup hin, aber wie gesagt: Solange es für einen Endbenutzer nicht einfach zu installieren geht, kümmere ich mich gar nicht drum.
  
Back to top
WWW  
IP Logged
 
Suppenkasper
God Member
*****
Offline


Phoner-Support

Posts: 1536
Location: Aachen
Joined: 29. Mar 2005
Gender: Male
Re: Interessantes zum Thema TTS
Reply #16 - 20. Apr 2005 at 18:18
Print Post  
@Marcel

So gehts: START->Ausführen

Eingabe:

windows\system\regsvr32.exe c:\"speicherort der dll"\"name der DLL" /r

Versuch's so, dann müsste die mbrsync.dll systemweit zur Verfügung stehen.
  
Back to top
IP Logged
 
Phoner Admin
YaBB Administrator
*****
Offline



Posts: 11421
Location: Germany
Joined: 12. Oct 2003
Gender: Male
Re: Interessantes zum Thema TTS
Reply #17 - 21. Apr 2005 at 09:23
Print Post  
Dann kann ich zwar auf gewisse Funktionalitöt zugreifen, aber kann man dann auch eine Wave-Datei erstellen lassen, oder bekommt man dann eine PHO-Datei?
Ich werde die aktuelle Beta erstmal rund machen und mir dann dieses MBROLA mal anschauen...
  
Back to top
WWW  
IP Logged
 
Suppenkasper
God Member
*****
Offline


Phoner-Support

Posts: 1536
Location: Aachen
Joined: 29. Mar 2005
Gender: Male
Re: Interessantes zum Thema TTS
Reply #18 - 21. Apr 2005 at 21:22
Print Post  
@Forum Admin (Heiko)

So wie ich das hier mitbekomme... *räusper*

... erstellt die txt2wav.exe eine *.pho-Datei, und übergibt diese automatisch an die mbrsyn.dll, die eine *.wav-Datei erstellt...

Letztlich interessant für Phoner 

- und dabei meine ich ernstlich, dass Phoner in Sachen TTS nicht unbedingt eine Erweiterung durch MBROLA braucht, sondern vielleicht irgendwann einmal eine "Schnittstelle" hierzu - 

wäre ein Frontend, welches die Konvertierung von Orthographischem Text zu PHO-Text nach den Ausspracheregeln der entsprechend benutzten MBROLA-Bibliothek unterstützt, und die entstandene Synthetisierung wiedergibt.

Für Phoner bedeutete dies nach meiner Auffassung - so wie MBROLA konzipiert ist - die Neuentwicklung und Einbindung einer völlig neuen Sprachwiedergabe. 

DAS braucht jedoch Phoner nicht, da die Verwendung der SAPI's viel einfacher ist - zur Zeit wenigstens, bis ich mit dem MBROLA-ALLROUND-Setup fertig bin. Dann erst ist es auch einfach möglich, ein bereits erhältliches und ohne Probleme funktionierendes Frontend über Phoner anzusprechen...

Trotzdem, ich finde es toll, dass Du geneigt bist, dieses in Deine Planungen in Sachen Phoner einzubeziehen.  Cheesy

Grüße vom Kai
  
Back to top
IP Logged
 
Floriel
Guest


Re: Interessantes zum Thema TTS
Reply #19 - 27. Apr 2005 at 22:12
Print Post  
Ich hätte hier ein Freeware-TTS Prog für euch: Speakonia (http://www.cfs-technologies.com/home/?id=1.4). Die Stimmen können zwar bei weitem nicht mit den Loquendo-Meisterwerken Mithalten, sind aber trotdem gut verständlich. Probiert's mal aus
  
Back to top
 
IP Logged
 
Suppenkasper
God Member
*****
Offline


Phoner-Support

Posts: 1536
Location: Aachen
Joined: 29. Mar 2005
Gender: Male
Re: Interessantes zum Thema TTS
Reply #20 - 27. Apr 2005 at 23:58
Print Post  
@Floriel,

Vielen Dank für den Hinweis, das Progg ist, mit Verlaub, ziemlich gut, und funktioniert genauso (wenn nicht sogar besser) als Shareware oder andere kommerzielle Lösungen...

Aber leider  Sad wenn Du kostenlose TTS-Engines gefunden hättest, oder sogar kostenlose, vor allem deutschsprachige Stimmen... Ja dann hätte ich 'n paar Freudentränchen verdrückt.  Wink

Speakonia arbeitet mit Microsoft's SAPI 4.0 und ähnlichen Entwicklungen (z. B. Scansoft RealSpeak) prima zusammen, dennoch ist das Problem, eine Stimme zu finden, die sich einigermaßen erträglich natürlich anhört. Mein MBROLA-Fund war da auch eher ein Glücksgriff (zwar 'n komplizierter aber qualitativ guter).

Dank trotzdem für den nützlichen Tipp!
Grüße vom Kai
  
Back to top
IP Logged
 
Suppenkasper
God Member
*****
Offline


Phoner-Support

Posts: 1536
Location: Aachen
Joined: 29. Mar 2005
Gender: Male
Re: Interessantes zum Thema TTS
Reply #21 - 21. Oct 2005 at 15:13
Print Post  
Hi @ All,

für diejenigen, die das Phoner-TTS benutzen, stellt sich immer das Problem der schlecht akzentuierten und schwammigen Aussprache der SAPI 4.0 oder SAPI 5.0 - TTS - Maschinen-Stimmen. Erschwerend hinzu kommt, dass Phoner für die Anrufsignalisierung oder das TTS-SMS eine, für eine Computerstimme nicht gerade vorteilhafte, Sampling-Rate nutzt. Dies ist jedoch so beabsichtigt, damit keine Einbußen in der Geschwindigkeit der TTS-Ausgabe verursacht werden. Zudem entspricht die Qualität der Phoner-Wiedergabe der Verbindungs-Qualität einer ISDN-Verbindung.

Was macht man jedoch als Anwender, der sich nicht mit der eigentlich miesen Sprachqualität der frei verfügbaren SAPI-4.0 Stimmen von L&H oder der Microsoft Reader SAPI 5.0-Stimmen zufrieden geben möchte? Qualitativ hochwertige TTS-Stimmen, die auch mit einer niedrigen Sampling-Rate gut klingen, kosten teilweise bis zu mehreren 100 wenn nicht sogar mehr als 1000,00 €. Immerhin soll es ja ein System für den Hausgebrauch sein.

Nach einigem Herumtesten auf diversen TTS-Voice-Demo-Seiten habe ich mich für eine Stimme entschieden, die insgesamt 29,99 $ kostet, und für meine Zwecke eine klare, verständliche und nicht nuschelige Aussprache bietet: Katrin von der Firma Cepstral.

Die, leicht traurig und ein wenig depressiv anmutende, Stimme läuft unter der seit Windows XP installierten SAPI 5.0-Engine, und liefert in allen Sampling-Raten sehr gut verständliche und akzenturierte Ergebnisse in den erstellten WAV-Dateien. Die gute Aussprache verfremdet nur sehr wenige Lautkombinationen, und der Benutzer muß auch nur sehr wenige Aussprachen nachbessern (Erklärung nachstehend). Satzzeichen nehmen hörbaren Einfluss auf die Aussprache, und bestimmte Laut-Kombinationen wie "wen" oder "den" werden deutlich, mit einem halblangen "e" ausgesprochen, und nicht einfach verschluckt (z. B. "wn").

Zwar ist die zweite deutsche Stimme, Matthias, auch als hochwertiger als der frei erhältliche TTS-Kram zu bezeichnen, jedoch verschluckt diese Engine viele Lautkombinationen, man muss nacharbeiten (Beipiel: Anstatt Daniela sollte man für ein deutliches Ergebnis bei Matthias "Da-niä-la" schreiben, bei der Stimme "Katrin" ist das nicht nötig), und bei den von Phoner genutzten niedrigen Sampling-Raten ist die Stimme nur noch nuschelig und elektronisch. Zudem ist Matthias eindeutig eine Stimme, die einen schweizerischen Akztent hat: Lautkombination, die ein "k" enthalten, werden von ihr als "kch" ausgesprochen, "h"- und "r"-Phoneme werden gerne vernachlässig, und eine deutliche Unterscheidung zwischen "d", "tt" und "t" ist kaum wahrzunehmen.

Für etwas weniger als 30,00 € ist man mit Katrin sehr gut bedient, und erhält eine deutliche Ansage, die sich auch bei der Übertragung einer TTS-SMS nicht verzerrt anhört.

Die Stimmen kann man bequem zum Test downloaden, oder direkt im Shop erwerben. Eine Voice-Demo, die online funktioniert, bietet Cepstral selbstverständlich auch.

Viele Grüße vom Kai



Zur Umfrage: Wie nutzt DU Phoner?
Zur Umfrage: Auf welchem System verwendest DU Phoner?
« Last Edit: 27. Oct 2005 at 18:07 by Suppenkasper »  
Back to top
IP Logged
 
Suppenkasper
God Member
*****
Offline


Phoner-Support

Posts: 1536
Location: Aachen
Joined: 29. Mar 2005
Gender: Male
Re: Interessantes zum Thema TTS
Reply #22 - 01. Aug 2007 at 17:11
Print Post  
Hallo alle,

ich weiss, ich kram da jetzt ein altes Thema hervor - jedoch finde ich es in diesem Zusammenhang passend, ein paar Neuigkeiten zum Thema TTS mitzuteilen.

Loquendo TTS - der Traum aller Sprachsynthetiker/Innen - bleibt weiterhin nicht für jedermann erhältlich. Beziehen können das System nach Angaben der telefonischen Hotline ausschließlich Unternehmer. Die Strategie der Turiner Firma Loquendo ist mir persönlich zwar ein Rätsel, jedoch sind zugegebenermaßen die Stimmen (SAPI 5.1) in einer Art ausgereift, dass wahrscheinlich der Kreis der Glücklichen klein gehalten wird, um die Technik zu schützen.

Bei einem geschätzten Preis von deutlich über 1.000,00 € ist die deutsche Vorzeige-Stimme Katrin sicherlich auch nur denjenigen vorbehalten, die sie nicht unbedingt als Heimanwendung nutzen möchten... Wink. Die etwa 3 Jahre alte Stimme "Stefan" kosten weniger, liegt jedoch noch immer deutlich im dreistelligen Euro-Bereich. Die etwas mehr als 5 Jahre alte deutsche Stimme "Ulrike" sollte man sich dagegen nicht zulegen, da die Dame mit Ihrer Aussprache Anrufer doch sehr verschrecken könnte, und meiner Meinung nach wesentlich maschineller klingt, als eine SAPI4-L&H-Microsoft-Stimme.

Für all diejenigen jedoch, die sich als Unternehmen auf Phoner verlassen, ist diese Nachricht vielleicht interessant: Sämtliche Loquendo-Stimmen der Version 6 arbeiten auch zuverlässig mit Phoner zusammen (siehe Dateianhang: TTS-Test der deutschen Stimme "Stefan" mit Phoner), wenn das lizensierte Loquendo-Produkt auf dem Phoner-Client-Rechner installiert ist. "Katrin"'s hocherotisches gehüstel und ge-"upse" konnte ich jedoch verständlicher Weise aufgrund des Preises nicht mit Phoner testen, sondern nur das lizensierte Exemplar "Stefan" sowie alle Demos der andersprachigen Stimmen...

Das MBROLA-TTS-Projekt erfreut sich mehrerer OpenSource-Konkurrenten - die ausnahmsweise nicht in Hinsicht auf Lizenzen und Software-Patente (z. B. PSOLA-Stimmenerzeugungspatent der France Telekom) bedenklich sind, und daher als Opensource gestrickt und frei vertrieben werden können.

Die frei erhältliche TTS-Software MBROLA ist zwar leistungsfähig, kann jedoch auch nach 10 Jahren Projekt-Zeit nicht mit wirklich guten Stimmen glänzen, denen man das "mechanische Timbre" noch immer deutlicher als gewünscht anmerkt.

Auch die - für den Heimanwender zu - komplexe Installation der MBROLA-Pakete, und die Unfähigkeit, Phoner mit einem MBROLA-System zum sprechen zu bringen, obwohl die Sprachausgabe angeblich auch mit SAPI 5 funktionieren soll, schrecken jedoch ziemlich ab. Die Konfiguration über ellenlange Textdateien verfehlt in dieser Hinsicht nicht seine Wirkung.

Als ich jedoch den Artikel Sprachsynthese in der deutschen Wikipedia las, fielen mir einige Alternativen zu MBROLA, insbesondere die TTS-Opensource-Projekte in's Auge.

Abgesehen von den auf JAVA basierenden Projekten, die eine installierte JAVA-Runtime voraussetzen gibt's mittlerweile eine grosse Menge TTS-Systeme auf dem Markt - jedoch die wenigsten davon für Windows, und von dieser Teilmenge fast alle kommerziell. Einen vollständigen Überblick erhält man auf dieser Seite.

Nachteilig für Phoner-Benutzer: Phoner kann (bisher) mit keinem der JAVA-Projekte etwas anfangen. Und für Windows-Anwender: Ich konnte kein nichtkommerzielles Open-Source-Binary für Windows finden, dass mit einem einfachen Setup zu installieren gewesen wäre. Jedoch weise ich auf den Vorteil der OpenSource-Gemeinschaft hin: Im Gegensatz zum MBROLA-Projekt kann man jetzt damit rechnen, dass die gemeinschaftlich programmierten Systeme bald auch für Windows-Systeme zur Verfügung stehen werden.

Viele Grüße vom Kai
  

stefan.wav ( 191 KB | Downloads )
Back to top
IP Logged
 
Page Index Toggle Pages: 1 [2] 
Send TopicPrint