G DATA Software AG: Antivirus, Virenschutz, Virenscanner, Internet Security

G Data: News Details

Home

LOGOX4

LOGOX4

Neuartige Sprachausgabetechnologie kann sogar Dialekte sprechen und singen.
Bochum, 04. Dezember 2001

Bochum, 04. Dezember 2001 – Mit der Neuentwicklung der Sprachausgabetechnologie LOGOX4 setzt das Logox-SpeechLab bei G DATA nach dreijähriger Entwicklungsarbeit neue Maßstäbe in der Sprachsynthese. Die Qualität der Sprachausgabe wurde bei gleichzeitiger Verkleinerung des Speicherbedarfs stark verbessert. Mit LOGOX 4 kann der Computer nicht nur beliebige Texte vorlesen, sondern erstmalig auch singen und sogar in Dialekten sprechen. Als erste Anwendung steht ab sofort das neue WebSpeech 4 kostenlos zum Download bereit.




G DATA Vorstand Fridolin Rummel freut sich: „Mit der LOGOX4 Technologie sind wir einen entscheidenden Schritt in der Kommunikation zwischen Maschine und Mensch vorangekommen. Unsere von Grund auf neu entwickelte Technologie ermöglicht den Einzug der Sprache in das tägliche Leben mit elektronischen Geräten. PCs und PDAs sind da erst der Anfang.“


Flexibel, menschlich und sogar singend


Das fünfzehnköpfige Team aus Programmierern und Sprachwissenschaftlern im Logox-SpeechLab hat vor dem Hintergrund von zehnjähriger Entwicklungserfahrung mit LOGOX4 eine völlig neuartige Sprachtechnologie entwickelt. Diese beruht auf der von G DATA patentierten Mikrosegmentsynthese, die es ermöglicht, aus nur 380 Lautbausteinen (Mikrosegmenten) jedes Wort einer Sprache verständlich und menschlich darzustellen.


LOGOX4 hat mit der Vorgänger-Version LOGOX3 außer dem grundlegenden Verfahren nichts mehr gemeinsam. Entscheidend für die Qualitätssteigerung der neuen Sprachtechnologie ist die flexible Systemarchitektur, die verbesserte Textanalyse sowie die neu konzipierte Signalverarbeitung.


Bei der Neuentwicklung standen neben der optimalen Verständlichkeit des vorgelesenen Textes vor allem eine möglichst menschennahe Artikulation sowie bestmögliche Sprach- und Stimmqualität im Vordergrund. Auch die korrekte Interpretation der Aussprache von schwierigen Textbausteinen wie Datum, Währungen oder Abkürzungen gehört zu den wichtigsten realisierten Entwicklungszielen.


Für eine verfeinerte Sprachqualität sorgt die intelligente Transformation von Text in Ton-Signale. Sie ermöglicht durch Satzanalysen eine deutlich menschlichere Sprechmelodie und einen variableren Sprecherrhythmus.


Zudem kann der Anwender Sprechgeschwindigkeit, Tonhöhe sowie Intonation nach seinen Vorlieben einstellen. Die neue Architektur mit der einhergehenden Flexibilität ermöglichen sogar echte Weltneuheiten: Mit LOGOX4 kann der Computer nun sogar singen oder in Dialekten sprechen. Kostproben in „Hessisch“ liegen unter www.logox.de bereit.


Weitere fast beliebige Sprachverfremdungen wie z.B. Lispeln, Stottern, Lallen, französischer oder japanischer Akzent sind möglich.


Stimmgewaltig durch das neue variable SpeechFont®-Konzept


Hinter dem SpeechFont®-Konzept verbirgt sich die Idee, viele unterschiedliche Stimmen und Sprechercharaktere einfach erstellen und einsetzen zu können - ähnlich wie Schriften (Fonts) in Textverarbeitungsprogrammen.


Ein Logox-SpeechFont® besteht neben den Audiosegmenten einer echten menschlichen Stimme aus Lese-Regeln, Aussprachelexika und frei definierten Audioeffekten (z.B. Hall oder Echo). Fügt man diese Daten zu einem Datensatz zusammen, wird eine individuelle (Computer-) Stimme generiert. Über Veränderungen der Regelwerke und der Einstellungen können persönliche Charaktere schnell und einfach geschaffen werden.


Mit den integrierten Echtzeit-Audioeffekten (Hall, Echo, Equalizer, Chorus, Flanger, Phase und weitere) kann der Anwender die Stimme zusätzlich nach seinen Wünschen beliebig kombinieren und einstellen. So wird die Sprachausgabe individuell verständlicher und macht darüber hinaus mit besonderen Effekten wie beispielsweise „Telefonstimme“ oder „Robocop“ auch noch Spaß. Alle Effekte stehen auch in Stereo zur Verfügung und können damit auch räumliche Klangbilder erzeugen.


Neue Stimmen, die in den Logox-SpeechLabs erzeugt oder optimiert werden, können als Stimm-Updates per Downloadmanager nachgeladen bzw. aktualisiert werden.


Mit Logox-SpeechTags Emotionen und Gesang erzeugen


Während der Sprachausgabe kann mit Hilfe von speziellen Steuerzeichen (Logox-SpeechTags) der SpeechFont modifiziert oder gewechselt werden. So lassen sich beispielsweise Hörspiele mit verschiedenen Sprechern, Sprechtempi oder weiteren Änderungen der Stimmattribute erstellen. Auch sprechende Chats mit verschiedenen Stimmen sind realisierbar. Sogar Emotionen lassen sich auf diese Weise mit den Logox-Stimmen ausdrücken.


Über die Möglichkeiten der Veränderung von Tonhöhe und –länge der gesprochenen Silben lässt sich schließlich auch die singende Computerstimme verwirklichen.


Multipler Einsatz von LOGOX4 auf verschiedenen Plattformen


Die neue LOGOX4 Engine wurde in plattformunabhängigem kompaktem Code entwickelt. Umsetzungen sind für Windows und Windows CE vorhanden.


Ein entscheidender Vorteil der neuen LOGOX4 Engine ist der geringe Speicherplatzbedarf von circa 1,5 MB mit einer Stimme. LOGOX4 hat damit das Potential, neben dem Einsatz in Organizern mittelfristig als auch Technologie für Sprachchips in Mobiltelefonen, Navigationssystemen, elektronischen Spielzeugen und auch in Haushaltsgeräten zum Einsatz zu kommen.


LOGOX4 lässt bereits sprechen


Für Softwareentwickler gibt es bereits das LOGOX4 SDK (Software Development Kit), mit dem die LOGOX4 Sprachausgabe einfach in beliebige eigene Applikationen integriert werden kann.


Darüber hinaus gibt es für jedermann das neue WebSpeech 4. Das PlugIn für den Internet Explorer liest beliebige deutsche Webseiten vor und bietet somit einen Eindruck von der Flexibilität und Leistungsfähigkeit der neuen LOGOX4 Technologie.


Die neue Version von WebSpeech 4 mit vier Sprecher-Stimmen steht ab sofort kostenlos zum Download zur Verfügung: www.webspeech.de/download.php


Weitere Anwendungen auf Basis der LOGOX4 Technologie werden in Kürze folgen.

 

Pressekontakt

E-Mail: presse@gdata.de
Telefon: 0234 / 97 62 - 0