Sonntag, 30. Dezember 2012

Simon 0.4.0

After years of hard work, the Simon team is proud to announce the new major release: Simon 0.4.0.

New in Simon 0.4

This new version of the open source speech recognition system Simon features a whole new recognition layer, context-awareness for improved accuracy and performance, a dialog system able to hold whole conversations with the user and more.

Revisiting Usability

A lot of work has gone into making Simon easier to use - both for existing and new users.
Perhaps most visibly, the main window of Simon has been reorganized to bring the most important options together in one screen.
Simon 0.4.0: Main window

Moreover, the newly introduced Simon base model format (.sbm) and the integration of a GHNS online repository of base models have removed the last big hurdle of the initial configuration.
One can now easily go from a fresh installation to a working setup in less than 5 minutes without any preparation. Don't believe me? Check out the quick start below!


Simon 0.4.0: Quick Start

Many other, smaller changes sum up to one simple but important difference: Simon will overall require less user interaction while achieving more.

SPHINX

One of the major internal changes of Simon 0.4 is of course the included support for the BSD licensed CMU SPHINX. While we still also maintain full support for HTK and Julius, new models compiled with Simon will default to the SPHINX backend and the (proprietary) HTK is no longer required to build user-generated models.
Best of all: Simon will select the correct backend for your configuration transparently and automatically.

Voxforge

A major problem of open source speech recognition has always been the lack of freely available high quality speech models.

The Voxforge project has been working for years towards GPL acoustic models for a variety of languages. While their models are certainly not yet perfect, they offer a promising starting point.
The English Voxforge model is of course available as a Simon base model and can be downloaded and imported with Simon.

Additionally, starting with Simon 0.4, users will also have the option to contribute their gathered Simon training samples directly to the Voxforge server.
These recordings will then be used to train and improve the general acoustic models.



Simon 0.4.0: Training

By the way: Behind the scenes this upload is based on SSC.

Context

There is a simple rule of thumb in speech recognition: The smaller the application domain, the better the recognition accuracy. This was always one of the core principles of Simon.

In Simon 0.4, however, we went one step further: Simon can now re-configure itself on-the-fly as the current situation changes. Through so called "context conditions" Simon 0.4 can automatically activate and deactivate selected scenarios, microphones and even parts of your training corpus.

For example: Why listen for "Close tab" when your browser isn't even open? Or why listen for anything at all when you're actually in the next room listening to music? Yes, Simon is watching you.

Dialog System

Simon 0.4.0 also ships with the new dialog system featuring scripted variables (Javascript), integration with Plasma data engines, a templating system and - of course - text-to-speech output.

Simonoid

For users of KDE's plasma workspace, we now provide the "Simonoid" plasmoid to start and monitor Simon - including the current recording volume.

Simonoid

The screenshot above shows two instances of the plasmoid: One added to the panel and another one to the desktop.

... and everything else

Please don't be foold to think that the above is a complete list of all improvements. For example, we also have a new sample review tool called Afaras, integration with the Sequitur grapheme to phoneme framework, an Akonadi command plugin and many, many other noteworthy changes.
You'll have to try out Simon to see for yourself!

Download

To install Simon 0.4.0, you can either compile the official source tarball, install a binary package provider by our Linux distribution or use the installer for Windows.


Source Code

If you are a packager and would like to package Simon 0.4, please do get in touch with us. Thank you.

Kommentare:

Beluga hat gesagt…

Would this get you started on the packages: http://open-build-service.org/

Anonym hat gesagt…

Do you have an API or some sort of interface that I could use from my own application?

Peter Grasch hat gesagt…

@Beluga: I used the obs in the past and while it's a great service, I'd really like to get some help from packagers.

@Anonymous: Yes, sure. What do you want to do?

Anonym hat gesagt…

Congratulations for the release!

Oneadvent hat gesagt…

Is there a walk through for kubuntu 12.04? I can't compile this to save my life. http://paste2.org/p/2674911

Peter Grasch hat gesagt…

@Oneadvent: Have a look at this: http://userbase.kde.org/Simon/Development_Environment#Requirements

In your case, you are missing (at least) libxtst-dev.

Best regards,
Peter

Qpoiuy Werty hat gesagt…

Can I use Simon to generate a well-synched subtitle file in a popular format, like .sub and such?

Peter Grasch hat gesagt…

@Qpoiuy Werty: No, sorry.

Oneadvent hat gesagt…
Dieser Kommentar wurde vom Autor entfernt.
Oneadvent hat gesagt…

@Peter

That was it, used that and had very little trouble (had to also install libakonadi-dev)

Thanks!

christian hat gesagt…

Simon + Ubuntu HUD - That could be a killer ;)

Simon hat gesagt…

As a Simon, I'm very happy with this update.

Anonym hat gesagt…

Die ganzen 'Plugins' sind offenbar derzeit nur auf Englisch verfügbar - erstellt jemand die auch für Deutsch? Bei VoxForge ist seit August/September keine Aktivität für das deutsche Sprachmodell zu erkennen.

(are there any plans for plugins in German?)

Zweite Frage: wird es (mit einem entsprechend umfangreichen Sprachmodell) irgendwann möglich sein, Simon auch zum Diktieren zu nutzen? Oder ist das heute schon als Ziel des Projektes ausgeschlossen?

(will simon someday be usable for dictation? or is this not a goal of the project?)

Peter Grasch hat gesagt…

@Oneadvent
Glad to help!

@christian
Actually a very good idea - that could be quite powerful. Canonical: If you're interested, get in touch with me!

@Anonym:
(English text below)
Die Plugins selbst sind komplett sprachunabhängig. Die Szenarien nicht - aber für viele der englischen Szenarien gibt es ein deutsches Equivalent of kde-files.
Zum Sprachmodell: Erstens hoffen wir, dass die Integration vom Sprachdatenupload in Simon dazu führen wird, das mehr Leute Samples zu Voxforge hochladen. Für Deutsch im speziellen, habe ich aber eine nette Überraschung geplant. Leider ist der Jänner immer sehr stressig auf der Universität weshalb das wohl bis Februar warten muss.

Sobald Diktationsmodelle denkbar werden, ist die Diktation auch ein interessanter Aspekt den ich auf keinen Fall ausschließen würde - bis jetzt waren wir aber eben noch nicht so weit.


Plugins are language independent. Scenarios aren't, but for many of the English scenarios there actually German equivalents available on kde-files.
Regarding the speech model: First of all, we are hoping that by integrating speech submission into Simon more people may upload to Voxforge. But for German in particular, I have a nice surprise planned. Because January is always a very busy time at University, that'll have to wait till February.

As soon as dictation models become a possibility, that's definitely also something worth exploring - up until now we just didn't get that far.

Moini hat gesagt…

Vielen Dank für die ausführliche Antwort! Plugins und Szenarios habe ich dann wohl verwechselt ;-)
Ich finde vor allem gut, dass Ihr offenbar das Aufsetzen von Simon vereinfacht habt - ich hatte es mit einer früheren Version schon mal versucht, hatte aber absolut nicht verstanden, wie man das nach der Installation dann benutzen muss...

Voxforge ist nun heute sogar ganz offline. Die Möglichkeit, dort online 'einfach mal so nebenbei' ein paar Sätze einzusprechen, finde ich eine gute Idee, so sie denn zuverlässig funktioniert...

Ich werde die Simon-Entwicklung weiter fleißig verfolgen - auch wenn ich mit der Installation wohl warte, bis die Sprachmodelle ein Diktieren erlauben.

Bin schon gespannt auf die 'Überraschung'!

(thank you for your answer, I seem to have confused plugins and scenarios. I like that you have simplified the setting-up of simon, as I failed to understand how to to use it with a previous version. Btw, voxforge.org is completely offline today. I like the idea that you can add to their language model 'on the fly'. I'll keep on following the simon development, though I will likely only install it when dictation becomes possible.)

Anonym hat gesagt…

Congrats on the release. Without having it tested myself, is it possible to use simon headless, like on a central server for example?

Good luck and a happy new year.

Anonym hat gesagt…

Gratulation zur neuen Version!

Ich bin Admin eines "Linux-CallCenters" das neben Anrufen auch Mails bearbeitet. Wir tippen also derzeit recht viel.

Gibt es schon konkrete Pläne dem Simon Diktation beizubringen?

Kann ich bzw. meine Firma etwas tun, um den Prozess irgendwie zu unterstützen?

mfg
anfi

Peter Grasch hat gesagt…

@Anonym: Yes, you can run Simond on a remote server and connect to that from Simon. All recognition and model compilation happens on the Simond server.

@anfi: Konkrete Pläne sind es noch nicht, nein. FOSS Diktation ist eine sehr komplexe und zeitaufwändige Sache. Am meisten könntest du oder deine Firma eigentlich durch Unterstützung des Voxforge Projektes (http://voxforge.org) mittels Hochladen von Sprachdaten helfen.

Jeffrey B. hat gesagt…

Hello,

I tried to install simon 0.4 from source and am running Mint 13. Installing all of the dependencies did not work and as a result simon will not install. Installing from source is not my forte.

In the future, will there be a .deb file to work with 64 bit Linux Mint\Ubuntu? Thank you very much and keep up the good work.

Peter Grasch hat gesagt…

@Jeffrey: If you post your exact error message, I might be able to help you.

In any case, packages for distributions depend on packagers being interested in Simon - file a request with your distribution!

Jeffrey B. hat gesagt…

Peter, I tried following the steps given on the Simon Development Environment and copied the text to terminal. The errors are below:

jeffrey@jeffrey-Inspiron-1521 ~ $ sudo apt-get install git build-essential cmake gettext gettext-kde kdeartwork libqwt-dev \
> kdelibs5-dev libxtst-dev libqt4-sql-sqlite libphonon-dev libattica0.3 libattica-dev zlib1g-dev \
> libasound2-dev julius
[sudo] password for jeffrey:
Reading package lists... Done
Building dependency tree
Reading state information... Done
gettext is already the newest version.
gettext set to manually installed.
git is already the newest version.
build-essential is already the newest version.
build-essential set to manually installed.
libqt4-sql-sqlite is already the newest version.
Some packages could not be installed. This may mean that you have
requested an impossible situation or if you are using the unstable
distribution that some required packages have not yet been created
or been moved out of Incoming.
The following information may help to resolve the situation:

The following packages have unmet dependencies:
kdeartwork : Depends: kscreensaver (>= 4:4.8.5-0ubuntu0.1) but it is not going to be installed
E: Unable to correct problems, you have held broken packages.
jeffrey@jeffrey-Inspiron-1521 ~ $

In any case, Mint 13 is based on Ubuntu 12.04 LTS. Hope this helps.

Anonym hat gesagt…

Congrats to the team on the new release !

When I installed on Windows 7 I get the following error when accessing the Simon Handbook:

The requested help file could not be parsed:
c:/program files (x86)/simon/share/doc/html/en//simon/index.docbook

Are there any post-installation tasks I need to do ?

Peter Grasch hat gesagt…

@Jeffrey: Just remove "kdeartwork" from the command. It's not strictly necessary and is the one package that appears to be holding you back.

@Anonym: Weird. I just checked and it works for me. You shouldn't need to do any special post-installation tasks. If the problem persists, please open a bug at https://bugs.kde.org/enter_bug.cgi?product=simon

In any case, you can also look up the Simon handbook online: http://docs.kde.org/development/en/extragear-accessibility/simon/simon.pdf (replace "simon" with "sam", etc. for the other manuals).

Anonym hat gesagt…

Peter,
ich würde sehr gerne dazu beitragen das es mit der Diktation voran geht. Wenn ich dir etwas Arbeit abnehmen kann, lass es mich bitte wissen. Ich bin Autor.
Grüsse
Alex

Peter Grasch hat gesagt…

Hallo Alex,

> ich würde sehr gerne dazu beitragen das es mit der Diktation voran geht. Wenn ich dir etwas Arbeit abnehmen kann, lass es mich bitte wissen. Ich bin Autor.
Die größte Hilfe wäre eigentlich ein Beitrag von Sprachdaten an das Voxforge Projekt: http://voxforge.org/
Danke.

Lg,
Peter

Jeffrey B. hat gesagt…

Peter,

Thanks for the help. I managed to install it and upload 2 training texts. However, it says my volume is too low. I installed Gnome ALSA Mixer and put the capture volume all the way up and still receive this issue. I am going to try another sound program but do you have any ideas? Thank you very much for all of your help.

Jeffrey B. hat gesagt…

Peter,

I was able to fix the sound issue or so it seems. I can listen to my voice reading the texts. However, I still cant seem to use it to dicate documents or control my pc like you did in the video. I will go back and look at the training modules. Thank you very much.

Jeffrey B. hat gesagt…

Peter, Thanks for the help with adding the scenarios, however, even when adapting a base model it is not letting me dictate. Any ideas? Thank you very much.

Peter Grasch hat gesagt…

What do you mean by "dictate"? Free dictation is not supported as of Simon 0.4.0.

Do the commands of the scenarios you're using work?

Please also consider using the forum for further support: http://forum.kde.org/viewforum.php?f=216
Thank you.

Jeffrey B. hat gesagt…

Peter,

Some of them do. I was under the impression that free dictation was supported and thanks for the forum link. I will try that from now on.

Carlos Fernando De Santiago Ramirez hat gesagt…

I got a question, is it normal that the simon 0.4.0 windows version is too bugged?

Carlos Fernando De Santiago Ramirez hat gesagt…

I mean, i can not add any different category to a word different than "Unknown" (imported english VoxForge dictionary)it says:
The recognition reported the following error:
Failed to setup recognition:
Detail:

Thats everything, do you have any idea of what is happening?

Peter Grasch hat gesagt…

Hi Carlos,

No, the Windows version should be just as stable as the Linux version (AFAIK, at least).

What you're reporting does definitely not look like a platform related issue but rather a configuration problem. The error reporting of the SPHINX backend is sadly very bad for certain problems.

However, if this happens after changing a terminal from "Unknown", which I suppose is not in your grammar, to something else, which I suppose is, then this could be caused by a lot of different things - but seeing that you're using SPHINX (I presume using a base model as well) and the Voxforge dictionary, this is most likely a phoneme set issue. The SPHINX base models online are built with a modified CMU dictionary - *not* with the Voxforge dictionary.
You can find the correct dictionary by googling for "cmudict hub4" and importing that as a SPHINX dictionary in Simon. Don't forget to clear your old shadow vocabulary first.

But all this is just me going off an educated guess. If this doesn't fix your problem, please open a thread on the forum: http://forum.kde.org/viewforum.php?f=216
Thanks.

Best regards,
Peter

Carlos Fernando De Santiago Ramirez hat gesagt…

Peter Grasch, thank you so much, you were right!
I have another question, how could i set simon to recognize spanish language?

Peter Grasch hat gesagt…

Glad I could help.

To have Simon recognize Spanish you just need set up a Spanish scenario and either build or import an acoustic model.

We do provide a Spanish base model: [ES/H4X/SPHINX] Mexican Spanish News. Keep in mind that you'd need to use that models dictionary as shadow vocabulary again.
You'll likely find the used dictionary for the "Mexican Spanish Broadcast News ES MX" model on SPHINX' sourceforge page: sf.net/projects/cmusphinx

Best regards,
Peter

Carlos Fernando De Santiago Ramirez hat gesagt…

Thank you man it works! so now i have to train the words for best accuracy and thats all? this simon software feels magic

Peter Grasch hat gesagt…

Yes, if you're using no base model you need training; if you use an adapted base model you can possibly improve recognition rates through training, although I'm not sure if the Spanish base model is adaptable through Simon, tbh (it may very well not be, depending on the SPHINX built configuration).

If push comes to shove, you can still built your own acoustic model from scratch by not using a base model. You'll need a bit of training for that, though so be prepared to run through the training a couple of times (ideally until you're satisfied with the recognition rate but I'd say at least 8 times; with "Power training" ticked, it's a quick process anyway).

Best regards,
Peter

Carlos Fernando De Santiago Ramirez hat gesagt…

Ok, i used the base model HUB4 WSJ (english base model) and everything was perfect but, i tried to use no base model to train my own, and also try to use adapt base model (with the base model of: HUB4 WSJ) but i am always getting the same error:
As the server compiled the model the following error occurred:
Failed to pack to archive. Source directory does not exist ("c:/users/fernando/appdata/roaming/.kde/tmp-fernando-pc/simond/default/compile/sphinx//default{7815bd58-b70a-42ed-8526-6816eb041d62}/model_parameters/default{7815bd58-b70a-42ed-8526-6816eb041d62}.cd_semi_200/")

So i look down the path, and there is directory named: default{7815bd58-b70a-42ed-8526-6816eb041d62}.cd_semi_200_delinterp

Another wierd thing is that the first path is maybe wrong, because of the double slashes (simond/default/compile/sphinx//default...)

What do you think?

Peter Grasch hat gesagt…

Hi Carlos!

The path is fine; double slashes are legal.

Would you mind sending me the compilation base folder (in your message above this would have been "c:/users/fernando/appdata/roaming/.kde/tmp-fernando-pc/simond/default/compile/sphinx//default{7815bd58-b70a-42ed-8526-6816eb041d62}"; please compress it appropriately) so that I can take a look?
You can use something like rapidshare to upload it (as I'm assuming it's too big to mail) and then send me the link at "simon at bedahr°org".

Best regards,
Peter

Carlos Fernando De Santiago Ramirez hat gesagt…

Ready, i have posted it on http://kde-apps.org/content/show.php/Simon?content=73815
as: Problem with a Source directory existence

thank you.

Anonym hat gesagt…

What else do i need (besides simon.exe) to install Simon 0.4.0 on windows properly?

Also, how can i compile the source code on windows?

Peter Grasch hat gesagt…

You do need a lot of other libraries and system components besides simon.exe. There is a Windows installer linked in the blog post.
You can install Simon and look through the installation folder for a full list of files.

Compiling from source is - on Windows - sadly not very easy.
The quickest way is to set up emerge (techbase.kde.org/Getting_Started/Build/Windows/emerge), run "emerge simon" and tackle problems as they occur.

Best regards,
Peter

Carlos Fernando De Santiago Ramirez hat gesagt…
Dieser Kommentar wurde vom Autor entfernt.
Anonym hat gesagt…

Sorry about my bad English, but i did not understand you, do you mean i need more files or not?

If you mean i need more files, those files are under C:\Program Files\Simon\bin or what is the path?

Thank you for your time.

Peter Grasch hat gesagt…

You need *lots* of additional files to properly run Simon (thousands, actually).

You can find them in C:\Program Files\Simon.

While there are some files that are not required by Simon itself but for e.g. SSC and some file that are only required for certain Simon installations (e.g., using Julius/HTK over SPHINX drops a lot of dependencies).
But for any practical deployment these files are way too small in comparison to the big chunk that is required so that they really don't matter.

In short: If all those files wouldn't be required, we wouldn't ship them.

Anonym hat gesagt…

Will this source provide 0.4 updates?
https://launchpad.net/~simon-listens
It's still on v0.3 :(

Anonym hat gesagt…

This looks like "official" grasch ppa:
https://launchpad.net/~grasch-simon-listens
But 0.3 too

Peter Grasch hat gesagt…

Yes, I will not provide packages for anything but Windows for this release myself.

However, I'm hoping for "official" packages from the individual distributions and you might be in luck for Ubuntu:
https://launchpad.net/ubuntu/+source/simon
Thanks, Jonathan!

Jose Daniel hat gesagt…

Hi, i have this problem:

"As the server compiled the model the following error ocurred:
The SphinxTrain cannot be found.Please mase sure it is installed correctrly."

What can i do?

Peter Grasch hat gesagt…

Install SphinxTrain (>= 0.8.0) and make sure it's either in your path or you tell Simond where to find it: Configure Simon > Recognition Configure Server > Speech Model Compilation > SphinxTrain.

Best regards,
Peter

Jose Daniel hat gesagt…

@Peter

I have this problem too:

"The required speech recognition backend for this model ("%1") is not avaible. Please install it to continue..."

I didn't find the configuration options that you tell me.

Peter Grasch hat gesagt…

This is a different problem. You were missing SphinxBase / SphinxTrain / PocketSphinx in version 0.8.0 or later when you compiled Simon.

Please install them, if you haven't already done so and recompile Simon from scratch or use another base model.

Best regards,
Peter

Jose Daniel hat gesagt…

I installed all Sphinx packs that you tell me, but know i have another problem, the program show sometimes that julius doesn't start well (I installed julius in my computer too).

I use the windows voice recognition a lot in windows 7 thats why i want to use this application in linux. Simon 3.0 was more easy to use for me, i installed a lot of packages to compile simom 4.0, i don't know why is to difficult.

This is an amazing application and i thank you for all the time that you put in this project, maybe i will try it another day.

Thanks!

Peter Grasch hat gesagt…

Okay, I just assumed you're using a SPHINX base model but instead you're apparently using a HTK model (user-generated or not).

If Julius fails to start for some reason, please paste the log somewhere and I can have a look at it.

Best regards,
Peter

Jose Daniel hat gesagt…

Yes, I installed the HTK model like simon 3.0, it's that a problem?

Thanks again for your time. Have a good day.

Peter Grasch hat gesagt…

No, HTK is still completely supported.
Again, please provide the exact error messages that you get.

Best regards,
Peter

Anonym hat gesagt…

ubuntu 12.10
intallation error(...)

"
CMake Error: The following variables are used in this project, but they are set to NOTFOUND.
Please set them or make sure they are set and tested correctly in the CMake files:
X11_XTest_LIB (ADVANCED)
linked by target "eventsimulation" in directory /home/ ... /simon-0.4.0/simonlib/eventsimulation
"

i really do not know whats the problem... can anybody help me, please?

Peter Grasch hat gesagt…

You need the development files of the XTest library. The package is called libxtst-dev on Ubuntu IIRC.

This could be helpful: http://userbase.kde.org/Simon/Development_Environment#Requirements

Best regards,
Peter

Anonym hat gesagt…

Hallo,

ich habe mir die Windowsversion runtergeladen und installiert. Ich kann aber leider nicht die Dokumentation lesen.Die Hilfe greift auf eine Datei mit dem Namen index.docbook zu. Diese Datei kann nicht geöffnet werden. Wie kann ich die Dokumentation lesen?

Gruß SKu

Peter Grasch hat gesagt…

Hi,

seltsam, ich hatte die Hilfe vor dem Release auch auf Windows noch erfolgreich getestet. Manchmal hilft es die Hilfe zu schließen und wieder zu öffnen (die IO Slaves sind manchmal etwas holprig unter Windows).

Alternativ gibt es hier eine Online-Fassung (simon.pdf mit simond.pdf, etc. ersetzen für deren Dokumentation):
http://docs.kde.org/development/en/extragear-accessibility/simon/simon.pdf

Lg
Peter

Anonym hat gesagt…

Hi Peter,

die Simon.pdf geht aber die simond.pdf wird nicht gefunden.

hier mal die Fehlermeldung die dort im Fenster erscheint.

The requested help file could not be parsed:
c:/program files/simon/share/doc/html/en//simon/index.docbook

Vielleicht hilft Dir das ja weiter.

Gibt es Die Doku auch auf Deutsch?

Peter Grasch hat gesagt…

Hi,

"could not be parsed" klingt verdächtig, habe jetzt aber keine Zeit dafür.

Der Url für Simond:
http://docs.kde.org/development/de/extragear-accessibility/simond (Alternativ hier auch /simond.pdf dahinter für das PDF)
etc.

Wie du siehst, kommst du zur deutschen Dokumentation wenn du "/de/" statt "/en/" schreibst.

Lg
Peter

Alexander Bogenrieder hat gesagt…

Hallo Peter,

Danke erst einmal für dieses fantastische Projekt!
Ich habe mich die letzten Tage mit Simon beschäftigt und hätte da noch ein paar Fragen.
Zunächst habe ich Simon auf meinem Windows 7 Laptop installiert. Das vorgefertigte Controle mouse Szenario auf englisch funktioniert mit entsprechendem Sprachpaket ganz gut.
Beim deutschen Paket bekomme ich allerdings die Fehlermeldung, dass ich ein anderen Phoneme - Set benutzen solle. Ich habe mir das deutsche Sprachpaket hier heruntergeladen.
("http://www.repository.voxforge1.org/downloads/de/Tags/AcousticModels/")

Dann habe ich versucht über "Akustikmodell einrichten" und importieren die Dateien irgendwie einzulesen, aber das scheint nicht der richtige Weg zu sein ...

Danach habe ich versucht ein eingenes Szenario zu schreiben. Ich habe Wörter und eine Grammatik festgelegt und unter "Befehle" die Wörter angegeben mit denen z.B. die Tastatur erscheinen sollte...
Ist das grundsätzlich erst einmal das richtige Vorgehen?

Nach dem durchlaufen des Trainings beim erstellen des Modells, erhalte ich von Windows allerdings die Fehlermeldung : mkfa.EXE funktioniert nicht mehr und darauf hin von Simon eine Fehlermeldung "DFA kann nicht generiert werden."

Ich habe das gleiche dann auf einem Windows XP Rechner versucht und dort läuft der Modellabgleich nicht an. Nach durchlaufen des Trainings erscheint rechts unten "Modellabgleich, Wird intitialisiert ... 0%" Selbst nach Stunden tut sich leider nichts.

Tut mir leid dass ich die Fragen hier stelle aber das Forum scheint wohl nicht mehr aktiv zu sein. Vielen Dank schonmal für die ganze Mühe die du dir machst, du steckst da wirklich einiges an Herzblut hinein. Vielleicht kann man dich immerhin dadurch unterstützen unter Voxforge noch ein paar Aufnahmen hochzuladen.

Mit freundlichen Grüßen
Alex

Peter Grasch hat gesagt…

Hallo Alexander,

ja, das deutsche Voxforge Modell ist so nicht kompatibel. Der Weg war schon richtig, die Szenarios haben sich aber von diesem Modell entfernt. Ich arbeite eigentlich an einem wesentlich besseren, deutschen Sprachmodell, bin aber noch nicht dazu gekommen (und werde es so bald auch nicht), das fertig zu stellen. Erwarte aber spätestens im Sommer hier eine neue Version.

>Ist das grundsätzlich erst einmal das richtige Vorgehen?
Ja.

> mkfa.EXE funktioniert nicht mehr und darauf hin von Simon eine Fehlermeldung "DFA kann nicht generiert werden."
Das ist Julius. Leider hat Julius in der veröffentlichten Version hier einige Probleme unter Windows, das wurde uns bereits von anderen Usern auch berichtet.
Seit 0.4.0 unterstützen wir aber auch SPHINX als Alternative von Julius: Settings > Configure Simon > Recognition > Configure server > Speech Model Compilation > Backend.

> Selbst nach Stunden tut sich leider nichts.
Wenn die Synchronisation hängt starten Sie simond bitte einfach neu (z.B. einfach im Taskmanager den Prozess "simond.exe" (ja mit "d") abschießen). Das Problem ist bekannt aber auch dazu bin ich leider noch nicht gekommen.

Das Simon Forum findet sich übrigens hier: http://forum.kde.org/viewforum.php?f=216

Lg
Peter

Anonym hat gesagt…

Hallo,

ich finde dieses Projekt sehr interessant und es hat meiner Meinung nach viel Potential. Ich habe allerdings ein Problem mit dem Programm: Wenn ich ein Training beendet habe dann dauert es gerade bei großen Szenarios (54 Vokabeln) enorm lange bis das neue Modell mit den Trainingsdaten erstellt wird. Die Anzeige hängt die meiste Zeit bei 20%. Ist das normal?

This project is very interesting and I think it will be a good success. I have a problem that it takes the program very long to compile the data especially after a long training (54 words). It say 20% in most of the time. Is this normal?

Peter Grasch hat gesagt…

> Ich habe allerdings ein Problem mit dem Programm: Wenn ich ein Training beendet habe dann dauert es gerade bei großen Szenarios (54 Vokabeln) enorm lange bis das neue Modell mit den Trainingsdaten erstellt wird. Die Anzeige hängt die meiste Zeit bei 20%. Ist das normal?
Ja, das ist normal. Erfahrungsgemäß arbeitet das HTK hier wesentlich schneller, ist aber eben nicht freie Software.
Da das neu erstellen eines Modelles ja nicht so oft vorkommen wird, ist diese Zeit aber hoffentlich verschmerzbar.

> This project is very interesting and I think it will be a good success. I have a problem that it takes the program very long to compile the data especially after a long training (54 words). It say 20% in most of the time. Is this normal?
Yes, this is normal. The HTK is a substantially quicker for this in my experience, but sadly not free software. However, as compiling a new acoustic model will only happen very occasionally, the time should hopefully be manageable.

Best regards,
Peter

Anonym hat gesagt…

Hallo,

entschuldigung, dass ich noch einmal nerve: Ich habe simond (bzw. ksimond) einmal in der Konsole laufen lassen und festgestellt, dass simond ein Problem bei dem Kompilieren des Modells hat. Die Meldung wiederholt sich nach einer Zeit immer wieder: (siehe ganz unten).

Hello,
I am sorry for annoying again: I ran simond (in my case ksimond) in the bash and found out that there is a problem during the compilation of the model.The message repeats over and over again after a time:

simond(20495) ModelCompilationManagerSPHINX::run: Model compilation failed for user "default"
Analyzing file: "..."
...
Analyzing file: "..."

Peter Grasch hat gesagt…

Sie posten hier anonym, es ist für mich deshalb sehr schwer einen Kontext zu erkennen. Bitte öffnen Sie einen Thread auf http://forum.kde.org (KDE-Deutsch oder Accessibility (Englisch)) mit einer kompletten Problembeschreibung.

Danke.

Anonym hat gesagt…

Hallo Herr Grasch!

Ich möchte nochmal auf meine Frage im Januar zurückkommen. Ich fragte Sie seinerzeit, ob geplant sei, Simon Diktion beizubringen.

Ihre Antwort war:

@anfi: Konkrete Pläne sind es noch nicht, nein. FOSS Diktation ist eine sehr komplexe und zeitaufwändige Sache. Am meisten könntest du oder deine Firma eigentlich durch Unterstützung des Voxforge Projektes (http://voxforge.org) mittels Hochladen von Sprachdaten helfen.

Mir kam gerade der Gedanke, dass für meine Zwecke eine echte Diktationsfunktion gar nicht notwendig ist. Ich benötige lediglich eine Funktion die einen Sprachbefehl erkennen kann und daraufhin einen dem Befehl zugeordneten und zuvor definierten Textbaustein an Cursorposition einfügt. Wenn ich die Technik von Simon richtig verstehe, müßte das mit bereits vorhandenen Funktionen möglich bzw. leicht nachrüstbar sein.

Wäre das vorstellbar? Für mich wäre es ein "Killerfeature" :D

Agostino hat gesagt…

Hallo! Danke für Simon! =)
Ich habe die Version für Windows 32 bit heruntergeladen aber Ich erhalte eine Fehlermeldung (Windows 7): Windows Visual C++ Runtime Library ; This application has requested the Runtime to terminate in an unusual way.
Warum?

Peter Grasch hat gesagt…

Hallo!

Was genau hast du heruntergeladen und von wo?

Lg
Peter

Anonym hat gesagt…

Hallo!
Ich habe von http://download.kde.org/stable/simon/0.4.0/win32/simon-x86-setup-0.4.0.exe.mirrorlist heruntergeladen.

Peter Grasch hat gesagt…

Please download the current version from http://simon.kde.org/download

This blog, btw. is also no longer current (read the front page, please).

Anonym hat gesagt…

Danke! Wie haben Sie entdeckt, ich spreche kein Deutsch? =)

Peter Grasch hat gesagt…

Err, I'd love to say that I deduced it from the small grammatical mistake but in truth I just forgot that you wrote in German once I got back to the comment box. The Blogger user interface is ridiculously bad.

Regardless, have fun with Simon and please consider using the user forms on next time: http://forum.kde.org/viewforum.php?f=216

Best regards,
Peter

Anonym hat gesagt…

0k, nut just a question: is italian available in Simon 0.4.1?

Peter Grasch hat gesagt…

Italian base models and scenarios? No, sorry.

Anonym hat gesagt…

Hallo Pete!

Bitte ins Package eine debug-Version parallel verteilen.
Sonst kann ich Euch nicht helfen- bei mir crasht simon unter Windows beim Sprachtraining und eine Version mit debugtables fand ich nicht.
V 4.0.0 WXP.

Habt Dank!
Wenn ich Nonsens geredet habe löscht mich bitte :-)

Peter Grasch hat gesagt…

Hallo!

Bitte teste mal die aktuelle Version, herunterladbar von der Homepage: http://simon.kde.org/download

Lg
Peter

Anonym hat gesagt…

Ouh :-( Irgendwie gab's bei mir einen Versionskonflikt.
Mea Culpa. Danke.

Nun klappt's.
Nevertheless - ein Binary mit Debugtables - wenn jemand einen Absturz reproduzieren kann, ruft er die Debugversion auf und kann Euch die Infos zusenden.

Peter Grasch hat gesagt…

Super.
Ja, eine Debugversion wäre natürlich hilfreich, aber paketieren unter Windows ist schon so eine umständliche Sache. Möchtest du vlt. helfen?

Lg
Peter

Anonym hat gesagt…

Vielleicht ist es eine Option Anfaenger auf der Linux-Seite bei der Installation von HTK auch den Binary-Link fuer Linux zu geben:

(1) wget http://repository.slacky.eu/slackware-13.37/libraries/HTK/3.4.1/HTK-3.4.1-i486-5sl.txz

(2) die ausgepackten Binaries von HTK laufen auch auf Linux Mint 13. Ein Linux-Anfaenger sieht Slackware und denkt, das kann ich unter Ubuntu und Linux Mint nicht nutzen.

(3) cd /
(4) sudo tar -xvf HTK-3.4.1-i486-5sl.txz
Entpackt in /usr/bin
(5) Mit dem wget unter (1) und dem Entpacken der txz mit sudo nach /usr/bin hat mit einem Shell-Skript
z.B. install_htk.sh
einen Vierzeiler, der die Installation erleichtert.

Wenn auch nicht so erfahrene Nutzer SimonListens auf Linux mit HTK nutzen koennen, waere das ein Gewinn fuer das gemeinsame erzeugen von Sprachmodellen.

Dieser Vierzeiler als Shell-Skript in der 0.4-Docu koennte dabei helfen.

P.S. Uebrigens eine grandiose Arbeit zu "Dictation in SL0.4" - Hut ab.

(Niebert)

Anonym hat gesagt…

Ist es moeglich, den Pfad zu PocketSphinx, SphinxTrain in der SimonListens GUI einzustellen?

Simon Listens 4.0 scheint unter Linux Mint
SphinxTrain im Backend nicht zu finden, auch wenn man das aus den Repositories installiert hat.

(Niebert)

Peter Grasch hat gesagt…

Ad 1: Bitte füge das (auf Englisch) als Alternative zur HTK Installationsdokumentation hinzu: http://userbase.kde.org/Simon/Installation#Optional:_HTK_installation_2

Ad 2: Den Pfad zu SphinxTrain (bzw. dessen Utilities) kannst du in den Einstellungen (Erkennung > Server konfigurieren > Speech Model Comilation) ändern. PocketSphinx ist allerdings fest in Simond integriert (Link zur Kompilierzeit). Ich schätze, dass Linux Mint zu alte Versionen liefern wird. Du benötigst das (aktuellste) 0.8 Release und musst Simon, nach der Installation von SPHINX, neu kompilieren.

Bitte poste deine zukünftigen Nachrichten im KDE forum (http://forum.kde.org/viewforum.php?f=216). Danke.

Lg
Peter

Anonym hat gesagt…

Crowd Sourcing Ansatz fuer Voxforge in Kombination mit SL 4.0:
--------------------------------------
Crowd Sourcing funktioniert immer dann sehr gut, wenn die Nutzerinnen und Nutzer etwas fuer das Hochladen bekommen.

Kommerzielle Suchmaschine bieten eine Antwort auf Suchbegriffe und bekommen dafuer die Profildaten der Nutzer fuer massgeschneiderte Werbung.

simond laeuft als Server und bearbeitet an Anfragen von Clients (die sogar Smartphones sein koennen (Meego-Android-Client Demo). Wenn man dieses Konzept uebertraegt kann man mit einem Client die Sprachdaten schicken und erhaelt einen Textstring vom Server zurueck.

Die Texterkennung ist die Gegenleistung fuer das Hochladen der Sprachpakete.

Die erscheint dann in einer Textarea eines HTML-Fensters, dass man ggf. noch einmal korrigieren kann und mit einem erneunten submit fuer die Fehlerkorrektur der Erkennung verwenden kann.

Man muss dann wahrscheinlich bei guter Nutzung laengere Zeit auf die Antwort (erkannter Text) warten, aber vielleicht nur Leute diese einfach nur so zum Test fuer ein paar Saetze und beteiligen sich ohne Installation von SL an der Erweiterung des Sprachmodells.

(Niebert)


Peter Grasch hat gesagt…

Ich werde hier nicht mehr darauf antworten. Bitte poste deine Nachrichten in Zukunft im Forum.

Lg
Peter

Anonym hat gesagt…

Hi, thanks for making this software. I've downloaded it and set it up (scenarios, training recordings, etc), but every time I try to use it I get the message "Remote host has closed the connection." And so, thus far, I can't use it. Any ideas how to fix this please?
(Please email me at melras_13@yahoo.com, I might not see a reply comment.)

Cam.. hat gesagt…

Hi peter , really made me download after i saw the wow effect on ur video.
How can i customize this to the application i have.. Can u provide more training videos on how to work with customized applications.
Eg. How will i go compose a gmail..
wat all should i do ?

Peter Grasch hat gesagt…

Simon ships with a complete manual.

Free dictation is not yet supported, but under development.

Please also have a look at the official Simon site for more information and download instructions of the current version (0.4.1): http://simon.kde.org