
MultimodalBerry
Caratteristiche principali
MM-Berry è un framework con il quale è possibile sviluppare applicazioni vocali in maniera rapida e senza dover conoscere i
dettagli a basso livello delle tecnologie sottostanti.
La libreria consiste in una serie di dll e un header file (.h).
Le dll contengono l’implementazione di tutta la logica delle tecnologie vocali utilizzate e del VuiManager.
L’header file mette a disposizione del programmatore l’interfaccia per l’interazione con il VuiManager.
La struttura della libreria è stata pensata appositamente per poter nascondere all’utilizzatore finale tutti i dettagli relativi all’implementazione. L’header file infatti presenta solamente tipi di dati standard e non fa nessun riferimento ad oggetti di basso livello.
Grazie a MM-Berry è possibile scrivere applicazioni multimodali nei linguaggi C++, Java e .NET.
Esiste infatti una implementazione completa di MM-Berry per Java e una per l’ambiente .NET.
- Pronunciare frasi.
- Gestire code di frasi, associando ad ognuna una priorità.
- Mantenere il controllo del motore di sintesi.
- Riconoscere il parlato, basandosi su grammatiche BNF.
- Precaricare grammatiche BNF o binarie.
- Rimanere in attesa indefinita affinché non venga riconosciuto il parlato (wakeup).
- Costruire dialoghi uomo-macchina: la macchina domanda e riconosce la risposta dell’utente.
- Gestire il bargein in modalità push-to-talk.
- Generare file di log.
- Analizzare file di log.
- Utilizzo di routines esterne per eventi di posizione e stato.
- Catturare gli eventi di match, nomatch, noinput e timeout.
- Analizzare confidence e utterance organizzati in una apposita struttura dati.
I motivi principali per cui utilizzare il MultiModal Berry:
- Rapidità nello sviluppo di applicazioni senza conoscere i dettagli a basso livello delle tecnologie vocali.
- Algoritmi di Voice Activity Detection (VAD) già implementati.
- Algoritmi di PushToTalk già implementati.
- Diversi linguaggi supportati: C++, Java, .NET.
Maggiori informazioni : info@byteway.it
