Kategorizace rozpoznávání hlasu: 4 kroky (s obrázky)
Kategorizace rozpoznávání hlasu: 4 kroky (s obrázky)
Anonim
Image
Image
Kategorizace rozpoznávání hlasu
Kategorizace rozpoznávání hlasu
Kategorizace rozpoznávání hlasu
Kategorizace rozpoznávání hlasu

Pro kurz TfCD IPD Master na TU Delft.

Toto je návod, jak vytvořit systém rozpoznávání hlasu. Vysvětlujeme základy a nastavení tohoto projektu pomocí Arduino a BitVoicer. Po dokončení základů věříme, že můžete tento systém používat podle svých představ.

Krok 1: Příprava výstupu: Vaše Arduino a Box

Příprava výstupu: Vaše Arduino a Box
Příprava výstupu: Vaše Arduino a Box
Příprava výstupu: Vaše Arduino a Box
Příprava výstupu: Vaše Arduino a Box
Příprava výstupu: Vaše Arduino a Box
Příprava výstupu: Vaše Arduino a Box

Potřebujete své Arduino, několik vodičů a LED (tři budou stačit). Zapojili jsme LED diody do pinů 3, 5 a 6 (všechny piny PWM, i když je nepoužíváme). Pamatujte si, že v tomto kurzu se zaměříme na metodu zadávání: rozpoznávání hlasu. Nesoustředili jsme se proto na výstup tohoto systému a ponechali jsme jej poměrně jednoduchý.

Abychom předvedli použití této technologie, vyrobili jsme krabici, do které jsme vložili 3D tištěná ložiska pro kolenní implantáty. Myšlenka je, že máte spoustu různých položek a musíte najít ten správný. Rozhodli jsme se to demonstrovat malým, středním a velkým předmětem symbolizujícím ložisko pro kolenní implantát. Aby to bylo jasnější, rozhodli jsme se použít zelenou LED pro malou velikost, žlutou LED pro střední velikost a červenou pro velké.

Krok 2: Nastavení nástroje BitVoicer

Nastavení nástroje BitVoicer
Nastavení nástroje BitVoicer

První věc, kterou musíte udělat, je aktivovat váš produkt v nabídce Nápověda> aktivovat. To vám umožní posílat data z Bitvoicer do vašeho mikrokontroléru (Arduino).

Dále chcete nastavit Bitvoicer, aby ve skutečnosti používal Arduino ke konfiguraci svého výstupu. Přejděte na soubor> předvolby. Zde vidíte několik možností:

Nevadí první odstavec. To jsou zřejmé možnosti, které vám umožní otevřít a spustit systém rozpoznávání hlasu, jakmile se počítač spustí. Později to můžete zvážit pomocí Raspberry Pi a vytvořit samostatný systém.

Dále uvidíte následující možnost:

Jazyk rozpoznávání řeči: určení, který jazyk by BitVoicer měl rozpoznat, Přijatelná úroveň spolehlivosti: Uvědomte si, že rozpoznávání hlasu „předpovídá“to, co bylo řečeno. Možná to nikdy nedosáhne 100%, ale 40% už může stačit k efektivní práci. To závisí na přízvuku uživatele, hlasitosti řeči nebo mikrofonu. K tomu se vrátíme později.

Minimální úroveň zvuku: Minimální úroveň zvuku, kterou by měl počítač poslouchat

Perioda aktivovaná na úrovni zvuku (ms): doba, po kterou by měla poslouchat po dosažení minimální úrovně zvuku

Latence period: Zpoždění mezi vaším hlasovým příkazem a výstupem.

V dalším odstavci byste měli zrušit zaškrtnutí deaktivovat komunikaci. To umožňuje Bitvoiceru komunikovat s Arduinem. Následující nastavení jsou Název portu, Bity za sekundu, parita, stop bity, řízení toku. Nastavte Název portu na správný sériový port (toto je pojmenováno COMX, kde X je číslo, najdete jej pod nápovědou> port v Arduinu). Ujistěte se, že vaše Bity za sekundu jsou 9600. Ostatní možnosti můžete ponechat jako výchozí.

V dalším odstavci použijeme mikrofon počítače.

Nyní jste připraveni hrát s Bitvoicerem.

Krok 3: Použití nástroje Bitvoicer

V tomto videu vysvětlíme, jak používat Bitvoicer.

Krok 4: Kód Arduino

Použili jsme jiný zdrojový kód a zjednodušili jsme ho, abychom jej mohli používat. Zjednodušenou verzi s instrukcemi najdete v připojeném kódu Arduino. (Zdroj můžete vidět zde

A je to! Nyní můžete použít hlasové příkazy jako vstup a rozhodnout, jaký výstup chcete v arduino kódu.

www.youtube.com/watch?v=u8QUKTFdQgU