Obsah:
2025 Autor: John Day | [email protected]. Naposledy změněno: 2025-01-13 06:57
Pro kurz TfCD IPD Master na TU Delft.
Toto je návod, jak vytvořit systém rozpoznávání hlasu. Vysvětlujeme základy a nastavení tohoto projektu pomocí Arduino a BitVoicer. Po dokončení základů věříme, že můžete tento systém používat podle svých představ.
Krok 1: Příprava výstupu: Vaše Arduino a Box
Potřebujete své Arduino, několik vodičů a LED (tři budou stačit). Zapojili jsme LED diody do pinů 3, 5 a 6 (všechny piny PWM, i když je nepoužíváme). Pamatujte si, že v tomto kurzu se zaměříme na metodu zadávání: rozpoznávání hlasu. Nesoustředili jsme se proto na výstup tohoto systému a ponechali jsme jej poměrně jednoduchý.
Abychom předvedli použití této technologie, vyrobili jsme krabici, do které jsme vložili 3D tištěná ložiska pro kolenní implantáty. Myšlenka je, že máte spoustu různých položek a musíte najít ten správný. Rozhodli jsme se to demonstrovat malým, středním a velkým předmětem symbolizujícím ložisko pro kolenní implantát. Aby to bylo jasnější, rozhodli jsme se použít zelenou LED pro malou velikost, žlutou LED pro střední velikost a červenou pro velké.
Krok 2: Nastavení nástroje BitVoicer
První věc, kterou musíte udělat, je aktivovat váš produkt v nabídce Nápověda> aktivovat. To vám umožní posílat data z Bitvoicer do vašeho mikrokontroléru (Arduino).
Dále chcete nastavit Bitvoicer, aby ve skutečnosti používal Arduino ke konfiguraci svého výstupu. Přejděte na soubor> předvolby. Zde vidíte několik možností:
Nevadí první odstavec. To jsou zřejmé možnosti, které vám umožní otevřít a spustit systém rozpoznávání hlasu, jakmile se počítač spustí. Později to můžete zvážit pomocí Raspberry Pi a vytvořit samostatný systém.
Dále uvidíte následující možnost:
Jazyk rozpoznávání řeči: určení, který jazyk by BitVoicer měl rozpoznat, Přijatelná úroveň spolehlivosti: Uvědomte si, že rozpoznávání hlasu „předpovídá“to, co bylo řečeno. Možná to nikdy nedosáhne 100%, ale 40% už může stačit k efektivní práci. To závisí na přízvuku uživatele, hlasitosti řeči nebo mikrofonu. K tomu se vrátíme později.
Minimální úroveň zvuku: Minimální úroveň zvuku, kterou by měl počítač poslouchat
Perioda aktivovaná na úrovni zvuku (ms): doba, po kterou by měla poslouchat po dosažení minimální úrovně zvuku
Latence period: Zpoždění mezi vaším hlasovým příkazem a výstupem.
V dalším odstavci byste měli zrušit zaškrtnutí deaktivovat komunikaci. To umožňuje Bitvoiceru komunikovat s Arduinem. Následující nastavení jsou Název portu, Bity za sekundu, parita, stop bity, řízení toku. Nastavte Název portu na správný sériový port (toto je pojmenováno COMX, kde X je číslo, najdete jej pod nápovědou> port v Arduinu). Ujistěte se, že vaše Bity za sekundu jsou 9600. Ostatní možnosti můžete ponechat jako výchozí.
V dalším odstavci použijeme mikrofon počítače.
Nyní jste připraveni hrát s Bitvoicerem.
Krok 3: Použití nástroje Bitvoicer
V tomto videu vysvětlíme, jak používat Bitvoicer.
Krok 4: Kód Arduino
Použili jsme jiný zdrojový kód a zjednodušili jsme ho, abychom jej mohli používat. Zjednodušenou verzi s instrukcemi najdete v připojeném kódu Arduino. (Zdroj můžete vidět zde
A je to! Nyní můžete použít hlasové příkazy jako vstup a rozhodnout, jaký výstup chcete v arduino kódu.
www.youtube.com/watch?v=u8QUKTFdQgU