Obsah:
- Krok 1: Požadované materiály a soubory
- Krok 2: Krok 2: Další informace naleznete v souboru Voicehat.py
- Krok 3: Krok 3: Přidejte zvukový kód spouště do ukázkového kódu
- Krok 4: Krok 4: Spusťte kód a ujistěte se, že je vše v pořádku
- Krok 5: Krok 5: Vytvořte si vlastní soubor.wav
- Krok 6: Krok 6: Přidání potvrzovacího zvuku?
2025 Autor: John Day | [email protected]. Naposledy změněno: 2025-01-13 06:57
Tento návod je velmi jednoduchý. Opravdu se mi líbí Google AIY Voice Kit, ale opravdu se mi líbí na mém normálním Google Home hluk, který vydávají, aby potvrdili, že aktivně poslouchají. Toto není ve výchozím nastavení nastaveno v žádném z příkladů, které jsou předem načteny v obrázku AIY Voice Kit.
Také zahrnuji odkaz na základní a potvrzovací zvuky, které jsem zaznamenal ze svých skutečných domovů Google pomocí rekordéru Zoom.
Tady jsme-můj první instruktáž!
Krok 1: Požadované materiály a soubory
- Plně funkční Google AIY Voice Kit-pro nastavení vaší sady navštivte oficiální stránku AIY Voice Kit.
- Možnost přístupu k vašemu terminálu Pi přes SSH, VNC nebo pomocí monitoru a klávesnice
- . Wav soubor, který chcete přehrát, když Pi poslouchá hlasový vstup-Pokud nepoužíváte vlastní soubor, stáhněte si zde standardní soubor „St art Talking“nebo jej stáhněte z přiloženého odkazu.
- (Volitelné) Zvukový editor, který dokáže převádět soubory a měnit jejich bitovou a vzorkovací frekvenci
Krok 2: Krok 2: Další informace naleznete v souboru Voicehat.py
DŮLEŽITÉ
Ve své hlasové sadě nepoužívám nejnovější obrázek, který obsahuje kód pro hlasovou i vizuální sadu (tj. Aiyprojects-2018-01-03.img). Používám kód z větve Voice Kit, který lze nalézt na Google AIY Raspbian GitHub. Můj osobní názor je použít větev Voice Kit, aby byla jednoduchá a při práci s hlasovou sadou nemusel řešit kód Vision
Posouvat se…
Tento krok není zcela povinný, ale ukáže vám, kam Google zakopal pokyny, jak tento postup zprovoznit, pokud to chcete udělat o krok dále nebo porozumět tomu, proč kód, který přidávám, funguje.
pi@raspberry: cd AIY-voice-kit-python/src/aiy/
Poté se podíváme na soubor voicehat.py v této složce:
pi@raspberry: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py
Přiložený obrázek ukazuje, kde se můžete dozvědět o stavových uživatelských rozhraních a jak používat zvuk během spouštění.
Dobře, teď pojďme přidat nějaký kód do jednoho z ukázkových souborů, aby tato věc fungovala.
Krok 3: Krok 3: Přidejte zvukový kód spouště do ukázkového kódu
Nejprve přejděte do složky AIY-voice-kit-python a spusťte zdrojový kód
cd AIY-voice-kit-python
zdroj env/bin/aktivovat
cd src
Poté použijte 'sudo nano' do 'assistant_grpc_demo.py' nebo 'assistant_library_demo.py'
Rozdíl mezi těmito dvěma soubory je ten, že assistant_grpc_demo.py používá tlačítko ke spuštění Google Assistant a assistant_library_demo.py používá aktivační slovo „Ok, Google“ke spuštění Google Assistant.
U obou těchto souborů stačí přidat JEDEN řádek kódu:
status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')
To předpokládá, že jste svůj počáteční zvuk umístili do složky/home/pi/a pojmenovali jej googlestart.wav. Změňte je podle toho, jak jste soubor pojmenovali, a podle toho, kde jste jej umístili.
Řádek kódu, který hledáme, je níže:
status_ui.status ('poslech')
Chceme přidat náš nový řádek kódu PŘED tímto řádkem kódu…
Příklad 'assistant_library_demo.py' najdete zde:
elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:
# A nyní přidejte náš kód status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('poslech')
Příklad 'assistant_grpc_demo.py' najdete zde:
button.wait_for_press ()
# A nyní přidejte náš kód status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('poslech')
To předpokládá, že jste svůj počáteční zvuk umístili do složky/home/pi/a pojmenovali jej googlestart.wav. Změňte je podle toho, jak jste soubor pojmenovali, a podle toho, kde jste jej umístili.
Stisknutím CTRL-X & Y vše uložíte.
*** POZNÁMKA: Našel jsem něco trochu praštěného. Zdá se, že pro 'assistant_library_demo.py' přidání zvuku spouště nemá žádný vliv na funkci rozpoznávání řeči. Zdá se však, že pro 'assistant_grpc_demo.py', když máte implementovaný zvuk spouště, odřízne první nebo dvě slova, která řeknete. Nejsem si úplně jistý, proč. Stále se snaží přijít na to.
Krok 4: Krok 4: Spusťte kód a ujistěte se, že je vše v pořádku
pi@raspberry: cd AIY-voice-kit-python
a načtěte virtualenv
pi@raspberry: ~/AIY-voice-kit-python $ source env/bin/aktivovat
a spusťte to!
(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_library_demo.py
nebo
(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_grpc_demo.py
Nyní řekněte „Dobře, Google“nebo stiskněte toto tlačítko a zjistěte, zda to funguje!
Následující stránka vám pomůže, pokud máte vlastní soubor a odpovídající bitové a vzorkovací frekvence pro váš soubor.wav
Krok 5: Krok 5: Vytvořte si vlastní soubor.wav
Pokud vás nezajímá použití mého souboru.wav standardního úvodního zvuku Google Home, budete si muset vytvořit vlastní soubor.wav. Trvalo to trochu pokusů a omylů, než mi fungoval správný bit a vzorkovací frekvence.
K úpravám jsem použil Logic Pro X (na obrázku), což je plnohodnotný DAW pro tvorbu a produkci hudby. Dvě možnosti, které jsem našel, by mohly být vhodné, jsou Switch nebo MediaHuman Audio Converter. Předpokládám, že byste to mohli udělat s Garagebandem, pokud máte Mac, ale nezkoušel jsem to.
K práci s demo kódem jsou zapotřebí tři klíčové části vašeho souboru.
- Musí to být zvukový soubor MONO
- Vzorkovací frekvence musí být 32 000
- Musí to být soubor.wav
- (Volitelné) Nejlépe se mi osvědčilo 16bitové rozlišení
Krok 6: Krok 6: Přidání potvrzovacího zvuku?
Tady jsem uvízl, pokud má někdo nějaké myšlenky. Rád bych přidal potvrzovací šum, pokud systém rozpoznává hlasový vstup jako na běžném Google Home.
Pro vaše pohodlí přikládám níže potvrzovací hluk.
Užívat si!