Obsah:
- Krok 1: Nastavte úložiště Google Cloud Storage
- Krok 2: Formátujte svá data a vytvořte datovou sadu Csv
- Krok 3: Nahrajte své spektrogramy do svého úložiště
- Krok 4: Nahrajte soubor dat Csv
- Krok 5: Vytvořte datovou sadu
- Krok 6: Vytvořte svůj model AutoML
- Krok 7: Otestujte svůj model
- Krok 8: Nainstalujte si model do ThinkBioT
Video: Část 2. Model ThinkBioT s Google AutoML: 8 kroků
2025 Autor: John Day | [email protected]. Naposledy změněno: 2025-01-13 06:57
ThinkBioT je navržen tak, aby byl „Plug and Play“, s modely TensorFlow Lite kompatibilními s Edge TPU.
V této dokumentaci se budeme zabývat vytvářením spektrogramů, formátováním vašich dat a používáním Google AutoML.
Kód v tomto kurzu bude napsán v bashu, takže bude kompatibilní s více platformami.
Závislosti
- Před začátkem však budete muset nainstalovat Sox zvukový program příkazového řádku kompatibilní se zařízeními Windows, Mac a Linux.
- Pokud používáte zařízení se systémem Windows, nejjednodušší způsob, jak spouštět bash skripty, je přes Git, takže bych doporučil a stáhl a nainstaloval to jako užitečné v mnoha ohledech,
- K úpravám kódu použijte buď svůj oblíbený editor, nebo si nainstalujte NotePad ++ pro Windows nebo Atom pro jiné operační systémy.
** Pokud máte stávající model TensorFlow nebo si chcete vyzkoušet přenos učení s existujícím modelem, podívejte se do dokumentace Google Coral.
Krok 1: Nastavte úložiště Google Cloud Storage
1. Přihlaste se ke svému účtu Gmail (nebo si jej vytvořte, pokud účet Google nemáte)
2. Přejděte na stránku výběru projektu a vytvořte nový projekt pro své soubory modelů a spektrogramů. K dalšímu postupu budete muset povolit fakturaci.
3. Navštivte stránku https://cloud.google.com/storage/ a stiskněte tlačítko Vytvořit segment v horní části stránky.
4. Zadejte požadovaný název segmentu a vytvořte kontejner, který bude akceptovat výchozí nastavení.
Krok 2: Formátujte svá data a vytvořte datovou sadu Csv
Navrhl jsem užitečný skript pro vytvoření souboru dataset.csv potřebného k vytvoření vašeho modelu. Soubor datové sady propojuje obrázky ve vašem segmentu s jejich štítky v datové sadě.
1. Stáhněte si úložiště ThinkBioT z GitHub a
2. Zkopírujte soubor tbt_spect_example.sh z adresáře Tools do nové složky na ploše.
3. Přidejte zvukové soubory, které chcete ve svém modelu použít, a vložte je do složek, které mají svůj štítek (tj. Do čeho byste je chtěli řadit. Pokud byste například chtěli identifikovat psy nebo kočky, můžete mít složku pes, se zvuky kůry NEBO složka s názvem kočka s kočičími zvuky atd.
4. Otevřete soubor tbt_spect_example.sh pomocí programu Poznámkový blok ++ a v řádku 54 nahraďte „yourbucknamename“názvem svého úložiště Google Storage Bucket. Pokud by se například váš kbelík nazýval myModelBucket, řádek by se změnil na
bucket = "gs: // myModelBucket/spectro-data/"
5. Spusťte kód zadáním následujícího do terminálu Bash, kód se spustí a vytvoří na vašem stole csv soubor štítků a adresář zvaný spektro-data s výslednými spektrogramy.
sh tbt_spect_example.sh
Krok 3: Nahrajte své spektrogramy do svého úložiště
Existuje několik způsobů, jak nahrát do úložiště Google, nejjednodušší je provést přímé načtení složky;
1. Klikněte na název svého segmentu na stránce úložiště Google.
2. Vyberte tlačítko „UPLOAD FOLDER“a vyberte adresář „spectro-data/“vytvořený v posledním kroku.
NEBO
2. Pokud máte velké množství souborů, můžete ručně vytvořit adresář „spectro-data/“výběrem „CREATE FOLDER“, poté přejděte do složky a vyberte „UPLOAD FILES“. To může být skvělá volba pro velké soubory dat, protože můžete nahrávat spektrogramy v sekcích, dokonce i za použití více počítačů ke zvýšení rychlosti odesílání.
NEBO
2. Pokud jste pokročilý uživatel, můžete také nahrávat prostřednictvím služby Google Cloud Shell;
gsutil cp spectro-data/* gs: // your-bucket-name/spectro-data/
Nyní byste měli mít kbelík plný docela hezkých spektrogramů!
Krok 4: Nahrajte soubor dat Csv
Nyní musíme nahrát soubor model-labels.csv do vašeho adresáře „spectro-data/“v Google Storage, je to v podstatě stejné jako v posledním kroku, pouze nahrajete jeden soubor místo mnoha.
1. Klikněte na název svého segmentu na stránce úložiště Google.
2. Vyberte tlačítko „NAHRAJTE SOUBOR a vyberte soubor modelu-labels.csv, který jste vytvořili dříve.
Krok 5: Vytvořte datovou sadu
1. Nejprve budete muset najít AutoML VIsion API, může to být trochu složité! Nejjednodušší způsob je vyhledat „automl vision“ve vyhledávacím panelu v úložišti Google Cloud (na obrázku).
2. Jakmile kliknete na odkaz API, budete muset API povolit.
3. Nyní se nacházíte na řídicím panelu AutoML Vision (na obrázku), klikněte na tlačítko nové sady dat a vyberte možnost Single label a možnost „Select a CSV file“. Poté zahrnete odkaz do souboru model-labels.csv do svého úložiště. Pokud jste se řídili tímto návodem, bude to podle níže uvedeného
gs: //yourBucketName/spectro-data/model-labelsBal.csv
4. Poté stiskněte Pokračovat a vytvořte svou datovou sadu. Vytvoření může nějakou dobu trvat.
Krok 6: Vytvořte svůj model AutoML
Jakmile obdržíte e -mail s oznámením, že byla vytvořena vaše datová sada, jste připraveni vytvořit nový model.
- Stiskněte tlačítko VLAK
- Vyberte typ modelu: Odhady latence a Edge latence modelu: Edge TPU a ponechte ostatní možnosti jako výchozí, těžké, můžete experimentovat později.
- Nyní bude váš model trénovat, bude to nějakou dobu trvat a dostanete e -mail, až bude připraven ke stažení.
Poznámka: Pokud tlačítko Train není k dispozici, můžete mít problémy s datovou sadou. Pokud máte méně než 10 z každé třídy (štítku), systém vám nedovolí vycvičit model, takže možná budete muset přidat další obrázky. Pokud potřebujete vysvětlení, stojí za to se podívat na video Google AutoML.
Krok 7: Otestujte svůj model
Jakmile obdržíte e -mail o dokončení modelu, kliknutím na odkaz se vrátíte do rozhraní AutoML Vision API.
1. Nyní si budete moci zobrazit své výsledky a matici zmatků pro váš model.
2. Dalším krokem je otestování vašeho modelu, přejděte na „TEST & USE“nebo „PREDICT“kupodivu se zdá, že existují 2 uživatelské GUI, obě jsem si představil, ale obě možnosti mají stejnou funkčnost.
3. Nyní můžete nahrát testovací spektrogram. K vytvoření jednoho spektrogramu můžete použít program tbt_make_one_spect.sh z ThinkBioT Github. Jednoduše jej vložte do složky s vlnou, kterou chcete převést na spektrogram, otevřete okno (nebo terminál) Git Bash a použijte níže uvedený kód, který nahradí váš název souboru.
sh tbt_make_one_spect.sh vašeWavName.wav
4. Nyní jednoduše nahrajte spektrogram a zkontrolujte svůj výsledek!
Krok 8: Nainstalujte si model do ThinkBioT
Chcete -li použít svůj nový lesklý model, jednoduše vložte model a soubor txt do složky CModel;
pi> ThinkBioT> ClassProcess> CModel
Nyní jste připraveni používat ThinkBioT:)
** Pozn. ** Pokud používáte svůj model mimo rámec ThinkBioT, budete muset upravit svůj štítek jako doplněk na začátek každého řádku, protože nejnovější integrovaná funkce „readlabels“tlumočníků tflite předpokládá, že tam jsou. Napsal jsem vlastní funkci do rámce ThinkBioT classify_spect.py jako práci, kolem které můžete použít svůj vlastní kód:)
def ReadLabelFile (cesta_souboru):
čítač = 0 s otevřeným (cesta_souboru, 'r', kódování = 'utf-8') jako f: lines = f.readlines () ret = {} pro řádek v řádcích: ret [int (counter)] = line.strip () counter = counter + 1 return ret