STM32 ile konuşma tanıma

154 görüntülenmeSTM32 MCUs

STM32 ile konuşma tanıma

Merhaba STM32’nin mikrofonu ile konuşma yapıldıgında bir kaç satırlık kodla koda yazdıgımız kelimeleri tanımlayabiliyor.Bu sesi işlemeden nasıl mümkün oluyor?

hemantnile/stm32-speech-recognition: Its a stm32f4 discovery based project. It recognizes 6 spoken words and selects appropriate output (github.com)

Örnek Proje

MertH Cevaplanan soru Mayıs 18, 2022
0

Merhaba,

Paylaştığınız örnek projede konuşma tanıma için sinyal işleme kullanılmaktadır.

Bu projede konuşma tanıma işlemi için MFCC (Mel-Frequency Cepstral Coefficients) tekniği ve DTW (Dynamic Time Warping) algoritması kullanılmış. Basitçe anlatmak gerekirse MFCC, ses sinyalinin insan kulağında algılanma şekline yakın bir şekilde ifade edilmesi tekniğidir. DTW ise iki zaman serisinin benzerliğini karşılaştırmaya yarayan bir algoritmadır. Tanımak istediğiniz kelimeler önceden bir MFCC şablonuna dönüştürülüp lookup table’a koyulur. Uygulama sırasında mikrofondan alınan ses sinyali MFCC haline dönüştürülüp, DTW algoritması kullanılarak doğru kelime olup olmadığına karar verilir.

Daha detaylı bilgi için aşağıdaki linkleri inceleyebilirsiniz.

MFCC:
https://medium.com/prathena/the-dummys-guide-to-mfcc-aceab2450fd

https://www.analyticsvidhya.com/blog/2021/06/mfcc-technique-for-speech-recognition/

DTW:
https://betterprogramming.pub/how-to-do-speech-recognition-with-a-dynamic-time-warping-algorithm-159c2a1bb83c
https://towardsdatascience.com/dynamic-time-warping-3933f25fcdd

empa Durumu yayınlanmak üzere'ye değiştirildi Mayıs 18, 2022
0