STM32 ile konuşma tanıma
STM32 ile konuşma tanıma
Merhaba STM32’nin mikrofonu ile konuşma yapıldıgında bir kaç satırlık kodla koda yazdıgımız kelimeleri tanımlayabiliyor.Bu sesi işlemeden nasıl mümkün oluyor?
Örnek Proje
Merhaba,
Paylaştığınız örnek projede konuşma tanıma için sinyal işleme kullanılmaktadır.
Bu projede konuşma tanıma işlemi için MFCC (Mel-Frequency Cepstral Coefficients) tekniği ve DTW (Dynamic Time Warping) algoritması kullanılmış. Basitçe anlatmak gerekirse MFCC, ses sinyalinin insan kulağında algılanma şekline yakın bir şekilde ifade edilmesi tekniğidir. DTW ise iki zaman serisinin benzerliğini karşılaştırmaya yarayan bir algoritmadır. Tanımak istediğiniz kelimeler önceden bir MFCC şablonuna dönüştürülüp lookup table’a koyulur. Uygulama sırasında mikrofondan alınan ses sinyali MFCC haline dönüştürülüp, DTW algoritması kullanılarak doğru kelime olup olmadığına karar verilir.
Daha detaylı bilgi için aşağıdaki linkleri inceleyebilirsiniz.
MFCC:
https://medium.com/prathena/the-dummys-guide-to-mfcc-aceab2450fd
https://www.analyticsvidhya.com/blog/2021/06/mfcc-technique-for-speech-recognition/
DTW:
https://betterprogramming.pub/how-to-do-speech-recognition-with-a-dynamic-time-warping-algorithm-159c2a1bb83c
https://towardsdatascience.com/dynamic-time-warping-3933f25fcdd