Sayısal Tekniklerle Ses Tanıma

Başlatan TeamTurk, 29 Haziran 2006, 22:19:34

arges

Eger kabul ederseniz (moderatorde kabul ederse) soyle birsey yapalim,
Proteus ta cok guzel calisan microphone modeli var. Bir pic secelim dsPIC bile olmasin mesela Pic18F4620 uygun. En yuksek ornekleme frekansini  5Khz secelim. Proetus ta calisan ve sadece sil ile gir sesini ayirt edebilen bir proje yarismasi yapalim. Proje suresini makul bir sure belirleyelim (en fazla sureyi isteyenin suresini kabul edelim - bana yaklaşik 2 hafta yeter - haftalik 20 saat ders yukum var). Projeye katilanlari belirleyelim (iddiasi olanlar - bunalmis ve ben dahil). Projeye katilanlar belli bir miktar para yatirsin (seklini ve yontemini moderator belirlesin) . Proje sonunda kazanana bir odul alalim (mesela CCS compiler).

sizin elinizde simdiden calisan bir suru yontem var. Kimse sizin soylediginiz yontemleri kullanmasin siz istediginiz yontemi kullanin.
Nasil olur?
The whole is equal to the sum of parts(Euclid)... The whole is greater than the sum of its parts(Max Wertheimer)...

arges

NOT: Bu arada benim CCS compiler'e ihtiyacim yok. Kendime ait lisanli bir adet var. Yanlis anlasilmasin. Aldigim odulu okula (9 Eylul Universitesi Muh. Fak. Elektronik Bolumu) bagislayacagima soz veriyorum.
The whole is equal to the sum of parts(Euclid)... The whole is greater than the sum of its parts(Max Wertheimer)...

t2

Kumara benziyor, yakışık almaz. Kaybeden yemek ısmarlasın gibi. O da kumar.

Yapacağınız şey önemli birşeye benziyor. Bununla kazanılacak ödülün çok daha fazlasını elde edebilrisiniz.

FullMetal

#18
Alıntı yapılan: arges - 19 Ekim 2010, 11:32:26
Convolution ile FFT aynı mantığa sahip değildir. Birisi zaman domeninde digeri frekans domeninde calisir. Convolution da zaman onemlidir. Radarla ucagi kestirebilirsin ancak sesteki patternleri bulamazsin. Cunku zamana baglidir. ben a sesini 1 sn uzatarak soylerim, 15 dk sonra 3 sn uzatarak soylerim sen bu a'lari ayni paternmiş gibi yakalayamazsin. Frekans domenine gecersen ancak zamandan bagimsiz calisabilirsin.

"Burada amaç ADC den gelen her bir örneğin romdaki örneklerle bire bir eşleşip eşleşmediğine bakmak değil bu pencere aralığında alınan  örnek grubunun romdaki  gruplara ne kadar daha çok benzediğine bakmaktır.
Belli bir eşiği geçen benzerlik durumunda ADC den alınan örnekler romdakine bayağı benziyor o halde konuşan kişi bu kelimeyi söylemiş olabilir sonucuna ulaşlır."
demissin. Bu genlik icin dogru olabilir. ancak zaman farkini benzerlikten yakalayamazsin.

Sende convolution'la yada cross-correlation'la speech recog yaparsan (hadi soyle birde esneklik taniyalim. sadece kendi sesin olsun)  tarihe gecersin .

Yanlış yazmışsınız. "Convolution" hem zaman hem de frekans domeninde uygulanabilir. FFT ise sinyali frekans domenine aktarmak için kullanılır. Kısaca birisi zaman domeninde diğeri frekans domeninde çalışır denemez.

Ayrıca Cross-correlation kullanarak iki sinyal arasındaki benzerlik ölçülebilir. Eğer konuşma seslerinin öz nitelikleri sadece frekansları ise cross-correlation ile frekans domeninde sinyallerin benzerliklerini ölçüp karar verme ihtimaliniz var.

Bu arada siz galiba DEU Elektrik-Elektronik Müh. bölümü değil başka bir bölümdesiniz. İsminizi önceden hiç duymadım.

z

Alıntı yapılan: arges - 20 Ekim 2010, 12:37:25
Eger kabul ederseniz (moderatorde kabul ederse) soyle birsey yapalim,
Proteus ta cok guzel calisan microphone modeli var. Bir pic secelim dsPIC bile olmasin mesela Pic18F4620 uygun. En yuksek ornekleme frekansini  5Khz secelim. Proetus ta calisan ve sadece sil ile gir sesini ayirt edebilen bir proje yarismasi yapalim. Proje suresini makul bir sure belirleyelim (en fazla sureyi isteyenin suresini kabul edelim - bana yaklaşik 2 hafta yeter - haftalik 20 saat ders yukum var). Projeye katilanlari belirleyelim (iddiasi olanlar - bunalmis ve ben dahil). Projeye katilanlar belli bir miktar para yatirsin (seklini ve yontemini moderator belirlesin) . Proje sonunda kazanana bir odul alalim (mesela CCS compiler).

sizin elinizde simdiden calisan bir suru yontem var. Kimse sizin soylediginiz yontemleri kullanmasin siz istediginiz yontemi kullanin.
Nasil olur?

FFt teknigi ile sizden bir sey yapmanizi beklemiyorum ki? Bu zaten uygulamasi olan bir yontem. Ben ise sizin imkansiz dediginiz zaman domenindeki islemlerle basit bir uygulamadan bahsediyorum.

Bu uygulamayi da belli ki sen yapamayacaksin ve sikbogaz etmezsen bira ara ben size gonderecegim.
Bana e^st de diyebilirsiniz.   www.cncdesigner.com

arges

Sayin FullMetal
yanlis falan yok.
Alıntı YapBelli bir pencere aralığında mikrofandan alınan ses örnekleri romdaki mevcut patern ile karşılaştırılır bunun için convolution, cross-correlation gibi tekniklerden yararlanılır.
cumlesine cevap olarak yazdim.

Bunu bilmeseydim
Alıntı YapIlk makalede iyice incelemeden onun icin yolladiniz oysa orada spectral convolution yapip cross-corelation ile benzerlik arastiriyordu.)
yada FFT gibi yontemlerle ugrasmayalim.

demezdim.

Alıntı YapAyrıca Cross-correlation kullanarak iki sinyal arasındaki benzerlik ölçülebilir. Eğer konuşma seslerinin öz nitelikleri sadece frekansları ise cross-correlation ile frekans domeninde sinyallerin benzerliklerini ölçüp karar verme ihtimaliniz var.

Burda ne demek istediginizi de anlamadim.  Ben zaten;
Alıntı YapSimdi bunlara bakarak bu is olur diyorsak  TeamTurk un AD kanalindan yapmaya calismasina da olur demek zorundayiz.
o zaman Convolution, cross-corelation gibi (cross-corelation bir algoritma değil bir karsilastirma yontemdir ayrica. Algoritmanin sonunda benzerliklere bakmak icin kullanilir. Baslibasina bir siniflandirma algoritmasi değildir. Ilk makalede iyice incelemeden onun icin yolladiniz oysa orada spectral convolution yapip cross-corelation ile benzerlik arastiriyordu.)
yada FFT gibi yontemlerle ugrasmayalim.
demistim.

Alıntı YapBu arada siz galiba DEU Elektrik-Elektronik Müh. bölümü değil başka bir bölümdesiniz. İsminizi önceden hiç duymadım.
olabilir. adini yazarsan tanisabiliriz. yada bolum hocalarina sorabilirsin .
The whole is equal to the sum of parts(Euclid)... The whole is greater than the sum of its parts(Max Wertheimer)...

arges

sayin bunalmis,
Alıntı YapBu uygulamayi da belli ki sen yapamayacaksin ve sikbogaz etmezsen bira ara ben size gonderecegim.

gercekten iki heceyi yada harfi dogru ayiran sizin soylediginiz gibi (zaman domaininde orneklenen isaretle) bir uygulama yapamam.
Eger yaparsan ve en azindan %90 basari yakalayabilirsen gercekten kutlarim sizi.
The whole is equal to the sum of parts(Euclid)... The whole is greater than the sum of its parts(Max Wertheimer)...