tekerlekli sandalyeyi sesle yönetmek

Başlatan paradox, 16 Aralık 2006, 15:01:40

z

Bu iş programcılık bilgisinin ötesinde sayısal sinyal işleme bilgisi gerektirir. Algoritmaların kodlaması en son aşamadır.

Sesin 3Khz lik bir band genişliğini kapladığı düşünülürse her 166 mikrosaniyede bir örnek alıp 166 mikrosaniye içinde sıkı algoritmaların koşturulmasını garanti edecek hızda işlemciler gerekir.

http://en.wikipedia.org/wiki/Speech_recognition

http://en.wikipedia.org/wiki/Speaker_recognition
Bana e^st de diyebilirsiniz.   www.cncdesigner.com

picusta

Ben de okulda benzer bir deney maketi görmüstüm fakat üzerinde baska bir grup çalismisti, neyse ki kaynak kodunu görebildim en azindan.
TI TMS320 DSP ile yapilmisti, ses örneklerini tanimlamak için, FFT'ye benzer (galiba logu filan aliniyor) bir dönüsüm yapiliyordu.
Cepstral analiz (spectral değil) frekans yerine de quefrans diyorlardi.
Neyse, her ses örnegi belli katsayilar ile taninimlandigi için, karsilastirma bunlarla yapiliyor.
Cornell üniversitesinin sitesinde 8 bitlik Atmel ile yapmaya çalismislardi, sonuç hüsran. Orda birçok analog frekans seçici filtreden çikan sonuçlara bakiyolardi.

paradox

@picusta

  bu dediklerinden sonra umudum iyice kırılmaya başladı ama bırakmayı düşünmüyorum bu işin peşini.olmadı mikroişlemci seti kurup öle yaparım.madem mikrodenetleyiciler yetmiyo.

ama şuan için önemli olan süzgeç sanırım ve onun araştırmasını yapıyorum.

x-tol

Bu kadar büyütelecek bir şey değil bu.Ses kaydediciler ile yapılan devreler vardı.8 ayrı sesi kaydediyordun onlar mikrofona geldiğinde ilgili röleyi çekiyordu.Devrelere ulaşırsam size gönderirim.

paradox

@x-tol

sağol ilgilendiğin için fakat hazır ses kaydedici kullanmak istemiyorum.en azından projeyi bir hocama söylediğimde ses kaydedicisi ile herkes yapar aradaki devreyi sen tasarlarsan daha orjinal olur anlamında şeyler söyledi.ne tür bir mikrofon kullanabilirim ve buna bağlı olarak ne tür süzgeç kullanabilirim.

bilmiyorum ne kadar alakalı ama bir robot kol projesi var elimde.orda cmrr adında bir karşılaştııcı kullanılmış.opampla yapılmış fakat güzel süzüyo.bu mantıkla dış ortamdan süzebiliriz.belki  :roll:

ya telefonlarda kullanılan sesli aramanın aynısı aslında bu konu hakkında bilgisi olan yokmu.

picusta

Dedigim devreler :
http://instruct1.cit.cornell.edu/courses/ee476/FinalProjects/s2006/XL76_SL362/XL76%20SL362/index.html
http://instruct1.cit.cornell.edu/courses/ee476/FinalProjects/s2006/avh8_css34/avh8_css34/index.html
Bence çok çalisarak yapabilirsin. 80% tanima oranina ulasabilirsin.
Tekerlekli sandalye'ye nasil uygulayagini merak ettim. Tetraplejik kisiler için mi düsünüyorsun?
cmrr op-amp 'taki common mode rejection ratio değil mi?

paradox

arkadaşlar size olması gereken birkaç şey söyliyim ama bunları nasıl yapacağımı çıkaramıyorum.ilk etap ta sessiz ortamda (odamda) en azından  bir oyuncak arabayı sürüyüm diyorum.elimde bir kondansatör mikrofon var.pic de var eeprom da.bellek yetmez şimdi.

hız olarak sorun yaşamazsın dedi bi hocam.

mikrofondan ileri sözcüğünü pice kaydetmek için öyle bi program olacakki ses geldiğinde kayıt yapacak.yani ilk başta sessizlik arada ses ve sonraki sessizliğe kadar kayıt.yani kullanıcının söylediği tüm kelime bu şekilde kayıt yaplıacak.3 defa söyletmeyi düşünmüştüm fakat bellek sorun olabilir belki bu yüzden bir defa söyletecem.bunu adc ile belleğe kaydedelim.kullanıcı deneme yapmak istediğinde söylediği sözcüğün her biti ile kaydedilen sözcüğün her biti çarplıacak ve aynı ise sonuç daha fazla farklı ile sonuç sıfıra yakın olacak.

bu şekilde bir karşılaştırma ile olabilirmi.

picusta hocam gönderdiğin sşte için teşekkürler benzer bir uygulama sanırım fakat ingilizcem yetersiz anlamak için biraz zaman...

hacettepeli_muhendis

bu speech recognition projesi ve oldukça komplike bir iş çünkü adam her seferinle kesinlikle aynı şekilde komutu söylemeyecektir fazı kayacaktır genliği değişecektir vs vs onun için bence bunu yapacaksan "hidden markov models" konusuna çalışmaya başla bence. daha basit birşey aklıma şu geliyor  mesela sesi kaydet sonra diyelim ki ses 1sn lik 50ms de bir fft'sini al belli frekansların büyüklük değerlerini al mesela her 50ms de 5 frekans her komut 100 değer olur ki çok büyük bir vektör diyelim 4 komut var
4 tane bu vektörlerden oluştur sonra yei gelen komutada bunu uygula elinde bu durumda 4 referans vektörü 100 boyutlu ve 1 tane de gelen komut olur. burdan çeşitli pattern recognition algoritmalarıyla gelen komuta en yakın referans vektörünü bulursun mesela ne yaparsın "euclidean distance" ı  minimize edebilirsin bunuda nasıl yaparsın her referans vektörünü gelen vektörden çıkarırsın her değerin karesini alıp toplarsın bu değer hangi referans vektörüyle en küçükse bu komutun gelmiş olma olasılığı yüksektir. he birde fft yi t=0 anından değil konuşmanın başladığı anda almaya başla. sanırım bu en kolayı pic için fft yazarsan bunu pic ile yapabilirsin sanırım.
Dünyada 10 çeşit insan vardır binary saymayı bilenler ve bilmeyenler

showtime

ses kaydının bir şekilde yapıldığını varsayarsak bence asıl önemli olan karşılaştırma.

mememen

Alıntı yapılan: "paradox"arkadaşlar size olması gereken birkaç şey söyliyim ama bunları nasıl yapacağımı çıkaramıyorum.ilk etap ta sessiz ortamda (odamda) en azından  bir oyuncak arabayı sürüyüm diyorum.elimde bir kondansatör mikrofon var.pic de var eeprom da.bellek yetmez şimdi.






selam,sitede ve pic konusunda yeniyim.
paradox kardeşim,
benim projem de tamamen bu senin bahsettiğin projenin aynısı.
sen bu mesajı yazalı baya olmuş gerçi.ben henüz başlama aşamasındayım ve dediğin gibi sesle kontrol edilebilen bi oyuncak araba yapmak istiyorum.sen ne yaptın ve nasıl sonuç aldın öğrenebilirmiyim?
bu dönem vermem gerek ve sınırlı vaktim var ve dediğim gibi pic konusunda da yeniyim.
şimdiden teşekkürler.

ahmet_ozcan

yavvv çok uzatmışsınız ne var bu işi yapmakta.
ben programlama bilmiyorum ama bu işe 2 dakkada çözüm ürettim.
20 sene önce piyasaya çıkan şimdi nerdeyse hiç bulunamayan erikson telefonlarda bile olan bir özellik vardı.
SESLİ ARAMA...
telefon dediğiniz işlerin hepsini yapar zaten sesi ayrıştırır karşılaştırır vs vs.
telefonla ne yapıyoruz?
ahmet diyoruz telefon 123 çeviriyor.
mehmet diyoruz 456 çeviriyor.
ileri geri sağa sola diye ses kaydedeceksiniz.
sonra bunlara birer numara vereceksiniz en sonundada bi dtmf kod çözücü ile aranan numaraları harekete çevireceksiniz bukadar basit.
ayrıca telefonların içinde öyle hint kumaşı gibi işlemciler olduğunuda zannetmiyorum.

yada benmi çok basite aldım bu işi bilmiyorum, belkide cahil cesareti benimkisi...

Klein

:lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:

İşte pratik zekalı Türk insanı bu.

Evet mantığın doğru. Gerçi Bu telefonlar ararken DTMF kullanmıyorlar ama seri portu kullanılarak birşeyler yapılabilir. Gerçi soruyu soran arkadaşın hedefinde böyle bir çözüm olduğunu pek zannetmiyorum ama karmaşık bir meseleye pratik bir bakış açısı olması açısından çok yaratıcı bir fikir. Tebrik ederim.

Ama telefonların içindeki işlemci konusunda söylediğine katılmam pek mümkün değil. Evet olayı çok basite almışsın.

buiba

akulu bi sistem olacagi icin kayit icin paralel bir ram kullanabilirisin.

ahmet_ozcan

Alıntı yapılan: "Klein":lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:  :lol:

İşte pratik zekalı Türk insanı bu.

Evet mantığın doğru. Gerçi Bu telefonlar ararken DTMF kullanmıyorlar ama seri portu kullanılarak birşeyler yapılabilir. Gerçi soruyu soran arkadaşın hedefinde böyle bir çözüm olduğunu pek zannetmiyorum ama karmaşık bir meseleye pratik bir bakış açısı olması açısından çok yaratıcı bir fikir. Tebrik ederim.

Ama telefonların içindeki işlemci konusunda söylediğine katılmam pek mümkün değil. Evet olayı çok basite almışsın.

eh bizde birkaç üni bitirdik az çok okur yazarlığımız var.
12ye kadarda kafa çalışır bibi yapıyo :D

BELEM

Merhaba Arkadaşlar,

Ben ANKARA'da oturuyorum entegre aldığımız meşur Konya sokakta HM2007 entegresini bulamadım? Bildiğiniz başka bir yer var mı? ya da  Türkiye'de satıldığı bir yer var mı?