Suark Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 Şimdi bitirmeyle uğraşıyorumda, yapacağım şey hakkında kafamda iyice bir gidiş yolu oluşsun istiyorum. Bir kaç kitap kurcaladım da istediğimi bulamadım, e dedim nete bakayım ilk burası geldi aklıma basit bişe iki insan sesi arasında sadece dalga boyu farkı mı var? yani aynı ses şiddetinde konuştuğumuzu düşünürsek benimle A kişisi arasında ki ses farkı sadece dalga boyundan mı kaynaklanıyor?
Waqas Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 Tam emin degilim ama voice recognition bunun uzerine dayali zaten. Bilgisayarlar bir matrix cikartiyor ve dalga boylarina gore islem yapiyorlar ama tam emin degilim.
Suark Mesaj tarihi: Ekim 5, 2008 Konuyu açan Mesaj tarihi: Ekim 5, 2008 voice rec. bela bişi, ona girmeden yanından felan geçicem =) ya bakındım şimdi pitch diye bişi var sadce dalga boyu yetmıyor mus
Ardeth Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 İlk bakışta en önemli fark frekans farklılığı olmalı diye düşünüyorum. Onun dışında bir ses dalgasını ayıracak başka özellikler de vardır; hız (bu ortamın yapısıyla daha çok ilgili diye düşünüyorum dolayısıyla insandan insana aynı ortamda önemli bir farklılık göstermez), senin dediği gibi dalgaboyu ve dalgayüksekliği. Gerçi eğer burda olduğu gibi sesin hızında bir farklılık olmadığını var sayarsak da frekansla dalgaboyu arasında direk bir ilişki oluyor :p Ama, bunun için sadece dalgaların özelliklerini çalışman yetmez. Beynin bir zaman aralığında aldığı sürekli bir veriyi nasıl değerlendirdiğini anlaman lazım. Yani biraz neurobiyoloji bakmanı ve bunu dalganın özellikleri açısından değerlendirmeni tavsiye ederim. Misal beynin algıladığı dalgalar zaman zaman süperpozisyon halinde gelebilir, bunların ayırt edilmesi veya süperpozisyona* uğrayan dalgaların frekansları arasındaki fark ne kadar olunca bunlar ayırt edilebilir falan filan. Bir fizik kitabında görmüştüm dalgalarla ilgili ama malesef işim bittiği için kütüphaneye geri verdim onu sdf. Şu tarz birşeye bakmak isteyebilirsin ama http://en.wikipedia.org/wiki/Music_and_the_brain *:dalga süperpozisyonu dalgaların üst üste binmesi ve dalganın yapısını değiştirmesi
Venator Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 Dalgaboyu = 1/frekans Ses, genelde bir çok karmaşık sinyal gibi "tek" bir dalgaboyundan oluşmaz birden çok frekanstaki sinyalden oluşan karmaşık yapılı bir sinyaldir. Herhangi bir ses dalgasını inceleyecek olursan zaten tek başına bir periyodu yani dalgaboyu yokmuş gibi gelecektir, ama vardır. 20Hz-20KHz dışındaki sesleri duyamayız zaten, o yüzden bizim için bu aralıktakiler önemli. Her frekansın tonu diğerlerinden farklıdır. Düşük frekanslarda, 100Hzde giden bir ses dalgası ise olay mesela, bass sesi duyarsın. Saf 10KHzdeki ses sana inanılmaz tiz ve rahatsız edici gelecektir. Herhangi bir ses, örneğin insan sesi 20Hz ile 20KHz arasındaki değişik frekanslardaki ses dalgasının bir araya gelmesiyle oluşum. Bu frekans aralığındaki dağılım faktörü de sesin özelliğini belirler. Nedir bir faktör, basitçe bir frekanstaki ses sinyalinin gücüdür. Bu da dalganın yüksekliği ile alakalıdır. Örneğin, bir bass gitar hem tiz hem mid hem de bass frekanslarında ayrı ayrı sesler üretecektir; ancak bass frekansındaki sesi daha güçlü olacaktır aka. sinyal daha yüksek olacaktır. İnsan sesinin ortalama bir dağılımı var mı bilmiyorum ama insandan insana, hatta aynı insanda günden güne değişebildiğini biliyorum (örneğin hastaysanız). Nota dedğimiz şeyler de belirli frekanslardan başka şeyler değildir. Örneğin 2. oktavda la (atıyorum tam değerini bakmaya üşendim) 832.4 Hzdir. Yine, insan sesi belirli frekansların karışımından oluşur diyebilirsek belirli notaların karışımı da diyebiliriz. Eğer tam olarak anlamadıysan, bir modern synthesizerda ses üretmeye çalış (işini bilen bir DJ bile olabilir). Ya da kendi voltage controlled oscillator'unu uret sonra hoparlore bagla :P Orada olan olay su. Normal karısık bir ses dalgası yerine synthesizer sadece tek bir frekansta ( ve onun harmoniklerinde yani katlarında ) ses üretir. Bir tane kullanırsan ve onunla oynarsan garip pink floydvari sesler dışında birşey üretmediğini görürsün. Ama birkaç tanesini karıştırırsan tanıdık sesleri çıkarabilmeye başladığını farkedebilirsin. Her neyse, sorunun cevabı şu: İki insan arasında sadece 20Hz-20KHz arasındaki frekans dağılımı farkeder. E harfini söyleyecekse ikisi de, yaklaşık olarak (eğer bir aksan ya da söyleyiş hızı farkı olmadığını farzedersen) aynı zamanlarda sinyal peak yapacaktır ve inecektir. Ancak sesin genel olarak tonu kaymış olacaktır. Speech recognition algoritmaları basit olarak bu prensibe dayanır zaten. Daha fazla sinyal ve fourier bilgisine girmeden detaylı nasıl anlatabilirim bilemedim :)
Suark Mesaj tarihi: Ekim 5, 2008 Konuyu açan Mesaj tarihi: Ekim 5, 2008 yav gir gir sorun deil, tek sorunum şu 2 sesi birbirine çeviricem micro işlemciyi ona gore programlıcam ama orendımkı pitch die bişi varmıs dalgaboyundan farklı olarak onu bı sorucam yarın bakam =) pitch pitch bilen var mıdır?
Venator Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 Pitch = fundamental frequency. Harmonik olmayan en basit ve düşük frekanstaki sesi demek. Edit: Eeoo basit bir mikroişlemci ile yapacaksan baya baya kastıracak bir iş o aslında. Başlangıç için digital signal processing (DSP) setlerini öneririm daha iyi sonuç alırsın. Edit2: Hatta daha da ileri gideyim, bir insanın ya da bişeyin sesini algılayıp sonra frekans kaydırması vs. yaparak başka birinin sesine benzetmek istiyorsan, ilk başta o sesin özelliğini çıkarmak için sana bir spectrum analyzer çok faydalı olabilir.
Ardeth Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 mikroişlemci falan filan diyorsan daha hardcore girilebilir tabi konuya ki bunlardan en önemlisi fourier analizi olacaktır. ben müzik üzerine uygulamasını görmüştüm dersin sonunda. misal müzik aletlerinin seslerinin modellenmesinde en önemli buluş her aletin çıkardığı ses dalgasının belirli harmonikleri olması yanısıra yüksek harmoniklerin daha çabuk ölmesidir (decay). Bunları uygulayacak filtreleri kullanmadığın zaman ses dijital ve donuk çıkar, ama iki tane filtre ile (biri low pass olacak böylece zamanla yüksek harmonikleri öldürecek) bunu halletmek mümkün idi. Diğer filtreyi tam olarak açıklayamıyorum şuan hatırlamadığım için ama temel amacı frekansı sürekli bir şekilde gezebilmekti (yani istediğimiz zaman 340 ila 700 arasındaki herhangi bir frekansa sürekli bir şekilde ulaşabilmek). Öte yandan ses analizi yapacaksan o sesin spektrum analizini yapman gerekecektir muhtemelen venatorün dediği gibi bunun için de fourier analizi kullanman kaçınılmaz gibi. fourier analizi ile aldığın sesin temel frekanslarını bulabilirsin, yine sampling teorem gibi güzel bir teorem sayesinde uygun bir örnekleme frekansına (sana gelen sesten ne kadar sıklıkta data noktası alabildiğin) sahipsen ve gelen sesin temel frekanslarına sahipsen, ses dalgasını tamamen oluşturman mümkün. Bu tarz şeylerin detayına inmeden aşinalık kazanırsan fena olmayabilir. Benim bulduğum bir net kitabı vardı fourier analizi uygulamaları hakkında, eğer bulabilirsem koyarım buraya
Venator Mesaj tarihi: Ekim 5, 2008 Mesaj tarihi: Ekim 5, 2008 Ardeth said: mikroişlemci falan filan diyorsan daha hardcore girilebilir tabi konuya ki bunlardan en önemlisi fourier analizi olacaktır. ben müzik üzerine uygulamasını görmüştüm dersin sonunda. misal müzik aletlerinin seslerinin modellenmesinde en önemli buluş her aletin çıkardığı ses dalgasının belirli harmonikleri olması yanısıra yüksek harmoniklerin daha çabuk ölmesidir (decay). Bunları uygulayacak filtreleri kullanmadığın zaman ses dijital ve donuk çıkar, ama iki tane filtre ile (biri low pass olacak böylece zamanla yüksek harmonikleri öldürecek) bunu halletmek mümkün idi. Diğer filtreyi tam olarak açıklayamıyorum şuan hatırlamadığım için ama temel amacı frekansı sürekli bir şekilde gezebilmekti (yani istediğimiz zaman 340 ila 700 arasındaki herhangi bir frekansa sürekli bir şekilde ulaşabilmek). Öte yandan ses analizi yapacaksan o sesin spektrum analizini yapman gerekecektir muhtemelen venatorün dediği gibi bunun için de fourier analizi kullanman kaçınılmaz gibi. fourier analizi ile aldığın sesin temel frekanslarını bulabilirsin, yine sampling teorem gibi güzel bir teorem sayesinde uygun bir örnekleme frekansına (sana gelen sesten ne kadar sıklıkta data noktası alabildiğin) sahipsen ve gelen sesin temel frekanslarına sahipsen, ses dalgasını tamamen oluşturman mümkün. Bu tarz şeylerin detayına inmeden aşinalık kazanırsan fena olmayabilir. Benim bulduğum bir net kitabı vardı fourier analizi uygulamaları hakkında, eğer bulabilirsem koyarım buraya 2 filtre ile alacağın ses ile de time domainde çok kayıp yaşarsın, yankı gibi abuk etkiler duymaya başlarsın. Orjinal sinyali hangi frekansta sample ettiğin önemli; 44KHz'in üstünde ki mikroişlemci ile çok rahat sorun yaşamaz. O kısmı kolay. Zor olan kısmı, tekrar üretmek istediği sesi insan sesine uygun biçimde çıkarmak. Frekansı kaydırdım hemen oldu gibi basit bişey değil bu çünkü. Abi fourier'i adam bi zahmet yapmasın. Spectrum analizi yapabilmesi için yeteri kadar yazılım, parası varsa da hazır donanım var. Fourier bilmene bile gerek yok, altında yatan konsept o sadece. Ayrıca kardeşim ucundan bildiğin konulara da bulaşma böyle bakiym, bu konuda yetkili kişi ben oluyorum burda :P Mikroişlemciye 44KHz'de bir dijital data alacak, sonra bu dataya FFT ile spectrum analizi yapacak bir program yazman ilk aşamada yeterli olur. O kadar da zor değil FFT algoritmaları bulabilirsin nette. Daha sonra, tam olarak ne yapmak istediğine göre başka bir algoritma daha yazacaksın ama tam ne istediğini anlamadığımdan bişi diyemedim bu aşamada :) Bir sorun, devamlı olarak bunu çalıştıramazsın mikroişlemcide zira FFT o kadar da basit bir kod değil aynı anda mikroişlemci FFT hesaplarken data da alamaz. Yani bir ses dosyasını yorumlayabilirsin ama devamlı olarak update edemez mikroişlemci spectrum bilgisini. Böyle bişeye ihtiyacın varsa, real-time çalışman gerekiyorsa DSP chiplerine yönelmeni tavsiye ederim. Yok bana sadece bi dosya ya da kısıtlı zamandaki ses bilgisi lazım diyorsan o zaman herhangi bir mikroişlemci olur.
GEd Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 fourier ile ses analizi yaparsaniz pek bisi elde edemezsiniz.(en iyi sonucu elde edemezsiniz yani) Wavelet veya wigner villie trafo arti low pass combosu kullanmak daha mantıklı fouriere göre. (ki en iyi sonuc wigner villiede dir) fourier ile Short time fourier (belirli alanda filtreliyerek yani analiz edebilirsiniz ama alinan sonuclar pek hayra alemet olmaz cunku hem time hem frequenz spektrumda istediginiz netligi alamazsiniz, birinden birine ödün vermek gerekir. konuyla alakasi yokda yukaridaki mesajlari gorunce yaziyim dedim.
Ardeth Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 fourier analizini ve transformasyonunu anlamadan nasıl wavelet konseptini anlayacaksın peki? hayır ben daha wavelet almadım ama fizik bölümünde aldığım fourier analizi dersinde önce fourier analizi öğrenin sonra wavelet dersi alırsınız denildi sdf ha tabi wavelet yapmanın ezbere otomatik bir yolu varsa ona bişey diyemem ama wavelet zor bir konudur dendi bana. tabi bize fourier analizinin uygulamasından çok o uygulanamanın geliştirilmesi sırasında çıkan teoremler ispatlar ve matematik kısmı anlatıldı. sanırım wavelet derken de hoca o tarz bir waveletten bahsediyordu :p
GEd Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 wavelet zaten fourier transformasyonun üstüne geliştirilmiş bir metod. ses sinyali analizi için STFT kullanabilirsin, yani short time fourier burda belirli bir alanı filtreleyip normal fourier veya inner product uygularsın. ( filtreliyip frequenz kaydırması STFT) ama sinyaller için belirsizlik ilkesinden dolayı her iki alanda iyi sonuçlar elde edilemez. wavelette ise filtreleme ve skalierung (filtrenin boyut ayarlaması yapılır ve sadece kompakt filtreler kullanılır (informasyon kaybı az olsun diye) ,yani fourier dediginde akla STFT geliyor ve STFT de en iyi sonuçlar elde edilemiyor. fourier bilmek lazım tabi wavelet anlamak için sonuç olarak son adım fourier çünkü(yani sinyallerin karşılaştırılması) :) , aynı şekilde wigner villie içinde öyle .( wignel villiede mesela time-frequenz autokorrelation un iki kere fourier uygulanmış hali)
Venator Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 İnsan sesi ya da muzik çok karışık ve de içinde çok fazla gereksiz frekans bulunduran bir olay olduğundan, FFT ile yaparsan bişeyler kaybedersin evet ( özellikle çok sinyaldeki sert köşeleri falan fourier analizinden sonra üretmeye çalışırsan ölürsün ). Periyodik sinyaller için fourier daha temiz ama ses o kadar periyodik değil, o yüzden haklısın evet hehe :) Ancak sinyal bilgim wavelet'i kapsamadığından nasıldır ne kadar işe yarar nasıl uygularsın bilemeyecem. Ne kadar kaliteli bir ses çıkışın olmasını istiyorsun tamamen ona bağlı. Ya bu arada neden STFT de FFT değil? Sinyalin fazı çok önemli değil diye biliyorum ben ses konusunda, insan kulağı fazı algılayamıyor çünkü. Bişey mi kaçırıyorum?
GEd Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 ses sinyalları sabit frekanslı değildir ,zamanla birlikte frekansları değişir. Şöyle düşünelim, bir müzik parçası var bunu dinliyoruz ve klasik fourier transformasyonu ile analiz ediyoruz, ancak klasik fourier ile sadece frekans analizi yapabileceğimiz için sadece hangi notaların çalınmış olduğunu bulabiliyoruz , ama bu notaların hangi zamanda çalındıklarını bilmiyoruz, burda STFT devreye giriyor yani bir nevi matematiksel kulağımız. Uygun bir filtre ile (uygun filtre konusu biraz sorunlu ama önemli değil şimdilik) sinyalimizi frekansının değişmediği kabul edebileceğimiz bir zaman aralıgında sınırlıyoruz ve o aralıkta analizimizi yapıyoruz, daha sonra filtremizi kaydırarak bütün sinyal parçasını analiz ediyoruz. Bu sayede aynı anda hem zaman hem de frekans alanlarında gerekli bilgileri elde ediyoruz. STFT nin bir çok sorunu var , seçilen filtrelerin bir çok özelliği var ama kısaca bu yani ses sinyallarinin analizi. Bu tarz frekansı sabit olmayan sinyal analizleri için FFT yöntemi (yani kısa hesap yöntemi) wavelet packet dediğimiz bir yöntem, wavelet transformasyona dayali gelişmiş bi yöntem. linki okumadım gerçi ama gerekli başlık bu sanırım ; http://en.wikipedia.org/wiki/Time-frequency_representation
Venator Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 Aah çok mantıklı, bir nota için FFT yeterli ama koca bir şarkıya FFT uygularsan sıçarsın doğru :) Uzun bi yazı yazıyodum sonra farkettim ki anlattığım şey aynen STFT olmuş, evet aslında belirli bir frekansta sinyali sample edip parçalar halinde FFT yapınca STFT oluyor. Wavelet teorisini o kadar iyi bilmiyordum bak şimdi iyi oldu bu :P
huun Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 bana bi kere bi proje gelmişti. radyodur tv dir vs medyada çalan şarkıların kimin şarkısı olduğunu, kaç kere çalındığını beliryebilecek bir program yapabilir misin gibisinden. ben danıştım takımıma, " hassiktir" diye cevap verdik. varsa yapabilecek olan iyi para var.
ses Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 özür diliyorum yapmadna geçmeyim dedim:D Buyrun benim?
huun Mesaj tarihi: Ekim 8, 2008 Mesaj tarihi: Ekim 8, 2008 aquila said: yapilmisi var onun. echelon bile var, sen yapabilir misin?
Ardeth Mesaj tarihi: Ekim 9, 2008 Mesaj tarihi: Ekim 9, 2008 huun said: bana bi kere bi proje gelmişti. radyodur tv dir vs medyada çalan şarkıların kimin şarkısı olduğunu, kaç kere çalındığını beliryebilecek bir program yapabilir misin gibisinden. ben danıştım takımıma, " hassiktir" diye cevap verdik. varsa yapabilecek olan iyi para var. google mı istedi onu sdf
Suark Mesaj tarihi: Ekim 9, 2008 Konuyu açan Mesaj tarihi: Ekim 9, 2008 Gittim hocaya, hocam büle büle ben yapabilir miyim projeyi dedim. Ozan o seni aşar dedi, her insanın farklı gırtlak yapısı var onu alman lazım ayrıca işin içine duygular falan giriyor çok zor yapamassın sen çok çok uğraştırır dedi. Sesi hızlandırma-yavaşlatma ( bozmadan ) bide kadın sesi çocuk sesi tarzında çıkarma procesi aldım, namı diğer pitch analizi onlarla oynama felan filan.
Öne çıkan mesajlar