Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

prepoznavanje govora sa picem

[es] :: Elektronika :: Mikrokontroleri :: prepoznavanje govora sa picem

[ Pregleda: 1348 | Odgovora: 9 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

alarmi ns
Novi Sad

Član broj: 326042
Poruke: 291
*.dynamic.sbb.rs.



+2 Profil

icon prepoznavanje govora sa picem17.01.2020. u 18:54 - pre 51 meseci
Pozdrav svima imam jedno pitanje za vas rec je o decaku koji jako jako tesko prica, posto mi je jako dobra drudarica logopedica i radi sa njim pitala me je dali mogu napraviti spravicu koja ce raditi sledece, ili neki softver koji ce kada on kaze neku rec prepoznati je i reprodukovati istu tu rec ali ispravno.
Moja ideja je sledeca da vezem neko mikrafonsko predpojacalo, nadam se da ima neka lepa sema na netu i da sa picem merim oscilacije reci i da tako prepoznajem koju ce rec reci, kad prepozna rec otvoricu neki pin koji ce pustati sa malog mp3 plejera ispravnu rec , druga rec grugi pin se upali.
Sta mislite hocu uspeti sa picem da ocitam koje je koja rec, i sta bi vi vezali ispred njega(pica).Pozdrav
 
Odgovor na temu

bogdan.kecman
Bogdan Kecman
"specialist"
Oracle
srbistan

Član broj: 201406
Poruke: 15887
*.com
Via: [es] mailing liste

Sajt: mysql.rs


+2377 Profil

icon Re: prepoznavanje govora sa picem17.01.2020. u 20:40 - pre 51 meseci
ja sam gotovo siguran da to nema teorije da izvedes sa bilo kojim pic
ili dspic mikrokontrolerom :(

prepoznavanje reci je ozbiljna zaje123 i kada se iste izgovaraju
razgovetno i pravilno sa prethodnim ucenjem/treniranjem sistema na tvoj
nacin govora, prepoznavanje "frljoka" ne rade ni software-i koji trose
gigaflopse a kamoli patetiku od resursa koju imas na nekom picu, ako
napravis to sa picom da radi smesi ti se nobelova nagrada i mnogo
milijardi dinara po zelji, os americkih, evropskih, japanskih... moj
savet, ako ces da se vatas toga, napravi to prvo da radi na PC-u imas
jak procesor koliko oces rama dobar adc, iscitas adc (ili snimi par
wav-ova toga sto momak izgovori ) i napravi kod koji ce to da cita i
analizira i prepozna, ne mora uopste real time, procitaj, obradi,
prepoznaj kad zavrsis obradu posle po cuke ... pa onda vidi dal mozes da
optimizujes to u mcu
 
Odgovor na temu

mikikg
System administrator
Srbija

Član broj: 3779
Poruke: 5059
*.dynamic.sbb.rs.

Sajt: yu3ma.net


+505 Profil

icon Re: prepoznavanje govora sa picem17.01.2020. u 21:07 - pre 51 meseci
Evo jedan zanimljiv framework za prepoznavanje govora, Kaldi

http://kaldi-asr.org

To radi vrlo dobro. Mi sko to koristili u firmi pa sa tim idemo u text-analizatore (NLP) pa to vracamo u zvk sa Custom vocoderima.

Generalno, prepoznavanje i sinteza govora je ozbiljno slozena tema, sa ML modelima, treningom i tako dalje.
Obicno istrazivaci na polju NLP to sve rade u Python-u, tamo ima nltk, numpy pa i PyKaldi pa se sa tim to mucka.
Zbog ogromnih zahteva za resursima (kakav crni PIC), to sve teraju i preko GPU tj preko OpenCL ...

Najbolji rezultat do sad (za vocoder) koji smo postigli je bio oko 1000 sintetisanih slogova u sekundi na i7 serveru ...
Site about Software Defined Radio – SDR
http://yu3ma.net/
https://github.com/yu3ma
On-line LM317 kalkulator
 
Odgovor na temu

alarmi ns
Novi Sad

Član broj: 326042
Poruke: 291
*.dynamic.sbb.rs.



+2 Profil

icon Re: prepoznavanje govora sa picem17.01.2020. u 21:16 - pre 51 meseci
Hvala Bogdene,odustajem, a softver za komp ne znam da napisem, Miking jel taj softver radi na telu?Nemogu da ga otvorim
 
Odgovor na temu

mikikg
System administrator
Srbija

Član broj: 3779
Poruke: 5059
*.dynamic.sbb.rs.

Sajt: yu3ma.net


+505 Profil

icon Re: prepoznavanje govora sa picem17.01.2020. u 21:37 - pre 51 meseci
Kaldi je framework, skup vise razlicitih alata koji se bave tom temom.
Nije jedan program u pitanju, dosta je slozenije, moras pogledati dokuementaciju.
Ima tu raznih opcija ali generalno moze da sempluje sa mikrofona ili da mu se podmetne snimljen wav fajl koji kaldi analizira, daje neke medju rezultate procesiranja (XML-ovi) i na kraju daje txt fajl koji sadrzi text koji je prepoznao iz ulaznog audio fajla.
Kada imas text onda je lako dalje da procesiras i prepoznajes komande ...
Site about Software Defined Radio – SDR
http://yu3ma.net/
https://github.com/yu3ma
On-line LM317 kalkulator
 
Odgovor na temu

mikikg
System administrator
Srbija

Član broj: 3779
Poruke: 5059
*.dynamic.sbb.rs.

Sajt: yu3ma.net


+505 Profil

icon Re: prepoznavanje govora sa picem18.01.2020. u 11:24 - pre 51 meseci
Steta sto je postavljacu teme koliko posle prvog odgovora u temi sve ovo postalo manje zanimljivo a posle drugog odgovora totalno ne zanimljivo :)

Vrlo je zanimljiva ova tema ali zaista vrlo komplikovana ...

Evo samo jedan mali sample kako radi nas vocoder, WAV fajl u prilogu.

Mi uzmemo napisemo text i prebacimo u zvuk preko vocodera, onda taj fajl prosledimo Kaldi-u koji od tog audio ponovo napravi text i onda sitentisemo ponovo audio ali sa drugim glasom ... nesto po principu "gluvih telefona" ... tako testiramo sistem ... :)
Site about Software Defined Radio – SDR
http://yu3ma.net/
https://github.com/yu3ma
On-line LM317 kalkulator
Prikačeni fajlovi
 
Odgovor na temu

mikikg
System administrator
Srbija

Član broj: 3779
Poruke: 5059
*.dynamic.sbb.rs.

Sajt: yu3ma.net


+505 Profil

icon Re: prepoznavanje govora sa picem18.01.2020. u 11:37 - pre 51 meseci
Inace ovo nisam nikako skontao kako radi, mali uredjaj koji radi prevodjenje sa jezika na jezik (2-way voice) u realnom vremenu bez Internet konekcije!
Kako su to sve unutra spakovali i sa cime nemam pojma ... Ima vise takvih razlicitih uredjaja u ponudi ...

https://www.amazon.com/dp/B07W...751a022b4e3b8a6b2d6bbcf4de7d11

Ah izvinjavam se, ovaj gore uredjaj trazi internet konekciju, ima ih i bez, ne mogu sad da nadjem ...
Site about Software Defined Radio – SDR
http://yu3ma.net/
https://github.com/yu3ma
On-line LM317 kalkulator
 
Odgovor na temu

mikikg
System administrator
Srbija

Član broj: 3779
Poruke: 5059
*.dynamic.sbb.rs.

Sajt: yu3ma.net


+505 Profil

icon Re: prepoznavanje govora sa picem18.01.2020. u 13:00 - pre 51 meseci
Ipak ima resenja za MCU platforme, evo ovi kazu da su spakovali u 1M Flash-a recnik za max 1000 reci, potpuno off-line, radi sa ML modelima koji mogu bit kompatibilni sa Kaldi:
https://www.sensory.com/products/technologies/trulynatural/

Tu je i NXP sa nekim svojim kontrolerima:
https://www.nxp.com/design/des...-voice-control:MCU-LOCAL-VOICE

Ima i za Raspberry Pi neka on-line i off-line resenja:
https://maker.pro/raspberry-pi...tion-software-for-raspberry-pi
Site about Software Defined Radio – SDR
http://yu3ma.net/
https://github.com/yu3ma
On-line LM317 kalkulator
 
Odgovor na temu

alarmi ns
Novi Sad

Član broj: 326042
Poruke: 291
*.dynamic.sbb.rs.



+2 Profil

icon Re: prepoznavanje govora sa picem19.01.2020. u 07:37 - pre 51 meseci
Naopako nije mi nezanimljivo, samo sam imao haos ova dva dana u radionici, danas cu da probam da istestiram ove programe.Puno hvala
 
Odgovor na temu

mikikg
System administrator
Srbija

Član broj: 3779
Poruke: 5059
*.dynamic.sbb.rs.

Sajt: yu3ma.net


+505 Profil

icon Re: prepoznavanje govora sa picem20.01.2020. u 11:06 - pre 51 meseci
Evo jedan "ozbiljan" HW sa podosta procesorske snage koji moze da se iskoristi za prepoznavanje/sintezu govora i NLP:

NVIDIA-Jetson-Nano
https://www.seeedstudio.com/NV...17344c70&mc_eid=75e6986e2c

Jetson Nano Module
128-core NVIDIA Maxwell™ GPU
Quad-core ARM® A57 CPU
4 GB 64-bit LPDDR4
10/100/1000BASE-T Ethernet

Citat:
Note
We provide a wide selection of AI related products including Machine Learning, Computer Vision, Edge Computing, Speech Recognition & NLP and Neural Networks Acceleration.


Tu je glavni "adut" NVIDIA Maxwell™ GPU, to koriste za dodatno procesiranje, GPU sa svojih 128 jezgra radi matematiku uzasno brzo ....
Site about Software Defined Radio – SDR
http://yu3ma.net/
https://github.com/yu3ma
On-line LM317 kalkulator
 
Odgovor na temu

[es] :: Elektronika :: Mikrokontroleri :: prepoznavanje govora sa picem

[ Pregleda: 1348 | Odgovora: 9 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.