/cyb/ - Cyberia

Telémoveis são computadores.


Nova Resposta
Nome
×
Opção
Assunto
Mensagem
Ficheiros Máx 6100MB total
Tegaki
Password
Especial
[Nova Resposta]


>>/sobre/ >>/css/


1667608897659813.png
[Esconder] (186.5KB, 512x512)
Como faço pra fazer um programa que transcreve letras de musica para texto?
Respostas: >>8774
Letras de música tipo notas numa pauta ou letras no sentido de alguém a cantar? É porque são coisas completamente diferentes, a segunda usa alguma forma de speech recognition e a primeira no limite usa computer vision...
Respostas: >>8774 >>8776
>>8772 (OP) 
Ambas vão dar a problemas resolvidos com IA, se não tens ninguem a dar-te algo já feito e treinado então bem podes esquecer porque isso vai requerer aprender bastante.
>>8773
Ambas vão dar a problemas que vão ser resolvidos com redes neuronais acho eu
Respostas: >>8775
>>8774
Se for ler as notas de uma imagem de uma pauta com computer vision safa-se sem IA. As matriculas de carros etc. eram lidas sem nada disso (talvez já não seja verdade hoje) mas pode beneficiar bastante de uma rede neuronal. Essa até era possível treinar ele mesmo. Acho que o OpenCV facilita bastante.
>>8773
No sentido de cantar. É impossivel escutar coisa underground em outras linguas. 
As vezes o som parece legal, mas vai la saber o que estão falando.
Respostas: >>8777
>>8776
O youtube tentou com aquelas legendas auto-geradas e não funciona assim tão bem... Eu não sei se vai ser fácil conseguir algo melhor.
https://github.com/openai/whisper
[Nova Resposta]
6 respostas | 1 ficheiro
A ligar...
Denunciar/Moderar

Acões:

Captcha:

Onde estão os animais?
NotíciasRegrasFAQStreamDoar

Todas as marcas registadas, direitos de autor, comentários e ficheiros neste site são propriedade e responsabilidade dos seus respectivos autores e proprietários. Só um louco levaria o que aqui é escrito a sério.