
El reconocimiento de voz o “speech recognition” siempre ha sido una historia más de frustraciones y promesas que de resultados. Es cierto, en las última(s) década(s) se han hecho avances en el reconocimiento de voz, y en Internet se le han agregado metadatos, pero para la gran mayoría de las aplicaciones, el audio sigue siendo una ‘caja negra’.
Alex Castro es el nombre a tener en mente: este ingeniero de 32 años cree tener en sus manos el algoritmo (llamado HearHere) que espera convertirá a su portal pluggd en el nuevo Google del audio. Imaginen el alcance que tendría esto para discapacitados, la industria de avisos en audio, y para todo el mundo del audio hablado en general. Notable innovación.
Aquí pueden encontrar el demo de cómo funciona esta cosa. Y aquí hay un ejemplo con el discurso del State of the Union de este año.


1 Comentario »
1 Rodrigo Gomez // Ago 2, 2007 a las 14:13
La otra vez vi en un documental ( o leí en un blog) que hoy ya se ha logrado duplicar la voz de alguien.. de hecho hay personas que estan estudiando dejar fuera toda la evidencia judicial que se base en grabaciones de voz…
No logre ubicar la fuente, lo lamento.
Dejar un comentario »