LocalWhisper •

Introducción

LocalWhisper nació de un problema personal: quería practicar inglés de camino a la escuela, hablar frases y recibir correcciones, pero no me sentía cómodo hablando en público ni quería que mi audio llegara a servidores externos. La solución tenía que ser completamente privada y funcionar sin internet. El reto fue integrar tres modelos de ia corriendo en local sobre hardware de consumo normal: whisper de OpenAI para transcribir el audio, llama-3.2-3b como llm para analizar y corregir las frases, y kokoro-tts para responder en voz. Mantener todo local fue la decisión más importante — hubiera sido más fácil usar apis externas, pero eso implicaba enviar audio e historial de conversación a servidores ajenos. El costo fue la complejidad técnica: el rendimiento varía bastante entre equipos y el llm local es el eslabón más lento. Desarrollado en python con flet en 10 días. Funciona como mvp completo con los tres modelos integrados. La siguiente iteración planea migrar la interfaz a react o next js manteniendo el motor de ia local.

Cargando

Próximo proyecto

SIGA →

Python / Flask / OpenCV / Firebase / Gmail API / QR

LocalWhisper •LocalWhisper •

SIGA →

LocalWhisper •LocalWhisper •

SIGA →

LocalWhisper •

LocalWhisper •