LocalWhisper •


Cargando
01Base del proyecto
Cliente y contexto •
LocalWhisper nació de un problema personal: quería practicar inglés de camino a la escuela, hacer frases y que alguien me dijera si estaban bien o mal, pero no me sentía cómodo hablando en público. La solución tenía que ser privada, sin depender de servicios externos.
02Problema a resolver
El reto •
Integrar tres modelos de IA distintos que corrieran completamente en local, sin conexión a internet, con un rendimiento aceptable en hardware de consumo normal. Cada procesador ejecuta los modelos de forma diferente, lo que hace que la experiencia varíe mucho entre equipos.
03Ejecución
Rol •
Diseñé la arquitectura completa del sistema y desarrollé la app en Python con Flet. Integré Kokoro para síntesis de voz, Whisper para transcripción de audio y un LLM local para la evaluación de frases en inglés.
04Dirección del trabajo
Decisiones clave •
La decisión más importante fue mantener todo local. Hubiera sido más fácil usar APIs externas, pero eso implicaba enviar audio e historial de conversación a servidores ajenos. El costo de esa decisión fue la complejidad técnica: el LLM local es el eslabón más débil, con respuestas lentas e inconsistentes dependiendo del equipo.
05Cierre
Resultado •
El proyecto está en estado MVP. Funciona, cumple su propósito principal y tiene los tres modelos integrados. Flet resultó ser una plataforma limitada para interfaces ricas, por lo que la siguiente iteración planea migrar la interfaz a React o Next.js manteniendo el motor de IA local.
Próximo proyecto
Python / Flask / OpenCV / Firebase / Gmail API / QR