Xiaomi ha desarrollado un modelo de reconocimiento de voz ultrarrápido y lo ha hecho OpenSource

Por: Viktor Tsyrfa | hoy dia, 10:09
Echemos un vistazo al YU7: Lo que esperan los visitantes del nuevo showroom de tecnología Salón YU7. Fuente: Xiaomi Blog

Xiaomi ha desarrollado un módulo de reconocimiento de voz llamado MiDashengLM-7B. Al utilizar redes neuronales en lugar de algoritmos fijos, la compañía logró el rendimiento de reconocimiento de voz más rápido en 22 pruebas sintéticas. Esto hace posible construir plataformas para usuarios que funcionan con casi ninguna demora. El modelo se puede utilizar en teléfonos inteligentes, sistemas de hogar inteligente, coches, etc.

MiDashengLM-7B analiza el audio al instante, separando sonidos ambientales o música. Xiaomi ya está aplicando activamente este modelo de voz en la práctica en sus productos, por ejemplo, el automóvil YU7 analiza constantemente el sonido y puede detectar el sonido de rasguños o cristales rotos, lo que permite activar la alarma incluso cuando no hay un impacto que pueda ser detectado por el sensor de movimiento.

Xiaomi ha publicado el código fuente para el avanzado modelo de voz bajo la Licencia Apache 2.0, así como documentación detallada sobre el entrenamiento y la implementación de la tecnología. El modelo puede servir como base para desarrolladores e investigadores académicos que buscan crear sistemas de voz abiertos sin dependencia de ecosistemas cerrados.

Las empresas chinas no son conocidas por trabajar en proyectos de código abierto. Al hacer el modelo de lenguaje abierto, Xiaomi atrae a más desarrolladores, lo que ayudará a que este producto compita en igualdad de condiciones con los análogos de grandes corporaciones tecnológicas. La experiencia ha demostrado que productos de software grandes y complejos, como un sistema operativo o un navegador, se desarrollan más rápido y se vuelven más competitivos si son desarrollados por una comunidad abierta de programadores en lugar de una sola empresa.

Fuente: xiaomitime.com