StepFun lance StepAudio 2.5 Realtime : modèle vocal en temps réel avec RLHF et compréhension paralinguistique
8/10StepFun, laboratoire d'IA basé à Shanghai, a présenté en mai 2026 StepAudio 2.5 Realtime, un modèle vocal LLM en temps réel avec des capacités de personnalisation de rôle via RLHF. Ce modèle supporte le chinois et l'anglais, communique via une API WebSocket, et s'est classé premier sur cinq dimensions de benchmark, affirmant sa supériorité technique dans la synthèse vocale IA.
