9月12日|據小米技術消息,近日,小米集團AI實驗室新一代Kaldi團隊發佈了基於Flow Matching架構的ZipVoice系列語音合成(TTS)模型——ZipVoice(零樣本單説話人語音合成模型)與ZipVoice-Dialog(零樣本對話語音合成模型)。ZipVoice解決了現有零樣本語音合成模型的參數量大、合成速度慢的痛點,ZipVoice-Dialog則解決了現有對話語音合成模型在穩定性和推理速度上的瓶頸。