<匯港通訊> 新一期百度(09888)AI DAY 上,文小言宣佈完成品牌煥新與功能升級。除品牌視覺形象煥新外,文小言聚焦模型開放與功能創新,支持多模型融合調度,升級全新語音大模型、圖片問答、AI 生圖生視頻等多項能力,為用戶帶來更智能、更高效的 AI 體驗。
全新語音大模型支持方言對話、複雜知識問答及隨時打斷等場景,用戶可進行語音知識問答或趣味角色扮演。圖片問答功能讓用戶可以通過拍攝或上傳圖片,以文字或語音提問直接獲取深度解析。
百度 AI 產品創新業務負責人薛蘇強調:「AI 的未來不再是單純的技術參數比拼,而是如何通過多模型協同,真正為用戶創造價值。文小言希望通過開放生態,整合頂尖模型能力,做出更強大、更簡單的AI 產品。」
百度語音首席架構師賈磊透露,該模型是百度在業界首個推出、基於全新互相關注意力(Cross-Attention)的端到端語音語言大模型。在語音場景滿足一定交互指標下,大模型調用成本比行業平均降低50%-90%,推理響應速度極快,將語音交互等待時間壓縮至1秒左右,極大提升了交互流暢性。同時,在大模型加持下,實現了流式逐字的 LLM 驅動的多情感語音合成,情感飽滿、逼真、擬人,交互聽感也得到極大提升。 (BC)
#百度 #AI
新聞來源 (不包括新聞圖片): 滙港資訊