成本降低、效率倍增，文小言焕新升级可支持多模型调度_老虎社区_美港股上老虎

成本降低、效率倍增，文小言焕新升级可支持多模型调度

3月31日，新一期百度AI DAY上，文小言宣布完成品牌焕新与功能升级。除品牌视觉形象焕新外，文小言聚焦模型开放与功能创新，支持多模型融合调度，升级全新语音大模型、图片问答、AI生图生视频等多项能力，为用户带来更智能、更高效的AI体验。

此次活动上，百度还发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型，实现超低时延与超低成本，在电话语音频道的语音问答场景中，调用成本较行业均值下降约50%-90%。

百度AI产品创新业务负责人薛苏强调：“AI的未来不再是单纯的技术参数比拼，而是如何通过多模型协同，真正为用户创造价值。文小言希望通过开放生态，整合顶尖模型能力，做出更强大、更简单的AI产品。”

据了解，文小言此次升级的核心亮点在于“多模型融合调度”。通过整合百度自研的文心X1、文心4.5等顶尖模型，并接入DeepSeek-R1、可灵等第三方优质模型，文小言实现了多模型间的智能协同。用户只需选择“自动模式”，即可一键调用最优模型组合，或根据需求灵活选择单一模型完成特定任务，大幅提升响应速度与任务处理能力。

以“设计三种风格的南偏东客厅效果图”为例，文小言能够精准解析装修风格差异，调用文心X1完成深度推理，生成三幅风格迥异但视角一致的装修效果图；随手拍摄一张茅台镇的照片，文小言就可以调用文心4.5的多模态分析能力，精准识别出地理位置、当地产业、建筑风格等详细信息。

此次功能升级，文小言还进一步提升了全新语音大模型、图片问答、AI生图生视频等能力，全面优化用户体验。

比如，全新语音大模型支持方言对话、复杂知识问答及随时打断等场景，用户可进行语音知识问答或趣味角色扮演。接入全新的端到端语音语言大模型后，文小言不仅能支持更拟真的语聊效果，而且支持重庆、广西、河南、广东、山东等特色方言。数据显示，语音大模型具备极低的训练和使用成本，极快的推理响应速度，语音交互时，可将用户等待时长从行业常见的3-5秒降低至1秒左右。

文小言还加强了图片问答功能，用户拍摄或上传图片，以文字或语音提问即可直接获取深度解析。例如，拍摄一道数学题可实时生成解题思路与视频解析；上传多款商品图可对比参数、价格，辅助购物决策；拍摄杯子设计图后，AI可自动解析风格并生成同款手机壳、支架等周边产品。

同时，新增的“图个冷知识”功能更富趣味性，用户可预设“历史学者”“科技达人”等人设视角，为同一图片赋予多维解读。例如，当用户询问“猫窗探秘，为何猫爱窗边的科学真相？"，文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

推荐
最新

暂无评论

成本降低、效率倍增，文小言焕新升级可支持多模型调度

评论

热议股票