2023爱分析·企业大模型市场厂商评估报告:滴普科技

图片

01 研究范围定义

研究范围:

大模型是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的模型。2023年以来,ChatGPT引爆全球大模型市场。国内众多大模型先后公测,众多互联网领军者投身大模型事业,使得大模型市场进入“百团大战”阶段,2023年成为公认的“大模型元年”。

企业用户方面,大模型的应用速度之快超乎想象。2023年初,企业管理层对大模型的话题还停留在大模型是什么,是不是概念炒作。短短半年,大模型已经从饭后谈资走向落地应用。大企业管理层们希望了解到大模型能为企业发展带来哪些变革,大模型的应用路径是什么,如何提升大模型的投资回报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸引的人群也愈发广泛,不仅吸引CIO、CTO等技术管理者的关注,CEO、CMO等非技术类管理者同样期待大模型在业务中发挥价值。这些转变表明,大模型的变革之力正日益得到产业界的认可。

通过对市场规模数据的分析,能较为直观地体现出企业对大模型应用落地的热情。爱分析数据显示,2023年中国大模型市场规模约为50亿元(人民币,下同)。2023年,企业在大模型方面的采购特点是论证多、采购少,各企业计划在2024年开始大量释放大模型预算,因此市场规模将大幅增长,预计达到120亿元。

爱分析认为,大模型市场从技术架构角度可以划分为基础层、模型层、中间层和应用层。基础层是指为大模型训练推理而提供的基础环境,包括湖仓一体、向量数据库、智算中心、企业大模型等。模型层是指基础大模型以及微调后的大模型,包括通用大模型、行业大模型、领域大模型和企业大模型。中间层是模型层和应用层之间的“桥梁”,有利于大模型在各种实际场景快速落地,包括大模型应用开发工具、LLMOps工具等。应用层是指大模型应用和解决方案,包括知识库问答、智能客服、数据分析等。大模型市场划分详见下图。

图片

本评估报告聚焦企业大模型市场,爱分析遴选出具备成熟解决方案和成功案例的厂商,供企业做厂商选型时提供参考。同时,在该市场下,爱分析重点选取了企业大模型厂商滴普科技进行能力评估。

02 企业大模型市场分析

市场定义:

企业大模型是指经过后训练或微调,面向企业私有化部署的大模型,助力企业从数据驱动升级为智能驱动。

甲方终端用户:   

大型企业IT部门

甲方核心需求:   

企业有三项核心需求。一是利用企业大模型助力自身从数据驱动升级为智能驱动。二是找到能满足企业对数据隐私与合规需求的企业大模型。三是找到具备高可用性的企业大模型。

  • 助力企业从数据驱动升级为智能驱动。当前,头部企业已实现或部分实现数据驱动,生产经营决策的专业性、科学性和敏捷性相较之前显著提升。在大模型时代,它们希望借助企业大模型,在各个业务场景和流程中构建智能助手,通过“人+智能助手”的新型协作方式降低企业运营成本。例如,某零售企业赋能一线员工,通过配备智能助理提升员工工作效率,进而达到精简人员和降低运营成本的目的。

  • 满足企业对数据隐私与合规需求。随着数据量的不断增加,数据隐私保护变得越来越重要。大模型的研发和应用过程中可能存在数据泄露风险,尤其是当企业调用对第三方底层大模型公网API时,数据安全问题更为突出。中国工商银行首席技术官吕仲涛曾称:数据隐私保护也存在隐患,大模型训练数据来源于互联网、业务数据,这些数据可能涉及大量用户隐私,需要通过隐私计算、联邦学习等方式进行保护。企业大模型则可以更好地保护商业机密和数据隐私。

    除数据隐私需求外,数据合规同样重要。《生成式人工智能服务管理暂行办法》明确规定:在生成式人工智能技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。除此之外,其他法律法规同样有关于数据合规的要求,企业也需要遵守。

  • 具备高可用性的企业大模型。基础大模型一般由先进AI公司建设,通识能力较强,但其缺少行业和企业专业知识,对企业价值有限。对于头部企业而言,通常引入业界领先的基础大模型,通过后训练或微调方式自建企业大模型。为保证企业大模型的可用性,企业对数据处理能力、训练速度、推理速度提出较高需求。

厂商能力要求:  

厂商需要满足三项能力要求。一是提供企业大模型端到端工具链。二是具备数据隐私保障技术和数据全流程合规能力。三是在数据工程建设、大模型工程化以及降低大模型参数量方面有深厚积累。

  • 提供企业大模型端到端工具链。厂商需具备算力资源、训练环境、企业大模型、应用开发平台、AI小模型等端到端工具链。“端到端”有利于发挥企业大模型深度价值,实现对企业上层业务的全面赋能。“工具链”有利于企业实现大模型训推及应用开发能力内化,摆脱对厂商的依赖。

  • 具备数据隐私保障技术和数据全流程合规能力。大模型隐私性保障技术主要包括加密存储、差分隐私、同态加密、安全多方计算、模型水印和指纹等。数据全流程合规能力包括厂商需要具备涵盖数据准备、标注、训练、运营全流程的合规能力。

图1:数据全流程合规能力

图片

  • 在数据工程建设、大模型工程化以及降低大模型参数量方面有深厚积累。随着数据集规模的增大,数据管理难度也在攀升,需持续提升大模型数据清洗的工程化能力,并从单一的结构化数据转向多模态的全领域数据。

随着大模型参数规模的提升,训练过程所需的计算资源也呈现指数级增长。现有计算集群在进行大规模并行训练过程中,由于硬件故障等原因,稳定性仍存在较大问题,厂商需提升训练任务失败时快速定位问题的能力,保障训练效率。

企业大模型的参数量并非越大越好,推理速度随着参数量增加会同步降低,同理,降低大模型参数量则有利于推理速度。因此,对应的厂商能力要求是找到大模型推理效果和推理速度的最佳平衡点。

入选标准说明:  

1. 符合企业大模型市场分析的厂商能力要求;

2. 近一年厂商在该市场至少服务1家企业(含POC)。

03 厂商评估:滴普科技

图片

厂商介绍: 

北京滴普科技有限公司成立于2018年,定位为数据智能基础设施提供商。以Data+AI为核心战略,滴普科技打造了实时智能湖仓平台FastData、企业大模型Deepexi、智能体平台FastAGI、训推一体机Fast5000E等在内的数据智能产品体系,助力企业实现从数据驱动到智能驱动的升级。目前,滴普科技已成功服务200余家知名大中型企业,包括中国石油、兴业证券、百丽时尚、航天烽火、重庆机电、陕药集团、长安新能源、纳爱斯集团、九洲电器等。

产品服务介绍: 

企业大模型Deepexi由滴普科技打造,包括智能体平台FastAGI、训推一体机Fast5000E、模型应用Deinsight等产品,通过与另一产品实时智能湖仓平台FastData 相结合,能够为企业大模型训练提供服务,包括数据训练、调优、部署以及推理等功能,帮助其快速构建行业专属大模型。

图2:企业下一代数据智能体系架构

图片

企业大模型Deepexi经过中文预训练、SFT、RLHF等方式精调,具备较强的中文知识与推理、数据分析、代码生成、图表生成等能力。智能体平台FastAGI包含知识智能体 DocAgent、数据智能体 DataAgent、插件智能体 Plugin Agent等工具,利用大语言模型的技术突破,实现交互式精确检索数据/指标,生成丰富数据图表,实现自动调用系统API完成业务需求;同时,基于语义理解能力、个性化与自适应等核心能力,通过知识提取、组织、生成关键知识工程,实现企业知识的精准检索及问答,提供专业、高效、准确的智能问答体验。训推一体机Fast5000E基于Deepexi模型,能够助力企业搭建高性能算力平台,大大提升训练效率,降低用户使用门槛。Deinsight基于滴普科技积累的行业知识库,能够为企业打造行业大模型及相关应用落地。

厂商评估: 

在数据准备方面,滴普科技打造了实时智能湖仓平台FastData,实现多模态数据的高性能、低成本存算,为企业应用大模型做好数据准备。在解决方案方面,滴普科技提供大模型端到端解决方案,帮助企业实现从数据驱动到智能驱动的升级。在赋能范围方面,滴普科技把大模型打造成“企业服务智能体”,联通各个系统实现整体赋能。在项目经验方面,滴普科技已落地多个大模型项目,为企业带来可验证的业务价值。

  • 滴普科技打造实时智能湖仓平台FastData,实现多模态数据的低成本、高性能存算,为企业应用大模型做好数据准备。滴普科技基于Data Fabric架构,打造了实时智能湖仓平台FastData,帮助企业建立统一治理、流批一体、湖仓一体的云原生数据智能平台,实现海量数据实时分析,成为支撑企业数字化转型的核心数据基础设施。FastData对多模态的数据能够进行低成本、高性能的存算,为企业应用大模型做好数据准备。在存储方面,FastData具备针对多模态数据存储的核心算法,名为One Lakehouse湖仓引擎,可以实现统一的多模态数据目录和统一的访问接口,进而做到低成本存储。在计算方面,滴普科技解决方案名为One Engine,包括批处理计算引擎(Spark)、实时计算引擎(Flink)、SQL计算引擎(Trino)等,One Engine知识多引擎统一适配,实现高性能计算。

图3:FastData产品架构图

图片

  • 滴普科技提供大模型端到端解决方案,帮助企业实现从数据驱动到智能驱动的升级。企业大模型Deepexi包含智能体平台FastAGI、训推一体机Fast5000E等核心产品,能够为企业搭建私有化大模型训练提供高质量的数据准备、模型训练、调优、部署及推理服务,可以快速地构建企业内不同领域的垂直类模型以及对应的智能应用的能力,帮助企业实现从数据驱动到智能驱动的升级。

    FastAGI是滴普科技基于AI Agent的核心能力打造的智能体平台,包含知识智能体DocAgent、数据智能体DataAgent等工具: DocAgent结合了检索增强生成(RAG)技术,支持各类文档数据的管理,旨在通过向量检索技术和大型语言模型(LLM),提升内容生成的能力和精准度,基于语义理解能力、个性化与自适应等核心能力,通过知识提取、组织、生成关键知识工程,实现企业知识的精准检索及问答,提供专业、高效、准确的智能问答体验;数据智能体 DataAgent基于 Deepexi-Coder模型提供的MQL能力,可以与已有的企业级数仓和数据平台进行对接,根据交互式问答和数据权限,精确检索数据/指标,生成丰富的数据图表和报告,沉淀业务的理解和问题的解决方案能力。

图4:滴普科技产品整体架构

图片

作为升腾应用软件伙伴和一体机伙伴,滴普科技已与升腾完成技术互认证,并打造了训推一体机Fast5000E。Fast5000E基于Deepexi模型,能够助力企业搭建高性能算力平台,大大提升训练效率,降低用户使用门槛,应用于智能问答、文案生成、数据分析、API交互、信息提取、文档总结等多个典型场景。

  • 滴普科技把大模型打造成“企业服务智能体”,联通各个系统实现整体赋能。目前,大模型应用一般是一个孤立的系统,只能为企业实现单点赋能,难以实现整体赋能。滴普科技以AI Agent为依托,提供Text-to-SQL、Text-to-Python、Text-to-API等能力,形成LLM大脑触角。大模型与企业内部业务系统无缝集成,可以调用知识库、数据库、业务系统等数据和知识,为企业各业务、各部门、跟层级实现整体赋能。以零售行业补货场景为例,过去常见的方式是基于经验老道的店长判断,现在企业只需把判断的逻辑,比如补货需要参考爆款销量、库存量等训练到企业大模型里,企业大模型可以自动生成补货建议和补货订单链接,让一个普通销售员轻松完成补货操作。

  • 滴普科技已落地多个大模型项目,为企业带来可验证的业务价值。滴普科技已与中核集团中核装备院、百丽时尚集团、南京文投等多家行业头部企业展开合作,落地企业大模型项目。以零售行业百丽时尚为例,滴普科技已将大模型赋能百丽时尚多个业务场景。在选品场景,大模型给货品运营专家提供供应链专业知识和数据,并且可以执行货品配补调等业务操作。在门店场景,大模型帮助门店店长获取自己权限内需要的数据和智能决策支持。在研发设计场景,大模型可以快速生成运动鞋、高跟鞋的线稿和配色,辅助设计师更快完成工作,并且具备部分重绘和局部修改等功能。滴普科技在“大模型元年”即可实现多个项目落地,除技术积累外,主要得益于领域专家团队的有力支撑。滴普科技已建立一个由多位领域专家组成的咨询团队,致力于大模型与业务场景快速结合,释放业务价值。

典型客户: 

百丽时尚集团、中核集团中核装备院、南京文化投资控股集团有限责任公司

04 入选证书

图片

# 市场大事

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论