颁奖典礼将在上海举行,此次榜单/奖项的评选依然会进行初审、公审、终审三轮严格评定,并会在国内外渠道大规模发布传播欢迎申报。
过去十年,数据中台经历了“全民建中台”的热潮,也走过“建用脱节”的迷茫。随着AI技术的爆发,尤其是大模型对高质量数据供给的迫切需求,数据中台的定位正在被重塑——它不只是数据的“管理者”,更要成为AI能力落地的“赋能者”。未来的数据中台,只有两条路:要么成为AI Infra的核心支撑,要么在技术迭代中被边缘化出局。这是我深耕大数据产业十年,最坚定的判断。
十年前,我在阿里深耕大数据基础设施——搭平台、建数仓、做实时计算,服务电商、金融等核心业务。彼时一个判断愈发清晰:数据基础设施绝不会只服务网络公司,终将成为所有行业的公共基建。正是这个判断,让我选择离开阿里云,联合创办了袋鼠云,全力投身让大数据走进产业的事业。这个决定在当时并不被普遍理解:从头部平台下船,去做一件高投入、长周期、短期看不到回报的事,风险不言而喻。但对我而言,大数据已证明技术可行,接下来必须回答:它在产业一线是不是真的有价值?我想成为验证这件事的人。
回望袋鼠云的前半程,我们做了大量不华丽却关键的基础工作:帮企业打通ERP、CRM等系统的数据壁垒,把散落在各处的数据汇聚起来,搭建统一的大数据平台和数仓,推进数据治理与资产盘点,或者换个说法,就是让数据中台的理念通过产品化的方式落地。对很多客户来说,这是第一次拥有完整可用的数据底座。我们跑遍能源、制造、金融、政务、高等教育等行业,既是方案提供者,更是陪客户试错的同路人。
项目越做越多,一个问题始终萦绕在我心头:我们到底是在造一套更高级的软件系统,还是在重塑企业用数据的方式?若只是前者,即便平台再大、报表再多,企业决策仍可能停留在经验+会议的传统模式。数字化的价值会被窄化为一个个IT项目,而非生产力的根本性变革。
带着这个疑问,伴随着生成式AI的技术突破,过去几年我们迈入智能化阶段的探索:仅有数据能算数已不够,企业要的是把数据转化为随时可用的智能的能力。也因此,我们主动从大数据基础软件提供商,升级为大数据基础软件与AI应用服务商,系统性思考数据基础设施如何同时服务AI与业务。
·以多模态数据智能中台为一体:作为统一数据底座,承接结构化、半结构化、非结构化及时序、时空等多源数据,完成从采集、治理到资产化、服务化的全流程管理,数据才是是企业AI Infra的核心支柱;
·以数据智能为一翼:在底座之上,围绕指标体系、知识库和多智能体应用,推动企业从报表驱动升级为指标+智能体驱动,形成跨部门对齐的数字语言和可复盘的决策机制;
·以空间智能为另一翼:面向城市、工厂、园区等复杂物理空间,将实时数据与数字孪生、仿真推演结合,把AI从屏幕推向真实运行现场,让业务状态可观、可算、可推演。
对我个人而言,比公司规模更重要的是两件事:一是袋鼠云参与并推动了中国大数据基础软件从跟随到自立的蜕变;二是我们提前想明白了、实践了如何为AI时代打地基这件关键事。
我常借用卡尔洛塔·佩雷斯的技术经济范式转型理论观察行业:每一次技术革命,都要经历安装期—泡沫期—部署期三阶段,这十年的大数据产业也不例外。
2015年前后,中国大数据基础软件进入安装期:Hadoop生态迅速普及,分布式存储、离线计算、数仓、中台等体系加速落地企业。那时的核心逻辑是先建起来、先收进来,完成数据的初步聚合。
随后几年,在资本、政策、舆论的一同推动下,产业快速进入泡沫期:大数据平台数据中台项目遍地开花,几乎所有规模企业都在跟风上项目。但使用端的反馈却很分裂:不少平台验收后使用率骤降,沦为昂贵的存储柜和复杂的报表生成器。建设热闹,价值不均,是我在一线看到的最真实场景。
近两三年,随着大模型、智能体、空间智能等新技术涌现,部署期的轮廓才逐渐清晰。企业终于意识到:大数据基础软件不再只是服务报表和传统应用,更要承担起为AI提供高质量数据供给+支撑智能应用闭环落地的双重责任。
过去我们常提数据飞轮:更多数据→更好算法→更好产品→更多用户→更多数据。这个逻辑没错,但在很多企业里,飞轮卡在了中间——数据量巨大,但真正进入算法、影响决策的少之又少。
下一阶段的核心,是构建更扎实的价值回路:数据→大模型→智能体→业务行为→新数据再生。
具体来说,数据进入到多模态数据中台,经治理后输入大模型;大模型能力通过Data Agent等智能体形态嵌入业务流程;业务应用在智能体辅助下决策执行,产生新数据;新数据回流再优化模型与业务规则。只有这条回路跑通,大数据才算从技术红利真正转化为生产力红利。
一提到数据分析,很多企业大部分会选择BI和可视化工具,让管理层看到更多数据报表——这是必要的起步,但问题很快显现:报表越多,口径越乱;数据看得越细,争论越激烈。根源在于缺少一套统一的、公认的指标体系。
于是,指标驱动的分析方法成为新趋势:先梳理企业核心指标体系,统一口径、明确责任、固化计算逻辑;再围绕指标构建数据资产、分析模型和应用场景;最后由智能系统自动发现异常、解释变化、给出建议。
十年耕耘,袋鼠云已成长为能提供多模态数据智能中台+数据智能+空间智能一体化能力的服务商,累计服务5000+行业客户。而中国大数据基础软件也在AI时代到来的同时开启了大航海时代:从引进模仿,到把本土复杂场景中打磨的能力输出到全球市场。从这个意义上说,回首创业十年,大数据和AI能力的新一轮全球化跃迁,才刚刚开始。
站在创业十年的路口,除了回望来时路,我更关心2026年起的下一个十年,大数据产业的真正分水岭会在哪里?基于十年创业积累的实践经验,我有三个愿意押注的行业趋势判断。
过去十年,企业数据架构多是以结构化数据为主的数据仓库或者数据湖中,非结构化数据、时空数据通常被割裂在不同的系统中,只能做局部分析,甚至大多处于存而不用的“闲置”状态。但大模型时代彻底改变了这一点——文本、图像、视频、传感器数据、三维场景等,都需要纳入统一语义空间。
这意味着,未来有价值的数据中台,必然是多模态数据操作系统:既要统一治理、调度多源多模态数据,也要将模型Embedding、推理结果等AI产物纳入管理。以此为标准,数据中台有两条清晰的生死线:
一是能否为大模型及智能应用提供稳定、高质量、可追溯的数据供给,支撑训练与推理;二是能否承接数据—大模型—智能体—业务行为→新数据再生的完整闭环,让AI结果真正落地业务流程。
做不到这两点,数据中台就只是更昂贵的存储和报表系统。未来的分化会很明确:为AI充分服务的,将成为核心基础设施;跟不上AI浪潮的,只会被边缘化。
过去十年,BI和可视化工具是数据使用的主入口,但一线实践暴露了明显局限:高频使用BI的,只是少数专业分析师;决策者和业务人员更多还是依赖分析师的汇报间接碰数据,数据价值难以高效触达业务端。
大模型与智能体技术,让人用数据的方式迎来重构。Data Agent的核心,是把复杂的查询、建模、分析逻辑封装在后台,前台只给业务人员暴露自然语言对话+业务语义输出的极简界面。它不仅懂字段和表,更懂企业的指标体系和业务规则,能在可追溯、可解释的前提下,直接给出分析结论和决策建议。
我相信2026年开始,企业会慢慢的多出现这样的日常:业务人员打开的第一个入口,不是满屏仪表盘,而是一位数据智能助手;他们问的是这个月门店客流下滑原因,而非写SQL查询;智能体的结论可被追问为什么,效果可被追踪复盘。传统BI工具不会消失,但会退为底层能力;前台人机交互入口,将逐步被Data Agent接管。
十年前,我们靠报表和日志理解数据与业务;今天,慢慢的变多场景指向城市、工厂、矿山、港口等时空系统——这类场景的核心是流动:人流、车流、物流、能流在空间中持续演化。
5G、物联网、工业互联网、边缘计算已铺好感知网络,下一阶段的核心是构建理解与推演能力,也就是空间智能。数字孪生正从静态3D展示,升级为可预测、可推演的动态系统;决策不再是看大屏,而是在多方案仿真的世界模型中验证。
未来十年,世界模型会从概念变成落地场景的基础设施:城市管理者在模型里推演交通疏导和应急方案;制造企业在模型里优化排产和能耗;能源企业在模型里调度复杂电网。在这些场景中,大数据、AI与空间智能不再是平行线,而是融合成统一的方法论。
过去十年,我是大数据产业的参与者、构建者与见证者;下一个十年,我更想成为一名推动者——推动数据基础设施真正演进为AI Infra的核心支撑,推动Data Agent真正成为业务一线的数字同事,推动空间智能从概念成为数字世界与物理世界的融合交汇的生产力。
最后用一句话总结:围绕真实业务问题持续迭代,把数据、算法和场景打磨成可复用、可复盘的生产力,这是袋鼠云为中国乃至全球企业数智化转型贡献的核心价值。
宁海元(花名:江枫),袋鼠云联合发起人、CEO,数据智能领域专家、浙江大学MBA、原阿里云“数加”大数据平台创始人之一。2015年联合创办袋鼠云,现任集团CEO,以“Data+AI”为核心战略,主导研发多模态大数据中台、数据智能、空间智能等核心产品,推动集团进入“袋鼠云智能时代”,专注为客户提供全球领先的数智化基础软件与应用服务。陆续出版了《高性能MySQL(第3版)》、《大数据平台部署与运维》、《数据可视化技术与应用》,获得二十余项发明专利(5篇一作),并入选浙江省科技专家库企业专家。
★本文由袋鼠云联合发起人、CEO宁海元撰写并投递参与“数据猿第八届年度金猿策划活动——2025中国大数据产业年度趋势人物十年先锋人物奖”评选。



