DeepSeek下:从数据民工到战略顾问的破局三式
AI时代,数据分析技能新要求
Deepseek等AI技术让数据分析的门槛变低,人人都是数据分析师,AI工具如DeepSeek可以帮助数据分析师完成基础操作,比如处理表格数据、编写建模代码、进行数据清洗等枯燥的工作。即使不熟悉基本操作和代码,也可以借助AI完成任务。

同时使得数据分析的上限变高,AI无法胜任的部分包括理解业务需求、判断分析结果是否符合业务目标,以及将分析结果转化为实际业务决策,这些能力需要数据分析师具备深刻的业务洞察力和批判性思维。
企业从业人员必备的数据应用技能
为了应对AI的来袭,CDA数据科学研究院对2022版的红宝书进行了改版,让CDA教材更有前瞻性、实操性,更能提升职场竞争力,满足企业数智人才的能力要求。基于先进企业的实践,CDA数据科学研究院的这套丛书中提出了企业数智化需要具备的数据人才能力模型。
CDA 数据分析能力认证体系根据归因分析和策略优化的应用深度,以及从宏观业务分析到微观个体预测的技术难度,设计了CDA 一级至三级的学习内容,并对各类分析工具的掌握提出了相应的要求。通过分级设定,帮助数据人才全面掌握从业务问题归因到策略优化的能力。

《CDA一级商业策略数据分析》主要讲解商业分析所涉及的评价指标体系的构建、用户基础标签的构建与用户画像、定性和指标归因分析、战略及业务分析报告等商业数据分析技术。
《CDA二级量化策略分析》主要讲解客户运营、流程分析和策略优化所涉及的用户高级标签的构建、模型归因分析、预测模型等业务宏观分析与客户微观洞察相融合的技术。
《CDA三级敏捷数据挖掘》主要讲解企业数据挖掘体系构建,在机器学习运营(MLOps)的框架下设计、开发、落地数据挖掘模型,包括机器学习经典算法及案例、算法模型管理等技术。教材在工具实现上选择企业中应用最为广泛的数据库语言SQL和编程语言Python等。
企业数智需要具备的数据人才能力模型,概括为三句话:能描述现状、能分析原因、能预测行为,能区分宏观(指标)和微观(标签)的视角,并且可以宏微观结合分析。



技能一:业务状况展现



业务人员首先要能建立服务于业务分析的指标体系,并使用电子表格(EXCEL等)、BI工具和SQL、进行可视化展现,能描述现状,这也是CDA1级的重要内容。
缺乏报表和可视化工具时,业务问题的识别将极为困难,管理层需要透过看板支持战略决策,业务人员需要通过可视化大屏了解业务运营情况。通常可视化看板内容架构遵循"指标+维度"原则。指标,就是销售额、转化率等量化数值,维度是指时间、地域、渠道等分析视角,通过指标与维度的组合实现业务状态透视。



技能二:业务问题归因分析



描述业务现状,构建指标体系后,就需要有第二个能力,就是归因分析的能力,归因分析分为三种类型:定性归因、指标归因和模型归因。定性归因主要是通过调查研究和头脑风暴去猜测可能的原因,这是CDA一级教材的内容。

指标归因是通过指标树拆解和多维分析来进行分析,比如:通过杜邦指标体系发现,年营收下降了10%,是因为存货周转率下降了6%导致的,杜邦指标体系的拆解方法属于业务宏观分析方法,也是CDA一级教材重点讲解的内容。下面这个流程图,是一家银行存款总收入下降的具体分析,按照价值树和维度拆解的流程。

模型归因是通过构建统计建模来做归因分析,比如通过建立线性回归模型发现,友商商品价格降低1个百分点,我司产品销量降低6个百分点研究宏观业务指标之间,或者微观个体行为之间的相关性影响,这属于CDA二级要学习的内容。


技能三:制定量化策略



数据分析师要掌握的第三个技能就是制定量化策略。
举个例子:要对银行短期理财产品营销,以下这三类人群哪些应该是目标用户?
65岁以上退休人群:账户资金沉淀周期长(平均3-5年)
30-40岁小企业主:年资金流水3000-4000万,资金周转周期1-6个月
21岁应届生:月收入5000元左右,资金留存周期<30天
市场人员通过定性画像去寻找产品适用的人群,那这叫定性策略。同时,用户人群的年龄、月收入等特征,设置的定量画像,这属于使用规则量化策略,定性策略和量化策略都是CDA一级学习的内容。
至于更详细的用户每增加一岁,购买的logit提升比例的计算,就属于算法模型了,根据模型预测结果,结合客户产品偏好,针对响应概率在某一个区间的客户推荐XX产品,都属于基于算法模型做的量化策略,这是CDA二级和三级要学习的内容。

CDA一级新教材的亮点
第一、强化机器无法替代的人类业务思维与数据思维
一级教材引入业务分析框架流程及模块思维,主要参考了咨询公司使用的流程管理的方法,如问题拆解、指标关联等。
这很大程度上解决了数据分析师业务技能很过硬,但对上下游业务不了解的困境;增加了标签体系和用户画像,压缩了统计学和数据库内容,优化了分析图表和报告的内容,AI能解决的部分就不需要深入学习了。
第二、纳入当前行业关注的前沿技术方法,确保知识体系与行业发展同步。
代码类知识动态更新:基础操作保留纸质版,前沿技术通过电子资料实时同步,扫码即可获取最新内容,避免因语法接口迭代而过时。
强化AI分析结果评估:新增模型评估、代码验证及分析结果校验方法,例如运行测试人工智能生成的代码以确保可靠性。
第三、拓展广度与深度
在广度上:覆盖更多行业案例,突破旧版有限行业范围。
在深度上:细化技术细节,例如模型调优中的最优参数调整、跨数据库通用查询语法,旧版仅针对MySQL,新版扩展至SQL Server等主流数据库,并强化模型合理性检验等实战内容。

CDA二级新教材亮点
二级教材整合企业级数据项目工作流,主要针对学员掌握模型调优却不懂数据分析在业务中的介入时机,比如在企业开发产品时,如何从规划阶段探索客户需求,到产品上线后评估效果。新版内容引入咨询公司及大厂项目方法,重点呈现业务全流程。
例如产品研发链条中数据分析何时介入、如何关联下游任务(如需求对齐、结果落地),确保不仅懂技术,更清楚数据分析在业务前因后果中的实际作用,弥合技术与业务断层。

