Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

数据中台的最终目的是给企业带来降本增效

数据中台是什么?

4月8日晚,数据中台建设实战系列课程—— 「数智加速度」正式启动,第一课由 行在开讲。

行在,奇点云创始人兼CEO,20年数据老将。2016年,带着12年阿里系数据实战经验创立奇点云,旨在「让实体商家拥有淘宝一样的数据化能力」,让商业更智能。

在第一课里,行在集中回答了7个问题:

1、数据中台是什么?

2、数据中台与数据仓库、数据平台、数据湖等概念的区别?

3、阿里巴巴的大数据之路?

4、数据中台是如何演进的?

5、线下商业如何落地数据中台?

6、数据中台能为企业带来什么?

7、「不看广告看疗效」,有没有案例?

01 数据中台是什么?

狭义上来说,数据中台是一系列数据技术的统称,以解决数据“存通用”问题为核心,为业务数据化和智能化提供数据采集、计算处理、分析决策和应用的技术。

而我们理解的数据中台,从广义上来说, 数据中台不仅仅是技术,更应该是集公司战略决心、组织架构、技术架构于一体,以业务价值为导向,用技术拓展商业边界, 是商业进入DT时代的重要基础设施。

02 数据中台与数据仓库、数据平台、数据湖等概念的区别是什么?

20年前,数据仓库出现,企业在数仓上建BI,更多的是给决策者看报表;后来阿里发现,数据除了给决策者看,更多的可以为一线运营所用,例如打 「通」淘宝消费者信息数据、建立TCIF后能帮助他们了解消费者、优化广告投放,才进入到 「用」的阶段。

而在「用」的基础上,数据中台可以为企业 「赋能」,实现降本增效,例如为企业建设智能补货、智能人效等能力,实现质的飞跃。

至于数据湖,它比较像个杂货铺,更多的是堆积数据,而数据中台不仅要完成 「存」这个任务,还要把数据 「通」、 「用」起来。

当然,在处理数据、搭建算法等能力上,数据仓库、数据平台与数据中台也不是一个量级的。譬如传统数仓要跑几天的几亿条会员数据,依托奇点DataSimba只需要1-2小时。

这也就解答了「企业是不是可以用原来的数据仓库、数据平台,去完成这一系列数据相关的动作」的问题,要真正实现「让机器完成机器能做的事情,释放人去做更有创造力的事情」,还是需要数据中台的支撑。

03 阿里巴巴大数据之路

关于数据中台的起源,相信大家已经听过很多故事,例如奇点云首席战略官才言的分享《数据中台从何而来》。

阿里巴巴是国内最早也最成熟的数据中台实践者。

在阿里的12年,我亲身经历了从数仓到数据中台的整个过程:

2004年,我以「数据仓库专家」的身份加入阿里,负责搭建阿里巴巴的第一个数据仓库(DW)。

2009年,阿里提出了重大愿景——未来要成为「数据公司」,同年阿里云成立。

2012年,我和团队完成了TCIF(淘宝消费者信息库)的搭建,整合打通了阿里巴巴各平台应用的消费者数据,形成了底层3000+个标签。从那时起,阿里打破了淘宝、天猫、高德等平台产品各占一个山头的局面,消费者形象从「单面」变为「多面」,立体、丰富。至此,阿里也拥有了「预测」的能力,可以基于对用户的立体认知,预测用户的偏好、消费轨迹等。

2015年,阿里巴巴向外发布了DT时代的提法,用Data Technology(DT,数据技术)替代了Information Technology(IT,信息科技),强调数据技术将成为未来商业的驱动力。

同年,我在阿里云内部创业,带队创建 「数加」平台,把阿里巴巴的数据能力外化赋能给社会更多主体(例如企业、政府)。

04 数据中台是如何演进的?

基于阿里巴巴的数据之路,我们总结出了 数据中台演进的四个阶段:

1、数据库阶段,主要是OLTP(联机事务处理)的需求;

2、数据仓库阶段,OLAP(联机分析处理)成为主要需求;

3、数据平台阶段,主要解决BI和报表需求的技术问题;

4、数据中台阶段,通过系统来对接OLTP(事务处理)和OLAP(报表分析)的需求,强调数据业务化的能力。

05 线下商业如何落地数据中台?

在线下场景, 我们既要解决企业数据生产的问题,又要解决数据使用的问题。

相信很多企业的朋友有同感,相比线上,线下商业在落地数据中台时会遇到更多问题:数据从哪里来?能从数据中获得什么信息?线下90%的数据是非结构化的视图声数据——而线上的数据往往是结构化的,经验无从借鉴,我们如何把这样的「数据原油」提炼成降本增效的燃料?

更直接的例子是,比如一家零售企业,线下几千家门店,店长可能很清楚有哪些货、量有多少,但是不知道一天进店的顾客有多少,有多少男性、多少女性,其中有几位是你的会员,他们拿起什么、放下什么、花了多长时间决策,都无从了解。

我们的做法是把「云」和「端」结合起来。

端,智能端(企业原有的信息系统、AIoT等)负责数据的收集,获得线上线下全域数据,解决无数据采集、无数据沉淀等问题;

云,云负责数据的存储、计算、赋能。具体包括将视图声数据结构化处理、计算、分析,用AI算法代替经验公式,搭建行业价值化的应用场景等等。

云赋能端,端丰富云。从而真正解决企业数据生产和数据使用的问题,用人机协同的力量消除不确定性,让机器去做机器能做的事情,让人有更多时间去做人该做的、有创造力的事情。

06 数据中台能为企业带来什么?

我认为, 一切为业务服务,数据中台最终要帮助企业建立能力、实现降本增效。

如果拿苹果树来打比方,我们不仅要让土地(底层数据平台)变得肥沃,也要能为客户种出苹果树(数据智能应用),为企业带来真正的业务价值。

当我们和企业IT部门(或信息部门、数据部门)一起把这棵树种好,结出了业务价值的苹果,大家就会发现, IT部门正在从成本中心转向利润中心,正在最大化地为企业创造价值。

07 有没有案例?

老话说得好,「不看广告看疗效」,上4个案例:

(1)大型零售企业,建立智能定价能力

一家传统零售企业,在全国有几千家门店,年营业额在100亿到200亿之间。

企业要求“零库存”,也就是说在4个月之内,一件新品就必须完成上市销售直至库存清空。因此,这个企业以前会对商品做一系列的营销降价。这样虽然带来了不错的营业额,但实际上每年的利润是很低的,40%的商品都不得不低于成本价售卖。
我们为这个企业做的第一件事就是 补齐消费者数据——因为在此之前,客户只有300G数据,虽然门店很多,却只有货物的数据,没有“人”和“场”的数据。

根据店面及周边一些信息、节假日的销售数据及消费者洞察等的数据分析,我们为其提供了一套智能定价模型,让这个企业在全国的每一家店都能有自己“个性化定制”的定价策略,智能降价,千店千面,因地制宜。

在这样的服务基础上,这家企业每年大约增加了5000万净利润。

(2)服饰零售企业,建立智能人效能力

一家服务零售集团,主打三四线年轻人市场,直营门店2000家。

我们为这家企业打造了智能人效管理系统,在门店仍然保持业务平稳增长的基础上,截至2019年3月下旬,通过排班优化和人员优化,企业释放1720人,2019全年节约人员开支超8000万元人民币;同时,全面了提高员工工作效率与组织协作效率。

这个项目在企业内部的推广速度远超出预期,受到了业务部门和公司管理层的热烈欢迎。

(3)连锁零售企业,建立智能补货能力

这家连锁超市企业,其生鲜销售额占比超过一半。生鲜对新鲜度要求很高,这就需要保持合适的店内排面库存和在途库存。

原先它的生鲜需求量是基于买手的人工经验来预估的,一般为了保证尽量不缺货,提升顾客的消费体验,往往会过高的估计进货量,这会导致未及时销售的蔬菜水果等只能低价处理或者清理掉,耗损率很高。

我们在深入了解客户业务现状及需求后,与客户一起梳理对齐关键业务指标(如正毛利率、损耗率等),结合会员、销售、损耗评估、缺货还原等业务数据以及节假日、天气、附近商圈居民区等数据, 从16个变量升级为100多个变量,对生鲜需求进行了预测。

最终仅绿叶菜这一项的预测准确率就相比原先提升了35%,每年能为每家店节约400万的成本。

(4)大型家居零售企业,建立智能营销能力

一家国际大型家居零售企业,有超100T数据量,客户数量超3000万。

奇点云入场后,搭建数据中台,新增了超过200个客户标签,从而建立了精准投放、精准营销的基础。

例如,仅短信投放一项,成本就从700万元/年降低到了200万元年。而基于更丰富的客户标签、更立体的会员画像,复购率比原来提升了4%。

以上案例均来自于 奇点云所创导并始终践行的「AI驱动的数据中台」。

我们认为,只有AI驱动的数据中台,才能同时发挥好 「存:把一切业务数据化」、「通:连接数据孤岛」及「用:把一切数据业务化」的作用,最终帮助企业实现数智化升级,赋能企业实现降本增效。

未来,我们会坚持践行AI驱动的数据中台,以实现数据中台的最终目标——给企业带来降本增效,与客户、伙伴们一起拥抱未来世界。

奇点云 | StartDT
奇点云 | StartDT

奇点云(StartDT)成立于2016年,旗下有“奇点云”、“GrowingIO”两大品牌。 聚焦数据全生命周期,奇点云以自主研发的数据云操作系统为能力核心,提供自主可控、安全合规的大数据基础软件产品与全链路服务。 至今,奇点云已服务零售、制造、金融、政企等多行业的1500+客户,陪伴客户成功实践数字化,加速产业转型升级,构建面向DT时代的竞争力。

产业数据中台
1
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

数据仓库技术

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
推荐文章
暂无评论
暂无评论~