企业如何实施AI (一): 企业级大数据建设
近几年, 科技发展如火如荼, 许多企业为了不被竞争者落下, 也大力投入资源进行科技革新或转型, 比如看到AI的应用成功也想看是否在企业中大规模运用以提高生产或执行效率.
在行业实践有丰富经验的Simer为大家分享了AI如何引入企业的经验和心得(Simer, 中文名汪涯, 现任仁联集团CTO, 曾主导新蛋中国, 银泰电商, 万达全球招商的整体IT建设及AI数据应用项目, 也是大数据产业生态联盟专家委员之一), 相关内容收集整理如下:
企业从零引入AI, 要想有真切的建树, 不光要作好长期持续的投入, 也要作好碰壁甚至全盘失败的准备; 切忌投机主义, 急功近利, 特别是作为企业的领航人要清醒意识到AI的高门槛高投入且很难全盘回报的现实.(现在不少企业号称已实施AI实际就是一些简单逻辑拼凑的在此不谈).
企业实施AI, 通常的大步骤为: 1.企业级大数据建设 -> 2.设定业务目标规则 -> 3.AI应用定位及解决方案 -> 4.AI落地实施, 这里的第1,2步顺序有可能交换, 有些企业在目标很清晰的情况下开始布局大数据; 但大多数只是一个模糊意识, 这个时候的建议就是把数据做起来再说, 等清楚哪些数据是企业能做出来的再设定目标不迟.
此文对第1步骤展开如下, 其余内容参见后续:
一.企业级大数据建设之数据准备
数据是基础, 没有数据则没有AI, 许多企业老板认识不到数据的重要性, 在没有准备这一环节的情况下还指令要落地AI跟要求无米之炊是一模一样.记住:要AI必数据!
1.数据究竟有多重要, 我们来讲个故事: 天文学历史上有一位非常有名的观察家叫第谷, 他最重要的贡献就是他穷其毕生精力, 用当时最精确的人工方法观测了天空中行星的运行轨迹并作了完整纪录, 他的方法可以说达到了肉眼的极限, 这样精确且持久的观察数据在当时可谓珍宝, 但是这些大量的纪录却因为时间原因没有完成分析和总结, 在他过世后由他的学生开普勒进行持续解读发现了行星运动规律, 开普勒因此成为确立太阳中心说并发现行星运动三大定律第一人, 被称为"天上地立法者"而留名青史. 开普勒之所以成功就是站在大量长时间精确观察的"大数据"上啊!
再延展一些来讲, 上面有提到的行星数据是长时间且精确观察的纪录, 这也说明我们的大数据不光得"大", 还得有效, 精确. 这相对于企业要完成的业务目标不同而对数据要求不同, 具体如何做呢, 引入业务专家会告诉你答案, 这后面还会提到.
回到现在, 来讲讲国内的企业大数据建设现状, 现在国内有点名声的企业言必称已有自己的大数据及大数据建设队伍, 但实际情况很现实, 据有关摸底了解, 90%号称大数据的公司甚至作大数据咨询的公司没有自己的有效数据, 那它们的数据从哪里来呢? 靠利益交换, 买卖, 人工拼凑或伪造, 甚至是偷. 大家一听偷可能觉得没这么严重吧, 许多靠爬虫技术生存的企业其实就是这个性质, 数据不可追究, 一追究警察会找上门的那种.(是近, 大数据风控公司"同盾"被查, 就是这些原因)
2.那哪些是真有大数据的企业呢? 其实也多, 已经持续实施七八年以上数据化企业, 比如BATJ或TMD, 还有不少国企比如电信, 移动, 银行, 医疗机构及自动化改造完成的制造业等. 但它们大多数并不愿意分享它们的大数据, 因为这些数据是未来核心竞争力的关键, 另外也涉及到国家核心关键, 必然格外小心. 据我所知不少它们投资战略合作的企业, 其实也基本拿不到关键数据或是仅仅给你无关重要的边缘数据.当然有一种例外就是国家动员的大数据相关项目, 国家战略级别的项目无论BATJ还是TMD还是大国企必然配合贡献.
3.自己企业如何才能有自己的数据呢, 特别是自己的"有效数据"? 回答是:企业要上升到战略层面, 引进相关人才, 制定分解计划, 高执行力地推动企业上下进行有效数据积累(必然会对现有业务有利益冲突, 必须摆平); 时间上四五年吧, 老板通常等不及, 两三年行不行? 两三年的有效数据积累当然可以用起来, 只不过偏差会比较大, 别动不动想领先业界就行了. (这与数据采样一个道理, 一万和数千万样例的分析结果必然存在精准度上的偏差)
二.企业级大数据建设之基础建设
有了数据, 有了很多很多的数据, 这个时候八字才有了一撇, 还需要哪些条件呢, 我称之为大数据三大宝:1.数据系统; 2.算法专家; 3.行业专家.
1.数据系统:
这里涉及较专业的IT知识不展开讲, 但还是得提醒大家注意, 这是企业容易轻视的地方, 也是IT高管常常对企业说不清楚具体需要怎么投入的地方.附上一图, 慢慢让IT高管试着分解着讲清楚各部份的重要性及建设周期吧(图中重要的组成部份:大数据存储, 分析引擎, 访问网络, 安全及加密, 访问分发, 弹性计算, 应用层及第三方接口):
2.算法专家:
其实就是各种文章里提到的很贵很贵的, 可以把业务规则转换成机器可以理解的技术语言这样的专家, 常常大家问, 企业一定需要这样的专家吗? 当然还得看你的应用, 现在各种云服务及数据分析服务公司, 会包装常用的算法和计算资源. 注意:这里强调的是常用的, 且利用云资源你的数据是否能确保不泄露出去可就是另一个话题了. 所以, 如果你的企业需要做到行业创新, 以及包括数据保密, 那这部份的投入就是少不了的.(不少企业的老板大投入建立自己的大数据, 初衷可不是让你做常规应用, 所以如果你是企业实施AI的顾问或总工程师, 这一块如何平衡你的决定非常重要, 也是决定大数据成败的关键.
另外多说一些, 现在好的算法专家, 能大大缩短企业收集有效数据的成本和时间, 什么意思呢? 普通专家需要你收集五年的一百个维度数据, 好的专家可能只需要你收集两年五十个维度数据即可, 这也是目前"小数据"概念的由来, 能用"小数据"转换AI成果的专家更贵, 当然相比企业的时间和数据收集成本来讲还是很划得来的.
3.行业专家 :
行业专家, 就是对业务很精通, 非常清楚行业背后运作的规则. 嗯, 企业的老板笑了, 会说到:"我从业几十年, 企业被我带到现在, 一年盈利XXX亿, 我自己就是行业专家!".
你是不是也遇到过这样的老板呢? 没办法, 讲两个故事给他们听吧:
在1996年,AI界发生了世人震惊的一件事, 世界国际象棋冠军卡斯帕罗夫代表人类接受名叫“深蓝”的IBM超级电脑AI的挑战。结果人们缓了一大口气, 卡斯帕罗夫以4:2宣告人类胜利。然而没经过多久一年多时间, “深蓝”进化为“更深的蓝”。这一次,卡斯帕罗夫以1胜2负3平的成绩败下阵来, 这次 史诗性的人机对抗, 代表了人类在特定领域面对机器的失败, 也从此拉开了AI全面挑战人类各领域的序幕. 说到这大家可能会问了, 这与行业专家有什么关系呢?其实比赛结束后,“深蓝”技术公关小组公布了一些秘密:1.在第一次对抗失败后, 美国特级大师本杰明加盟“深蓝”小组,将他对象棋的理解编成程序教给“深蓝”;2.每场对局结束后,包括本杰明在内的几位特级大师都会根据卡斯帕罗夫的情况相应地建议技术人员修改特定的参数;“深蓝”通过"学习"这些专家的意见强迫它高效改进, 这就是“深蓝”进步神速最终战胜人类代表卡斯帕罗夫的主要原因。大家知道了吗, 这里的行业专家就是“深蓝”背后的几位特级大师, 对国际象棋本身拥有足够领先世界的认知, 再转化成机器能理解的参数, 能让AI的学习效率成倍提高(甚至可以节约数十年的的计算成本).
再说一个故事, 其实就是前面提到的发现行星运动三大定律的开普勒, 他就是一位行业专家啊, 没有行业专家拿到一堆行星数据又能如何呢? 看到了吗, 这里的行业专家, 一定是深耕一线数年深知行业背后运作机理的且能把这些规则表达出来的这样一群人. 如果把老板形容成舰长, 那这个行业专家是一位即能会指挥, 也能亲自开炮, 能看懂雷达, 能入机舱操作动力, 还能止损维修的这样一位全能操作手. 如果你的老板仅是一位可以指挥的舰长, 那行业专家肯定得另定他人.
到此, 企业实施AI的四大步骤第一步:"企业级大数据建设"就接近尾声.看到这里的企业家们一定会觉得第一步就非常不容易, 是的, 如文章开头所讲,真刀真枪的AI企业实施是一个高门槛高投入长线见回报的事情, 真在大力投入之前建议采用第三方AI集成小范围试水一把, 把一小块业务闭环跑顺, 顺带培养出企业中对这一块有远见有魄力推动的人才和团队.
最后, 如果大家看到这觉得有用, 还请关注, 后续的分享内容持续整理发布.
- 标签:
- 编辑:刘柳
- 相关文章