自带革命属性的阿里云,上攀险峰下闯深海行至今日,据国际研究机构 Gartner 发布的最新云计算市场追踪数据显示,阿里云亚太市场排名第一,市场份额从 26% 上涨至 28%,接近亚马逊和微软总和;全球市场排名第三,市场份额增速最快,从 年的 7.7%,上涨至 9.1%,进一步拉开与第四名谷歌差距,挤压亚马逊份额。
在「梦想永在凌云意意气风发,代码成就万世基积沙镇海」的背后,须臾 11 年,行走于荆棘之间的程序员们为阿里云共建了哪些技术高墙,铸就了当下的核心竞争力?今天我们不妨来看看。
阿里云的核心竞争力
作为阿里云的一条主路线及核心所在,飞天(Apsara)开启了一代技术人的探索之路。
就飞天系统自身而言,它有着自主可控、强大的调度能力、数据能力、安全能力,是一个云计算操作系统。在其架构上:
底层的数据中心、物理资源等提供了强有力的基础设施支撑;
中间有着物理层管控之天基、先进的计算平台架构之神龙、存储之盘古、虚拟网络系统之洛神“坐阵”,带来了计算、存储、数据库、网络等核心服务;
除此之外,阿里云还构建了面向用户的系统服务以及原生服务,支撑不同行业客户在阿里云上构建自己的应用系统。
在这其中,飞天的内核之四大“神仙”亦是飞天的关键所在:
天基——物理资源的抽象和管理
据阿里云介绍,天基是一套自动化数据中心管理系统,管理数据中心中的硬件生命周期与各类静态资源(程序、配置、操作系统镜像、数据等)。在飞天云操作系统之上,天基系统保证了近百万台服务器的基础软件,固件快速安全自动大规模部署和升级。
神龙——云原生计算架构
阿里云神龙的诞生,打破了传统物理机与虚拟机之间的隔阂,成为裸金属虚拟化的先行者。神龙发展到了今天,已经进入了神龙架构 3.0 时代,贯穿整个 IaaS 计算平台,全面支持 ECS 虚拟机、裸金属、云原生容器等,用户基于此也能在云上获得物理机 100% 的计算能力。
盘古——存储平台
随飞天系统而生的盘古,主要担任分布式存储系统的角色,而曾于 2009 年在阿里云成立之初,工程师们写下的第一行代码也正是盘古的代码。基于盘古,阿里云有诸多的存储业务,如块存储、文件存储、对象存储等。
年,阿里云推出了盘古 2.0 版本,引进分布式原数据管理,使得该存储系统可以轻松支持万亿级别文件,也可以轻松支持大量的小文件实现第一分布式原数据管理。同时实现更好的弹性部署,形成巨大的存储池,将不同存储介质、不同的情形组合在一块,形成一千 PB、也就是亿 B 级别的存储容量出来。
洛神——云网络平台
年,阿里云首次向外界揭开洛神的神秘面纱,它是阿里云飞天操作系统内核的核心组件和系统服务。历经十年,洛神云网络平台从洛神 1.0 的超大规模、多租户网络全面升级至具备高性能、弹性开放网络等特性的洛神 2.0。
如今,随着时间的推移,阿里云在飞天操作系统之上已衍生了一系列自研软硬件产品技术,如:
MaxCompute——大数据计算平台
MaxCompute 是阿里经济体的通用计算平台,承载了阿里集团 99% 的数据存储以及 95% 的计算能力。每天有几万名阿里巴巴内部的开发者会在这个平台上进行开发。MaxCompute 在 年的双 11 中,单日处理数据量超过 970PB,是阿里经济体真正意义上的经过实践检验的大数据计算平台。
PAI——机器学习平台
机器学习 PAI 产品家族,覆盖了机器学习的数据处理、建模、训练、模型优化、在线预测的全产品线。客户既可以搭建完整的个性化推荐系统,让 CTR 提高 10%+;也可以使用 Blade 进行深度学习模型进行优化,节省 GPU 消耗50%。PAI 的完整性和灵活性,可以让每个企业和开发者更加方便地使用机器学习技术。
PolarDB——云原生数据库
PolarDB 是阿里巴巴自主研发的下一代关系型分布式云原生数据库,目前完全兼容 MySQL、PostgreSQL,高度兼容 Oracle 语法。计算能力最高可扩展至 1000 核以上,存储容量最高可达 100T;经历双 11 大考,PolarDB-X 处理峰值达到 8700 万次/秒;PolarDB 重磅发布 Oracle 版,支持传统数据库一键迁移上云;如今 POLARDB MySQL 8.0 正式上线商用,原生支持并行查询,特定场景下(TPC-H测试)性能提升十倍。 年,天猫双十二购物节,海外电商 Presto Mall 成功从 Oracle 迁移到 PolarDB,打响海外 Oracle 迁移战役的第一弹。
云原生数据仓库 AnalyticDB
AnalyticDB 是云原生数据仓库领导者。基于 MPP 架构,扩展能力强,摆脱Oracle 等传统企业数仓单机处理瓶颈。支持 SQL 2003、兼容MySQL、PostgreSQL 语法、部分兼容 Oracle 语法和支持 PL/SQL 存储过程,触发器,支持标准数据库事务;通过行存储、列存储、多种分区表和索引等机制,可以支持PB 级数据的在线交互式分析,支持 ETL 批处理任务;相比离线数仓方案,数据延时从天级别缩短至秒级,数据实时性高。
AnalyticDB 获得中国信通院大数据产品评测双料认证,在 TPC-DS 100TB 测试中名列榜首,完成了 640 节点的分布式分析型数据库性能测试。AnalyticDB 发布 6.0 版本,完全兼容开源 Greenplum 6.0 版,存储内核从 PostgreSQL 8.3 升级到 PostgreSQL 9.4 ,事务能力至少提升 60 倍,支持 JsonB 等非结构化数据的存储和分析等。
IoT Platform——物联网平台
阿里巴巴经济体统一的IoT设备接入和管理平台,对内服务于新零售、智慧物流、天猫精灵大生态、工业互联网、智慧城市等多种场景,抽象和沉淀近千款物模型,为万物智联做了充足的基础设施建设和应用实践。在基础的连接之上,集成阿里云多项能力,围绕着AIoT场景提供了数据、应用、边缘计算、AI等服务。物联网平台于年正式商业化,目前已经是国内领先的AIoT基础服务平台。
云安全——打造数字经济基础设施安全底座
自阿里云成立第一天起,安全就是头等大事。经过10年的积累,阿里云在为**重大活动以及天猫、淘宝、支付宝的护航过程中沉淀了强大的安全工程化能力和大项目护航能力,为云上企业建立了基础安全、数据安全、业务安全等一系列安全产品和解决方案,让外部攻击无所遁形,为客户专注于发展自身业务创造有利条件。
阿里云云原生
早在 2011年,阿里巴巴就率先开始了容器化进程,开启了中国公司将云原生技术体系在电商、金融、制造等领域中大规模应用的先河,业已成为中国企业云原生道路的“引路人。历经9年技术沉淀,阿里云云原生拥有国内最丰富的云原生产品家族,覆盖八大类别 20 余款产品,涵盖底层基础设施、数据智能、分布式应用等,可以满足不同行业场景的需求;是国内云原生最全面的开源贡献者,涵盖编排调度、作业管理、无服务器框架等。除了支持集团内部应用规模化运维,阿里云云原生技术还向全社会输出。阿里云 ACK(容器服务)遍布全球 18 个 region,拥有国内最大公共云容器集群以及客户群体。
基于以上,阿里巴巴也于去年宣布,整个阿里巴巴经济体业务,核心系统已 100% 跑在阿里云公共云上,飞天云操作系统也成功扛住天猫双 11 的全球最大规模的流量洪峰。对于业界而言,这也意味着阿里云已经具备应对各种商业的云技术挑战。
下一步,在全球全面云化的时代下,阿里云基于飞天 OS 与神龙的“神话”仍在续写,业界又该如何基于已有的技术及服务汲取经验,加快企业自身的转型与变革?