济群信息IT服务-企业云网 技术社区
标题:
庞俊英:阿里巴巴的SDN网络
[打印本页]
作者:
孤独的骗子
时间:
2015-3-18 21:57
标题:
庞俊英:阿里巴巴的SDN网络
行业对软件定义网络的理解千人千面,普通认为SDN诞生于校园网,发扬光大于拥有中大型数据中心的互联网公司。阿里集团技术保障部从2010年在飞天集群规模使用定制TOR交换机开始,不断的尝试和探索Software Defined Everything。本文介绍SDN在阿里集团网络运维方面的实践及未来研发思考。
每年双十一网购狂欢节,一次次刷新世界交易、支付峰值,对基础设施的要求和运维压力都是巨大的,如何在大规模、低成本的要求下,还要达到高可靠性、高稳定性、弹性调度、快速交付是系统网络平台部面临的挑战,也是尝试SDN的驱动力。
阿里巴巴对SDN的理解不是简单的转发面和控制面分离,也不是自己做个“SDN交换机”这么简单,阿里集团的SDN架构专注于系统性达到电子商务、云计算的特定场景应用的相关特性对操作系统、数据库、网络、服务器、数据中心的需求,提升系统、网络整体运营能力。让业务不再感知网络变化、拥有无物理尺度调度业务池。
先梳理下大规模互联网公司数据中心网络运维都遇到哪些问题:
1、快速交付问题;
2、大量的变更问题;
3、网络故障处理对业务影响的问题、
4、千差万别的厂家CLI、版本、设备型号;
5、网络规划永远赶不上业务的变化;
6、网络流量流向无序;
一言概之,网络在其他团队看来就是个黑洞,网工就是些不靠谱地人,业务要自己监控网络运行状态,网工颜面扫地。
阿里技术团队针对上述问题做了如下工作:
一、自动化
1、交付:网络集群(万台规模)交付:1小时;
2、变更:封装各个厂家CLI,提升变更效率;
二、业务拓扑
无论是运营商、银行、企业或是互联网公司长期以来网络运维关注的管道级网络拓扑。业务与网络之间的对应关系停留在资深网络工程师的脑袋中。
千万不要认为下图就是一张普通的拓扑图,一个VIP对应的全部Realserver所在网络物理位置和机房的全部信息都一目了解,这个业务IP带来的多少流量,此流量单位成本一切变成那么清晰。网络规划不再是拍拍脑袋,抓抓爪子,按按计算器,SDN理想的业务级调度有理有据。
三、专家系统
英剧“black mirror”带给我们的冲击是什么?对,大数据分析后是可以复活一个人。每天在技术保障部产生的运维日志、网络log,告警信息经过数据挖掘,引入机器学习从Data转发成information对网络运维网络事件做到Re-active和Pro-active,我们不再需要资深网式运维网络。这其中有着巨 大的想象空间,我们在路上。
四、定制Openflow特性的交换机
不是用了OF switch才叫运用了SDN,但Controller与switch/router要说话,我们选择尝试Openflow协议,2013年阿里巴巴加入ONF,共同推进产业对标准接口的支持及推动网络产业的开放程度。
五、虚拟网络及虚拟网络操作系统
网络操作系统和网络硬件天生是个封闭系统,行业中有了交换套片后,国内涌现出一批杰出的网络设备供应商。虽然生产交换机公司不再是高富帅,但网络操作系统仍然是个封闭系统。“路由器丢包是太阳黑子活动频繁引起的”真不是个网络笑话,它的确是厂家给出的故障分析报告。Laas开发工程师一想到网络中的VLAN/网关/IP脑仁都痛。我们要做的是Network as a Service,交换机要跟服务器装机一样的标准化,网络的管理和使用要像自来水一样方便快捷。因此我们思考将网络硬件与网络操作系统分离,抽象出虚拟网络操作系统。
六、虚拟光网络也是我们重点关注的技术之一,Google B4是个过去式。
人说SDN落地最大的阻碍是CCIE,是资深网络工程师。阿里网工就要将技术做深做透,革掉传统网络运维习惯。
原文出自【比特网】,转载请保留原文链接:
http://network.chinabyte.com/246/12942246.shtml
欢迎光临 济群信息IT服务-企业云网 技术社区 (http://forum.jiquninfo.com/)
Powered by Discuz! X3.2