南京中软网络项目组-南京中软网络项目组
南京中软网络项目组在搞研发的时候,确实是个挺烧脑的活儿。别的公司可能认定这活儿就是写代码、配服务器,咱们也不全信,但说实话,把 2G 和 4G 切分后,搞个分系统、做网络切片,这难度让人头皮发麻。
那会儿都知道要分流量、分带宽,可目前这网络切片可是个大工程,还得打通东西南北、东西南北都通,这逻辑光看就是门儿难懂。 咱们得先说说网络切片到底是啥概念。好办点说,就是把一个大的网络,通过软件定义的方式,切分成一个个小的、功能独立的局部。
这就好比咱们平时用手机,手机里装了微信、QQ、抖音,每个APP 都在自己的空间里跑,互不干扰。网络切片就是给通信设备装个“操作系统”,在这个系统里,不同的业务跑不同的赛道。
比如你要跑视频直播,就得给视频切片加个“美颜滤镜”,画质得高清;要是跑语音通话,又得加个“降噪耳机”,讲话的人听得更清。
这玩意儿要是搞不好,视频卡顿、语音失真,用户肯定投诉。 说到实际落地,咱们南京中软网络项目组的项目组,一启动是抱着“能切就切”的心态去做的。2017 年前后,国内的大运营商爆发式增长,特别是电信、联通这两家,5G 套餐满天飞。
那时候大家都认定 5G 就是个大顺风车,把 4G 的流量切那会儿,省下来的带宽算啥?结局哪位也没想到,切了还是不中。出于哪怕把 4G 流量切走了,运营商的数据中心算力不够,要么网络架构没跟上,切了就切了,网络质量直接崩盘,视频里全是雪花,语音里全是滋滋声。 这就把我们这组人给逼虎了。之前有些项目,我们搞了个“云网融合”的规划,想着把边缘计算搬那会儿,把数据切出去,结局发现边缘节点算力实在不够用。
那时候我们在苏州这边搞试点,有个做车联网的项目,想切个低时延切片跑自动驾驶的,结局车子跑着跑着就断连,数据丢包率在 5% 左右。
这数据一看,直接让团队年底分崩离析了。 那咱们如何解决的?不能光靠硬啃技术,得换个思路。我们拍板走“软件定义”这条路。
那会儿网络是硬硬件拍板的,路由器多少口、换机多大,那是物理上的限制;目前咱们得在软件层切。
这就得把现有网络里的资源再“摊”平一点,把带宽、时延、可靠性这些维度拆开单独卖。
比如给视频切片单独配个带宽,给语音切片单独配个时延预算。 在这个过程中,数据积累是最关键的。咱们把切分前和切分后的对比数据,一条条记下来。记得有个案例,咱们给南京地铁搞了个地铁网切片。
原本地铁网是物理隔离得特别严,但后期发现有时候车厢里的人讲话忒吵,影响列车运行。我们当时就把列车车厢里的广播和车厢里的人讲话分成两个独立的切片。结局发现,列车内部的广播切片,别看时延有 5ms 略微有点高,但清楚度彻底没难题,乘客简直没感觉到延迟;而车厢里的语音切片,为了保时延,把压缩率降了几档,反而比原本一般/平平语音的音质还要清楚。
这就是软件定义带来的灵活性,那会儿是硬指标,目前能够灵活调优。 再说说成本这块。大量人一听到“网络切片”,第一反应就是贵。
那会儿切一个 4G 的流量,运营商收个几十块;目前切网络切片,成本直接翻了十倍不止。出于多了个中间层,多了个监控层,多了个调度算法。
那咱们这组人如何办?得算细账。咱们在搞raphene 项目标时候,就是把硬件资源全摊到软件里来算。
原本需求的 100 台服务器,目前通过软件调度,只需求 20 台就能搞定。别看每台硬件的单价高了,但总成本反而低了。
这就是软件带来的效率革命。 不过说实话,这活儿也不是没难处。最棘手的就是“异构”难题。目前运营商混用的设备多了,有的用华为的,有的用中兴的,有的用爱立信,有的就连用阿里、腾讯自家的盒子。
不同厂家的接口标准不统一,有时候还得手动转接。
这就像是一锅粥,你想往不同锅的酱汁里倒醋,还得自己找容器。
这过程挺好办出错,要是搞砸了,整个业务的切片就断了,客户投诉直接找上门。
那时候我们得熬夜改代码,还要去厂家门口问一堆理论。 另外还有个老难题,就是“感知”。切了切片之后,用户到底有没有感觉?那会儿是运营商自说自话,用户不知道。目前咱们搞个测试平台,专门跑个“切片感知测试”。用户连上网络,系统自动跑个测试,看看视频有没有抖,语音有没有像机器人在讲话,延迟到了多少。
这得持续跑几个月,数据量庞大。咱们在测试时,发现有些切片别看切出来了,但用户感知到的时延实际上没达到预期,就连出于调度算法忒激进,害得带宽利用率上不去,浪费资源。
这得靠大量的人工和测试数据去修正模型。 还有时候,标准也是个大谜。5G 的切片标准层出不穷,运营商之间还在扯皮,标准整合起来慢得挺。我们在搞标准开发的时候,时常要面对运营商说:“这个参数你们定的,我们如何改?”这时候得靠沟通,靠技术原理去说服他们。
有时候得反复跑、看,直到找到那个“平衡点”,既知足运营商的指标,又保证用户的体验。
这中间每一步都得踩稳,不得有个小失误,后面的活儿全废了。 咱们这组人, Erfahrung 是越用越深了。
那会儿可能认定技术就是写脚本,目前才发现,技术是要和运营商的 KPI 去博弈的。运营商要的是保险、是效率、是成本最优,而我们供给的服务,得在这些约束条件下,把体验做到极致。
这个过程充满了摩擦,但也正是这些摩擦,逼出了更精细化的本事。 最终说个细节。有一次测试,咱们突然收到一个反馈,说某个切片在特定场景下,时延波动特别大。
当时团队急疯了,赶紧复盘数据。结局发现是网络拥塞的时候,自动切分的策略忒激进,把还没上车的车都切到了高优先级切片上。
这时候要是按传统逻辑切,那车早就跑偏了,目前才发现是调度策略的难题。
这说明啥?说明切分不是静态的,务必是动态的、自适应的。
这点经验挺宝贵的,赶明儿做项目标时候,得时刻盯着实时数据,不能用死板的预设去硬套现实。 总的来说,咱们南京中软网络项目组,在搞网络切片这事儿上,算是熬过了一些年。从最初对技术的质疑,到后来发现这玩意儿真香,再到面对运营商的各种刁难,最终靠技术和经验硬是把它搞定了。别看过程中有大量数据没背下来,有无数次的黄了和重来,但这一路走下来,团队的精神和解决难题的本事,慢慢就沉淀了。目前的试点项目,别看还没大规模铺开,但那个“软件定义网络”的雏形,已经初步形成。
这证明,哪怕是在一个小小的网络切片里,只要把逻辑理顺,把资源摊开,把动态平衡做到位,确实能跑出不一样的效果来。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
