就在5G消息發(fā)布兩周年之際不久,中國移動近日在北京推出了5G新通話業(yè)務,因此中國移動成為了全球首個率先推出5G新通話試商用的電信運營商?;蛟S,5G新通話已經(jīng)迎來了發(fā)展新風口。那么,5G新通話在傳統(tǒng)的業(yè)務上如何賦能通信服務?而作為通信基礎能力的通話服務下一步又將會如何升級發(fā)展?
5G VoNR技術瞄準市場藍海,打造“通信高地”
海量連接蘊藏豐富機會,未來仍存廣闊市場空間。目前,全球有70億人與人之間的話音連接。5G時代,音視頻連接將延伸到超過200億的人與人和人與物的連接[1],通信終端也將從手機變成TV、音箱、車、甚至機器人等新型終端。人與物的音視頻連接,讓家中的IoT設備成為唾手可得的溝通工具,極大豐富了通信場景。與此同時,語音交互、手勢交互等AI交互方式,全面升級通信體驗,實現(xiàn)解放雙手,自在暢聊;甩屏等創(chuàng)新功能應用,將打破空間的局限,真正打造“以人為中心”的無縫通信服務,讓溝通無處不在,讓信息自由流動。
目前,業(yè)內主流通信廠商從不同角度切入物聯(lián)終端基于5G VoNR技術的場景創(chuàng)新與應用市場,為智能門鈴、智能攝像頭、智能音箱、智能臺燈等智能終端提供超清視話通信解決方案。
物聯(lián)網(wǎng)IOT終端關鍵技術為5G VoNR通信服務
為提升VoNR通信終端覆蓋率,拓展IOT通信場景,智慧家庭運營中心創(chuàng)新融合型輕載化高效EVS編碼、低功耗通信模組、弱網(wǎng)對抗技術、交互式通信技術。EVS(Enhanced Voice Services, EVS)是繼4G移動高清語音編解碼器AMR-WB后,VoNR默認和優(yōu)選的語音編解碼方法,相較于G711、AMR語音編碼,其最大體驗提升在于提供8-48khz的音頻覆蓋能力,滿足了人耳對聽覺全域的頻率覆蓋,適應所有人耳可感知的音頻媒體傳輸,同時EVS在移動通信系統(tǒng)中通信質量和效率方面也有很大的提升。
特點1:支持全頻域編碼,提供超高清語音\音樂編碼
EVS支持全頻域編碼(語音編碼和音樂編碼),四種采樣率,8kHz、16kHz、32kHz、48kHz,音頻帶寬的分布如下圖所示:
圖1 音頻帶寬的分布[2]
8kHz采樣率對應的編碼帶寬為窄帶,范圍是300Hz-3400Hz;16kHz采樣率對應的編碼帶寬為寬帶,范圍是50Hz-7000Hz;32kHz采樣率對應的編碼帶寬為超寬帶,范圍是20Hz-14000Hz;48kHz采樣率對應的編碼帶寬為全帶,范圍是20Hz-20000Hz。人耳可以感知的頻率范圍一般在20Hz-20000Hz,傳統(tǒng)通信系統(tǒng)中語音信號頻率范圍300—3400Hz之間,采用8kHz采樣,因此EVS能夠覆蓋人耳可感知的全頻域音源,相比傳統(tǒng)通信系統(tǒng),EVS能夠提供無損級話音和音樂音頻信號傳送服務。
智慧家庭運營中心針對智能家居、數(shù)字鄉(xiāng)村等場景,基于音視頻通信技術孵化如智能喇叭、智能提醒、智能對講等創(chuàng)新業(yè)務,攻關物聯(lián)網(wǎng)IOT終端全頻率音頻采集、音頻前后處理技術,升級3A算法,引入RNN循環(huán)神經(jīng)網(wǎng)絡,實現(xiàn)8-48khz音頻采樣全頻域語音通信能力,賦能家庭業(yè)務提升用戶體驗,如智能喇叭廣播業(yè)務可以為用戶播放無損音質的音頻,智能對講業(yè)務提供臨場沉浸式溝通體驗。
特點2:支持更全面的編碼速率,滿足泛終端差異化網(wǎng)絡環(huán)境
EVS不同的編碼帶寬都支持多種碼率,其中WB帶寬支持全碼率。碼率越高需要的帶寬就越大。如下圖所示:
圖2 EVS編碼速率[3]
智慧家庭運營中心根據(jù)EVS傳輸碼率特性,針對泛家庭場景物聯(lián)網(wǎng)終端使用場景,攻關QoS網(wǎng)絡抗丟包技術,使用WavaRNN技術構建了循環(huán)生成網(wǎng)絡模型,學習超分信號前后的相關性,構建低頻譜模到高頻譜模的翻轉模型,利用Griffin-lim算法和Mel-GAN聲碼器,有效解決高頻相位的缺失引起的振鈴效應,使用ISTFT得到時域信號,實現(xiàn)音頻超分變率擴展,打造EVS碼率自適應技術,根據(jù)網(wǎng)絡環(huán)境,自適應選擇不同的編碼速率。通過上述技術,優(yōu)化EVS在物聯(lián)網(wǎng)終端在多種網(wǎng)絡環(huán)境下適應能力,提供更好的語音編碼服務和效率,相同網(wǎng)絡場景下MOS分平均提高0.4。
特點3:極低延時,提供聲臨其境的通話體驗
EVS處理的語音幀的時長為20ms。當編碼帶寬為WB/SWB/FB時的編碼延時為12ms,當編碼帶寬為NB時的編碼延時為10ms。相對于AMR-WB效率提高了近一倍。
智慧家庭運營中心結合EVS低延遲的特性,創(chuàng)新性提出媒體前協(xié)商通信機制,利用5G高帶寬、低延時的特性,有效提高泛智能終端的接通率,進一步縮短泛智能終端建立通話的時延。為用戶帶來高連通率,超低延遲的VoNR超高清通話服務,讓語音通話有了身臨其境的體驗。
特點4:輕載化編解碼,廣泛賦能各種終端
由于IoT設備普遍存在的性能瓶頸,智慧家庭運營中心針對不同平臺的多種設備,使用SIMD技術對EVS進行輕載化,在ARM、MIPS等架構下進行EVS性能優(yōu)化,有效將幀處理耗時從35ms大幅降低到10ms以內,解決EVS在低功耗芯片上無法運行的問題,為智能物聯(lián)網(wǎng)終端提供泛終端、泛網(wǎng)絡、全頻域、超高清的多媒體通信服務。
5G新通話全面升級通話體驗
中國移動智慧家庭運營中心以AIoTel 技術為底座,創(chuàng)新面向用戶感知的增強型全頻域編碼技術、物聯(lián)網(wǎng)多媒體通信EVS碼率自適應技術、全域超大規(guī)模視聯(lián)算力并網(wǎng)調度技術、媒體前協(xié)商通信機制,創(chuàng)新打造行業(yè)首款支持VoNR的智能終端,面向物聯(lián)網(wǎng)提供泛終端、全場景、高品質的電信級多媒體通信服務,打造數(shù)字通信全新體驗。
針對家庭細分場景孵化智能電話、智能對講、智能喇叭、移動看家等業(yè)務,結合智能硬件創(chuàng)新出基于智能音箱、寬帶電視的大中小屏 VoLTE 視頻通話,貓眼門鈴 VoLTE 視頻對講,智能攝像頭遠程廣播喊話等特色功能,并借力“數(shù)字鄉(xiāng)村”工程實現(xiàn) CHBN 協(xié)同發(fā)展,進一步牽引產業(yè)上下游的產品孵化和創(chuàng)新。
(一)門鎖視頻對講(門口):親友來訪,按動智能門鎖上的門鈴按鈕后,主人的手機即可接收到一通視頻來電。在通話過程中,主人可一鍵為親友開啟門鎖。
(二)大屏視頻通話(客廳):親友相聚,使用語音遙控器的語音交互指令撥打大屏高清視頻通話,向遠方的父母報平安。在視頻通話過程中實時分享旅行照片。
(三)音箱視頻通話(廚房):隨著女主人步入廚房,大屏視頻通話隨之切換到廚房的智能音箱上。女主人一邊準備飯菜,一邊繼續(xù)與父母暢談。
(四)智能臺燈通話(書房):畫面轉到書房,孩子正在做作業(yè),遇到難題后按動臺燈的通話按鈕,爸爸的手機即可接收到電話,實時通話指導孩子的功課。
(五)智能客服(在線業(yè)務):用戶在線辦理業(yè)務場景時,通話建立前展示企業(yè)名片及認證信息;通話中智能客服主動推送交互式菜單及業(yè)務表單遠程指導用戶操作;通話結束后定制結束語形成服務閉環(huán)。
(六)通話交互(辦公/娛樂):通話過程中支持用戶進行屏幕共享、文件分享和白板涂鴉等交互操作。
5G VoNR 讓“人機物”的邊界融合。未來可通過“移步換景”-從室外到室內絲滑串聯(lián)中國移動VoNR極富特色的人與人、人與物通信場景,全面展現(xiàn)泛終端、泛網(wǎng)絡、全場景、電信級的物聯(lián)通信解決方案,以及智能感知、多模態(tài)交互的數(shù)字通信全新體驗。
參考文獻:
[1] 《Vo5G技術白皮書》.
[2] https://www.aes.org/technical/documentDownloads.cfm?docID=548.
[3] https://www.aes.org/technical/documentDownloads.cfm?docID=548.
作者:陳民
單位:中國移動智慧家庭運營中心
來源:移動Labs