7月11日,樂視網CEO梁軍在2017中國互聯網大會上做了主題為“新樂視”的演講,這也是梁軍出任樂視網CEO后的首次公眾亮相。樂視在互聯網大屏行業完成諸多里程碑,在演講中梁軍預言未來2、3年即將迎來互聯網大屏紅利集中爆發,與諸多事先布局和技術儲備分不開的。其中一份重要的智能技術儲備就是:樂視語音。
智能電視串聯牌照商與內容商,將應用落到實處
基數最大的終端用戶需要好內容,好內容需要好牌照商來分發,好牌照商需要好硬件來呈現,好硬件需要好應用落到實處。內容、牌照商、硬件、應用不能孤立存在,而硬件則更好得將這一切串聯。能夠做到如此整合生態鏈的,當屬OTT互聯網電視龍頭樂視超級電視。
智能語音作為人工智能領域的一個重要分支,最近被大規模的應用到了互聯網電視領域,今年發布的大部分互聯網電視都具備了智能語音交互功能,語音已經成為了大屏必不可少的交互手段,但是幾乎所有的電視廠商都采用不同的技術供應商的方案組合實現智能語音能力,樂視是大屏領域少數的具備全流程自主,自研智能語音能力的公司,因為具備這樣的能力,樂視電視能夠更好的滿足大屏用戶的需求。

對于2017年OTT電視領域突然興起的人工智能而言,樂視超級電視的TTS語音功能早已經在2013年發布超級語音功能,隨著與用戶實際應用和用戶需求不斷做著升級。7月11日,樂視語音全新升級為3.0版本。同時,第4代樂視超級電視全面支持超級語音功能,將語音應用落到實處。
樂視語音3.0全量發布
樂視語音3.0最近全量發布,整體識別、認知能力大幅提升,用戶語音交互活躍量發布兩周提升了50%。該版本增加了自主認知、會話式語音交互等多項核心能力。該版本的發布也標志著,樂視成為了互聯網電視行業里第一個具備自主、自研大屏專有TTS綜合服務能力的公司。

樂視語音3.0的交互方式從原有的功能應答模式轉變為會話交互模式,這種方式使得人機交互更加自然,為了保持交互體驗上的統一,在語音識別過程中采用了同步實時識別的模式,進一步優化了識別效果和用戶體驗。
相比于之前的版本,同步實時識別可以有效的解決大屏語音用戶的主觀性延遲體驗的問題,讓用戶可以擁有更加自然、流暢的大屏語音交互體驗;樂視語音團隊對整體的交互過程采用了分片化的拆分管理技術,以此來保證在大屏上統一的會話式語音交互方式。
自主認知系統是樂視語音的學習系統,通過這一系統樂視語音具備了自主認知學習能力,在知識領域構建過程中,依靠自主認知系統,可以很容易讓系統學習到對應領域的知識,并通過會話管理系統實現與用戶的領域交流。
大屏TTS綜合服務包含語音合成、意圖翻譯等幾個核心模塊;語音合成要對發音語料進行嚴格的篩選,發音人任何的健康波動(如感冒等)都會影響音質,因此要保證發音人在最佳狀態的情況下進行上萬次的發音選取,并且針對大屏語音用戶的實際特點,樂視語音團隊構建了更加適合于大屏交互的語音合成架構,訓練出了專有合成引擎,并研發出了意圖翻譯模塊,可以向用戶展示出更加多元化的互動性信息。
開放的樂視語音,再次提升大屏TTS綜合服務能力
樂視語音3.0的交互方式從原有的功能應答模式轉變為會話交互模式,這種方式使得人機交互更加自然,為了保持交互體驗上的統一,在語音識別過程中采用了同步實時識別的模式,進一步優化了識別效果和用戶體驗。

大屏語音識別有著自己特定的使用場景和特點,圍繞這些場景、特點,樂視語音團隊在多個模塊構建了多種專屬領域模型,用于有效的理解用戶語音所表達的真實意圖,與此同時圍繞著大屏語音的特點,開發出了一系列的模型方法,大幅提升了語音的整體識別效果;以同音碰撞仲裁算法為例,此算法就是在大屏語音助手的研發過程中被提出的,用于解決大屏語音十分突出的同音碰撞問題。例如,動態識別出同音碰撞,及時把“沒事”調整為“美食”等。
樂視語音3.0相比于之前的版本,同步實時識別可以有效的解決大屏語音用戶的主觀性延遲體驗的問題,讓用戶可以擁有更加自然、流暢的大屏語音交互體驗;樂視語音團隊對整體的交互過程采用了分片化的拆分管理技術,以此來保證在大屏上統一的會話式語音交互方式。
樂視語音服務作為專業服務大屏端業務場景的智能語音系統,具備從語音識別、語義理解、TTS綜合服務到語音大數據的全流程、整套技術體系的核心技術,并保持著在大屏領域的技術先進性。代表“新樂視”的樂視網CEO梁軍,其規劃的大屏增值計劃早已開啟,面對互聯網大屏這個“軟黃金”而言,樂視超級電視已經具備足夠的開采能力。以面對企業級客戶的樂視云(智能云)、方舟系統(廣告服務)、BOSS(一站式商業)、AI(智能算法)、觀星系統(用戶洞察)五大智能平臺,和面對終端用戶的EUI操作系統、樂視語音、體感控制等智能人機交互系統,早已為互聯網大屏這個金礦做好準備。

