欧美日韩三区四区,亚洲国产精品99久久久久久久久,欧美精品一区二区久久,亚洲国产精品久久久

DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

未來的智能家居操控方式

來源:互聯網        編輯:郭雨婷    2016-09-18 09:03:46     加入收藏    咨詢

咨詢
所在單位:*
姓名:*
手機:*
職位:
郵箱:*
其他聯系方式:
咨詢內容:
驗證碼:
不能為空 驗證碼錯誤
確定

在很多國外科幻大片所描述的未來生活中,使用語音方式來操控家電的炫酷場景無處不在。比如在《美國隊長2》中,神盾局的頭子用語音操控虛擬桌面、窗簾和電視;...

  在很多國外科幻大片所描述的未來生活中,使用語音方式來操控家電的炫酷場景無處不在。比如在《美國隊長2》中,神盾局的頭子用語音操控虛擬桌面、窗簾和電視;在《鋼鐵俠》系列電影中,男主角回到家以后,說聲想喝咖啡,咖啡機便開始沖咖啡;在《碟中諜4》中,阿湯哥通過用語音來開燈和開電視……

  科幻片中這樣的未來并非憑空想象,國外的IT巨頭已先后以智能家庭產品與語音相結合的方式進入智能家庭領域:谷歌收購NEST布局智能家庭,不斷強化GoogleNow的語音入口;蘋果HomeKit智能家居平臺與Siri也不斷加強融合;微軟近期也發布語音助手Cortana,為它在智能家庭領域擴展交互入口。

  從這些國外科技大佬們對語音產業的重視和投入,可以看出智能語音與智能家庭的融合是大勢所趨,業內普遍認為語音作為人類信息最自然、最便捷的交互方式,必將成為未來智能家居設備中的重要組成部分。在國內,語音巨頭科大訊飛也在去年8月宣布進軍智能家庭市場,并于今年3月攜手京東成立合資公司,宣告雙方將在智能家居和語音技術領域展開全面合作。

  隨著國內外巨頭們對語音交互領域投入的增加,語音核心技術正逐步成熟,曾經的技術瓶頸亦在慢慢被突破。這其中語音識別技術是語音交互的基礎與核心,"語音識別"技術相當于給計算機系統安裝上"耳朵",使其具備"能聽"的功能。該技術經過語音信號處理、語音特征處理、模型訓練及解碼引擎等復雜步驟,使機器最終能夠將語音中的內容、說話人、語種等信息識別出來。

  圖:主流的語音識別系統框架圖

  了解了語音識別的基礎內容和系統框架之后我們來看看,語音識別技術要在智能家居生活中真正實用,必須要過哪5關?

  一、距離:遠場識別技術打破距離瓶頸

  近場識別技術目前已經比較成熟,現在手機上使用的語音輸入功能就屬于近場識別技術,用戶必須在離手機比較近的距離內說話,但在智能家居環境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語音控制智能家居的一個必要條件就是在無論你在客廳哪個角落發出指令,設備都能準確的識別,語音識別技術必須突破距離的障礙。

  目前室內的語音交互受到背景噪音、其他人聲干擾、回聲、混響等多重復雜因素影響,導致識別率低甚至無法使用,只能在相對安靜、近距離的環境下使用。而遠場識別技術將能夠很好的解決這些問題。

  二、效率:又快又準

  近年來,隨著深度學習理論的爆發式發展及其在語音識別領域獲得的顯著效果,同時Kaldi等開源語音識別工具也在工業界和學術界逐漸普及,語音識別的門檻持續降低,許多公司都具備了語音識別的能力及相關產品,但其實很多使用過Siri的國內用戶都會有這樣的感覺:Siri的反應太慢,說出一句話往往要等待很久才能顯示結果,另外,準確率也不高,離好用還有很遠的距離。

  三、個性化:越來越懂你

  每個人在說話時,口音、語速、口頭禪都不一樣,那么家里的智能設備只會識別一些基本詞句顯然是遠遠不夠的,它們必須要更懂你。比如,懂你的口音、方言、口頭禪以及時不時蹦出的專業詞匯等。

  讓智能設備適應每個人的使用習慣可能嗎?答案是肯定的。這里要用的到就是語音識別的另外一項關鍵技術--個性化識別技術。個性化識別指的是語音識別系統具備自動學習并適應用戶使用習慣的能力,你用的越多,它越懂你。一般來說,個性化識別包括發音和語言兩方面。其中發音個性化主要是指系統對用戶語速、口音等發音習慣的學習,而語言個性化主要是指系統可以對用戶的特定詞匯(例如人名、地名、口頭禪、專業詞匯等)具備更好的辨識性。

  四、方言:普通話標不標zun也照樣能用

  眾所周知,中國的語音及語言博大精深,雖然國家在推廣標準普通話方面不遺余力,但是中國真正掌握標準普通話的人群比例還是比較低的,而中國的口音現象則是紛繁復雜,甚至會出現同城市中都有不同口音的情況。因此,當這些帶有或輕或重口音的人群在使用語音輸入時,如果按通常的方法使用標準普通話數據進行模型的訓練,就會產生很嚴重的適配問題,從而影響語音輸入時的識別效果。

  "方言"現在也不再是語音識別的障礙,得益于各類方言豐富的音頻數據、特殊詞匯、發音現象等專業資源以及充分利用深度神經網絡的自學習特色,方言的語音識別可以得到改善。

  五、語音喚醒:真正解放雙手

  由于功耗等方面的限制,智能設備很難24小時都保持在激活狀態。因此,要想在家里自由地控制智能家居設備,我們還需要能即時"喚醒"功能,也就是給智能設備加入"語音喚醒"技術。

  語音喚醒,是指通過含有特定喚醒詞的語音輸入來"觸發"語音識別系統以實現后續的語音交互。通過該技術,任何人在任何環境、任何時間,無論是近場(0.5米以內)還是遠場(2~5米),面向設備直接說出預設的喚醒詞,就能激活產品的識別引擎,從而真正實現全程無觸控的語音交互。

  除了說單個喚醒詞實現喚醒外,更自然便捷、在技術上更具有挑戰性的交互方式是在連續語流中帶上喚醒詞,以實現喚醒產品并同時實現操控的效果。目前,語音喚醒方案已在部分產品中取得成功應用。

  結語:隨著語音識別技術在距離、效率、個性化、方言、喚醒等多方面一一突破實用瓶頸,隨心所欲"聲"控智能家居的時代一觸即發,那么這一變革多久會來?也許在明年,也許就在明天。

免責聲明:本文來源于互聯網,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
掃一掃關注數字音視工程網公眾號

相關閱讀related

評論comment

 
驗證碼:
您還能輸入500
    主站蜘蛛池模板: 五常市| 蕉岭县| 青冈县| 友谊县| 阳谷县| 安义县| 个旧市| 新安县| 甘洛县| 长海县| 永川市| 蛟河市| 河东区| 临沂市| 芒康县| 榆树市| 婺源县| 安徽省| 贡山| 夏津县| 昌宁县| 平塘县| 眉山市| 弥勒县| 旺苍县| 上栗县| 罗田县| 旅游| 磴口县| 高平市| 谢通门县| 石阡县| 同江市| 玉溪市| 恩施市| 钟祥市| 洮南市| 宜丰县| 苏州市| 邯郸市| 肃宁县|