智能家居的入口到底是什么?在這個行業發展幾年之后,業內依然沒有就這個問題達成共識。最初,手機一度被認為充當了這個角色,但在大多數場景中,手機與智能家居并沒有實現交互,更多的充當的是“遙控器”的功能。
語音識別技術的成熟讓巨頭開始探索,智能音箱成為智能家居交互入口的可能性。比如亞馬遜的Echo、谷歌的Google Home、蘋果的HomePod。根據eMarketer的數據顯示,在今年一季度美國語音助手市場中,亞馬遜Echo的市場份額達到70.6%,Google Home占到23.8%,其他廠商合計占5.6%的市場份額。
國內越來越多的公司也開啟智能音箱這個品類。科大訊飛與京東曾經推出叮咚音響,借助科大訊飛的語音識別功能和京東的智能家居生態圈,用戶可以通過叮咚音響實現與智能家居的交互,比如語音控制,音響也可以提供聽歌、聽書、聽小說等互聯網搜索功能。
背靠電商品臺,叮咚音響去年年底發布的A3實現了語音購物功能,整個環節不需要手機等其他終端就可以完成在京東購物全流程。
阿里巴巴人工智能實驗室(A.I. Labs)近日也推出自己的智能音響:天貓精靈X1,該實驗室成立于2016年,負責阿里巴巴集團旗下消費級AI產品的研發。
天貓精靈內設第一代中文人機交流系統AliGenie,用戶可通過其實現與智能家居的交互,并且實現語音購購物、手機充值、叫外賣、音頻音樂等播放功能。
除了作為智能家居的入口,天貓精靈可以通過語音完成整個天貓和淘寶的購物流程。比如用戶通過語音命令下單“一支筆”,天貓精靈會自動根據用戶的購買記錄或者搜索排名向用戶推薦,在支付等環節中,音響需要根據用戶的聲紋判斷是否問本人,確認將會完成支付環節,否則將會被拒絕。
這其中涉及的一個重要環節是聲紋識別和聲紋購。用戶需要提前將自己的聲音注冊,并且生成聲音密碼,與機器綁定后,開啟聲紋購功能。隨后在購物和支付環節中,天貓精靈會要求用戶跟著念一串隨機數字進行聲紋校驗,來確認是否為本人。后續的快遞查詢、到貨提醒,也都可以通過音響的語音提醒功能完成。
在一個家庭中,音響的使用者不會只有一個人,因此,天貓精靈最多可以同時識別6個人的身份,面對不同的用戶,提供不同的推薦、購物和搜索功能。
天貓精靈推出的前一天,百度推出無人駕駛開發者平臺Apollo,在這個超過60項核心能力的平臺之上,開發者可以使用其上面的語音、視頻、增強現實、機器人視覺、自然語音處理等能力,創業公司用自己的數據換取對Apollo平臺的使用。
同樣,阿里巴巴也在推出天貓精靈的同時,推出AliGenie開發者平臺,主要面向內容開發者、應用開發者、智能家居開發者和硬件生廠商。在這個平臺中,開發者可以借助AliGenie輸出的不同維度的能力,比如深度學習能力、自然語言處理能力、算法、知識表示和推理問答系統等,與自己的產品相結合。
人機語音交互的難點在于對于語義的理解,對于同一個問題,不同地域、不同年齡和不同習慣的人會采用不同的問答方式,對于這個問題,阿里巴巴對語義理解進行優化,比如僅天氣預報就能夠理解786種中文提問方式,包括北方人的兒化音、小朋友經常使用的疊字疊詞、南方人某些與普通話混淆的中文表達方式等。
語義的理解和執行是智能音箱的基本能力,進化則是考驗了音響的學習能力。所謂“進化”是指在第一次向音響提出超出其能力范圍的問題之后,音響可以通過學習學會新知識,長時間進化后,加之聲紋識別功能,音響可以成為越來越了解用戶的助手。
在智能家居和AI領域看來,語音識別會成為智能家居交互的主要使用方式,但是否會使用智能音箱的方式來承載,仍然是在摸索的過程中。