在計算機能力、算法以及大數(shù)據(jù)的加持下,這些運用到機器學習、語音識別、語義分析的產(chǎn)品,已經(jīng)開始讓人工智能逐步走進人們的生活,讓人與機器的對話越來越自然,機器能夠聽懂和理解人的程度也越來越高。在經(jīng)歷過最初的探索之后,這一領域商業(yè)化的應用和落地步伐也越來越快。
文/熊熊(熊出墨請注意)
巨頭的進階

距離1956年人工智能之父馬文·明斯基提出“人工智能”的概念已整整過去了60年,但商業(yè)化的浪潮卻遲遲未來。盡管之前有g(shù)oogle、facebook、微軟等大公司不斷投資AI領域,但大多把研究成果用于自身業(yè)務的優(yōu)化和效率提升,距離人工智能技術(shù)的民用普及還相當遠。直到去年,AlphaGo人機大戰(zhàn)重新奪回大眾的關(guān)注點,人們還意識到,其實人工智能的商業(yè)化已悄然開始布局。
在人工智能的分支中,語音識別是發(fā)展最早、且率先實現(xiàn)商業(yè)化的技術(shù),從科大訊飛到思必馳,從云知聲到出門問問,其商業(yè)化應用的領域也從教育、客服、電信等進一步擴展到車載、家居、醫(yī)療、智能硬件等行業(yè)。與此同時,自然語言處理(NLP)作為人機交互技術(shù)的重要一環(huán),也為此提供了助力。
蘋果Siri的推出打開了語音交互的先河,不僅催生了一批語音語義創(chuàng)業(yè)公司,還激發(fā)了百度、阿里等大型互聯(lián)網(wǎng)公司在語音語義技術(shù)上的投入。但真正的爆發(fā)還是來自亞馬遜的Alexa+Echo。
由于自然語言處理是搜索引擎的關(guān)鍵技術(shù)之一,因此百度、搜狗自然而然地成為頭號玩家。過去幾年中,兩家公司依托其強大的搜索引擎和輸入法應用,不僅將語音技術(shù)用于自身產(chǎn)品,還通過與行業(yè)其他技術(shù)和產(chǎn)品提供方合作,推出面向C端的產(chǎn)品和應用。比如,搜狗聯(lián)合四維圖新、飛歌等,推出全語音交互的車載導航產(chǎn)品,百度度秘攜手小魚在家,推出Duer OS以及家用視頻對講機器人。
來自國際市場研究公司RAM(Research and Markets)發(fā)布的《全球智能語音產(chǎn)業(yè)報告2015——2020》認為,未來三年,全球智能語音市場規(guī)模將達到191.7億美元。而中國的市場,將保持每年60%的增速增長。
NLP技術(shù)商業(yè)化的痛點

自然語言交互是未來人機交互的趨勢,在大多數(shù)智能產(chǎn)品中,NLP技術(shù)都是不可或缺的,但目前比較突出的問題是,受限于降噪、語音識別和語義理解等技術(shù),交互體驗始終無法達到暢快淋漓。隨著深度學習的出現(xiàn),NLP技術(shù)開始取得突破。但總體來說,NLP對于淺層次的特征提取、分類等問題已經(jīng)比較成熟,而深層次的語義理解則成了如今的研究熱點。目前,NLP技術(shù)在文本處理方面的主要應用有智能搜索引擎、機器翻譯、文獻摘要自動生成、文本分類等;在語音方面主要有智能客服、多媒體信息提取與文本轉(zhuǎn)化等。
同時,國內(nèi)NLP領域的創(chuàng)業(yè)公司不斷進行其商業(yè)化探索?!斑@一領域的應用和需求都相當大?!睘檐涖y、Intel、海爾等提供商用NLP技術(shù)支持的靈聚智能創(chuàng)始人張勝私下對筆者表示,銀行、稅務、教育、安保、旅游等行業(yè),智能家居、智能安防等領域乃至無人便利店等都需要用到此技術(shù),因此,他們即將推出開發(fā)者平臺和用戶自定義平臺來適應不同的客戶多樣化的業(yè)務或個性化需要。
據(jù)筆者的了解和總結(jié),目前檢驗NLP技術(shù)商業(yè)化是否好用主要有三個維度:
首先是準確度,一個含義是語義分析是否準確,是否能準確理解用戶的意圖,以及上下文的準確理解;另一個是應答是否準確,是否按照用戶的意圖精確應對,而不是用似是而非或包羅萬象的答案來應付。關(guān)于這一點,靈聚智能創(chuàng)始人張勝在接受筆者采訪時表示,從NLP到NLU,只做語義分析或僅依賴神經(jīng)網(wǎng)絡+大數(shù)據(jù)是不行的,例如語義只是其靈聚人工大腦核心技術(shù)的一個重要組成部分,而不是全部。在他看來,“自然語言處理所需要的技術(shù)和數(shù)據(jù)都是多維度的,語義分析只是其中一部分,基于大量語料的學習也需要適度人工干預,人類語言尤其是中文的表達方式實在是太豐富了?!?/p>
其次是速度,從學術(shù)角度來說,聊天機器人回答一個問題是1秒還是10秒都沒關(guān)系,但是要實現(xiàn)商業(yè)化,應答的時間不能超出用戶的心理承受極限,否則將嚴重影響用戶體驗。所以一般工業(yè)上要求NLP技術(shù)的響應時間不超過500毫秒,加上網(wǎng)絡延遲等因素,實際應答往往會超過1秒,再加上數(shù)據(jù)量越來越大,這個響應時間還會增加。這一點成為自然語言交互產(chǎn)品商用化非常影響用戶體驗的因素之一。有測試過多家技術(shù)的某上市公司一位智能家居產(chǎn)品經(jīng)理向筆者介紹,目前即便有企業(yè)做到200毫秒響應,但實際上聯(lián)網(wǎng)跑起來的體驗依然不佳,有的干脆直接在每一次應答前固定插入一段聲音來緩解用戶等候的焦慮,但這并非長久之道,只有想辦法進一步壓縮響應時間,這一點靈聚智能的應答速度令他印象深刻。經(jīng)筆者求證,靈聚智能目前能夠?qū)⒅悄茉频慕^大大部分場景如知識性和功能性場景的平均響應時間控制在20毫秒左右,把更多時間留給不確定的網(wǎng)絡延遲上;
第三個是靈活度,面向商業(yè)化的產(chǎn)品,用戶的需求總是個性和多樣性的,這對于NLP技術(shù)服務商提出了更高的要求,是否能夠有足夠的靈活度,允許用戶便捷的自定義手段達到自己的使用目的。在這一點上,靈聚旗下的核心產(chǎn)品靈聚人工大腦架構(gòu)是不限定場景的,從數(shù)據(jù)層、算法層、會話層到應用層,從一開始構(gòu)建就是為了不限領域的應用開發(fā)的。通過靈聚智能云和開發(fā)者平臺,具有研發(fā)能力的第三方企業(yè)和開發(fā)者可以很便捷的使用到靈聚提供的核心技術(shù)服務開發(fā)出自己的產(chǎn)品,而不懂得代碼的用戶也可以使用自然語言交互的調(diào)教模式或用戶自定義管理平臺通過可視化工具進行內(nèi)容和場景的自定義。
向BAT說不的理由

前有BAT巨頭的追逐,后有商業(yè)化的痛,留給這一領域創(chuàng)業(yè)企業(yè)的時間并不特別多。
以語音交互技術(shù)應用最為廣泛的智能音箱市場為例,目前整個智能音箱市場已呈現(xiàn)以亞馬遜Echo為排頭兵,國外有Google、微軟、蘋果,國內(nèi)有騰訊、阿里、京東相互追隨的態(tài)勢。
陣營越發(fā)強大,競爭也日漸白熱化。那么,作為夾在巨頭和C端產(chǎn)品公司中間提供技術(shù)服務的中小型公司,還有多少機會?
在語音識別領域,“云知聲”也是一個頗有名氣的玩家,商業(yè)化落地也做的不錯。2015年底“云知聲”完成了B+輪數(shù)千萬美金的融資,并開始了對公司品牌的升級——從智能語音公司,到物聯(lián)網(wǎng)人工智能服務商。云知聲布局人工智能,首先推出的是一個“云端芯”的概念。這個概念簡單解釋就是通過芯片將終端和云端連接起來。基于這個概念該公司開始實踐人工智能。云知聲要做的,是將AI芯放進從家電到汽車的各種產(chǎn)品里,讓它們都能連網(wǎng)并通過語音交互連接至云端服務。目前云知聲主要瞄準家居、車載、教育、醫(yī)療四塊市場,其中前兩塊是重中之重。
成立于2007年的蘇州思必馳信息科技有限公司,則主要聚焦在智能硬件領域的智能人機交互平臺,主要為智能車載、智能家居、智能機器人三大垂直領域打造人性化的自然語言交互方案,并專注原始技術(shù)創(chuàng)新及技術(shù)落地的商業(yè)化應用。在資本市場炙手可熱,在行業(yè)中也備受關(guān)注。
在筆者看來,這個市場足夠大,大到充滿想象。但也存在著一些問題,美國克瑞頓大學袁勁梅在寫給其被開除的學生的信中所述的問題也存在于許多方面,例如:弄虛作假甚至以偏概全的進行浮華宣傳,“炫技”多于實際能力。這樣實際上可能會導致用戶和投資人對真實技術(shù)水平和產(chǎn)品功能的誤判。做研發(fā)型企業(yè)也需要做學問的態(tài)度和堅持,因為商業(yè)而沒有底線終究是無法長久的。
此外,行業(yè)內(nèi)很多擁有技術(shù)實力的公司,還沒有建立起成熟可靠的商業(yè)模式,而是通過一些上下游的延伸來創(chuàng)造價值,比如上游連接語音和搜索引擎,為垂直行業(yè)提供內(nèi)容和服務,下游把語音和硬件產(chǎn)品結(jié)合,依靠銷售來實現(xiàn)營收。
尤其是在金融、教育、客服等需要與行業(yè)高度定制、服務和售后的公司,巨頭更不會輕易涉足,這也將成為技術(shù)類創(chuàng)業(yè)公司的機會。
不過,在一些智能家居、智能車載等to C領域,技術(shù)類創(chuàng)業(yè)公司可能要面臨著與巨頭直面競爭的局面,畢竟,這也是互聯(lián)網(wǎng)企業(yè)天然的C端優(yōu)勢,包括龐大的用戶基數(shù)、數(shù)據(jù)積累以及好的產(chǎn)品體驗等。
盡管如此,在與巨頭的關(guān)系上,中小型技術(shù)創(chuàng)業(yè)公司也擁有相當大的機會。拿此前被吐槽具有“復制”基因的騰訊來說,在移動互聯(lián)網(wǎng)最初發(fā)展的幾年中,很多合作伙伴并不愿意太早納入到巨頭身后站隊的行列。
AI領域更是,一些產(chǎn)品型公司加入這個市場,可能會陷入某些互聯(lián)網(wǎng)巨頭之間的競爭,不想太早站隊的公司反而會選擇類似靈聚科技這樣的服務商,這也是目前有實力的創(chuàng)業(yè)團隊所具備的優(yōu)勢所在。
事實也是如此。拿靈聚舉例,其在“默默無聞”中,合作伙伴已包括日本軟銀、IBM、Intel、海爾、康力優(yōu)藍、瑞芯微、中興通訊、神州云海等幾十家企業(yè)或機構(gòu)。
最后

在宇宙大爆炸理論中,“奇點”是指由爆炸而形成宇宙的那一點,即宇宙從無到有的起點。而在美國著名科學家、奇點大學校長雷·庫茲韋爾撰寫的《奇點臨近》一書中,他認為“奇點”是指電腦智能與人腦智能相互融合的那個美妙時刻。沒錯,這個美妙時刻正在到來。
據(jù)統(tǒng)計,2020年全球人工智能市場規(guī)模將突破萬億元大關(guān)。尤其是隨著人工智能首次寫進《政府工作報告》成為輿論焦點,人工智能也成為今年炙手可熱的科技關(guān)鍵詞。
在未來通用智能時代,除了自然語言處理、計算機視覺等AI技術(shù)在某些領域的直接應用,人工智能更大的影響在于將重塑生活服務、醫(yī)療、零售、數(shù)字營銷、農(nóng)業(yè)、工業(yè)、商業(yè)等各行各業(yè),并將引發(fā)新一輪IT設備投資周期。智能化的大潮即將來襲,萬億元的市場規(guī)模值得期待。
文/熊熊(熊出墨請注意)
請登錄以參與評論
現(xiàn)在登錄