背景
隨著數字化時代的到來,外賣市場近年來發展非常迅猛。對外賣物流系統而言,配送效率和用戶體驗至關重要。而實際配送過程是由配送員(騎手)最終完成的,因此,想要真正提升配送效率,不但要在智能調度系統(訂單指派、路徑規劃、ETA)上下功夫,還要不斷提升配送員的“附加”能力,讓他們越送越“熟”外賣配送系統,越送越“順”,越送越“快”。以此為出發點,美團點評研發團隊設計了騎手智能助手,全面提升騎手的各方面能力。
在 1月份的AICon全球人工智能與機器學習技術大會上,美團點評配送人工智能方向負責人何仁清分享了《美團騎手智能助手的技術與實踐》。講解如何在使用環境復雜、用戶群體多元化的情況下,以智能耳機和語音交互為載體,并通過大數據挖掘、機器學習、自然語言處理等技術,讓智能助手具備復雜場景精準識別、服務智能推送,智能引導、全語音操作等能力。最終在智能、安全、便捷、精準等多個維度上,全面提升騎手配送能力,從而提升整個配送效率和用戶體驗。以下系演講內容整理:
AI技術對同城配送的業務價值
總體而言,物流業務是一個比較傳統的行業,但是隨著整個電商、移動互聯網和移動支付的興起,近些年整個物流行業實現了持續和高速的發展。
上圖系中國物流與采購聯合會在 2016年發布的一個報告,調研數據表明,全國物流件數環比增長超過 50%,達到 300多億件。
同時整個物流的費用占比也很高,從圖中可以看到,物流成本已經占據 GDP的 15%。而在歐美國家以及日本,這個比例大概只有 8%~9%左右,所以中國的物流行業還有很大的優化空間。這也是很多公司大力投入去做物流行業的一個很重要的原因:行業正處于高速發展階段,而且體驗、效率和成本方面都有巨大的優化空間,大有可為。
下圖主要介紹了美團外賣現在的發展情況:
美團外賣從2013年啟動,目前大概能夠服務 2.5億用戶,已經覆蓋1300多個城市,能夠為 200多萬商戶提供服務,日峰值訂單超過 1800萬。美團外賣智能配送調度系統每天匹配50多萬外賣小哥,基于海量數據和人工智能算法,確保平均配送時長不超過 28分鐘。這也是目前世界上規模最大、復雜度最高的多人、多點實時智能配送調度系統。
我們對美團配送的定位是:做成最大的即時配送平臺。
相比傳統物流,即時配送包括以下幾個優勢:
總體來說,配送是一個非常復雜的業務,為了能夠便于大家理解,我把這個業務模型進一些抽象和簡化,可以用下面這張圖來進行說明。
從本質上來講,配送主要是把用戶的配送需求和線下的各種運力(比如說騎手或車輛之類)進行匹配的過程。匹配分為線下匹配和線上匹配,線下主要靠運營,線上就是我們技術部門所構建一些系統。從這個層面而言,我們要解決的主要是在這個需求和運力之間,如何實現最優匹配的問題。
這其實也是一個相對比較傳統的問題,像做廣告或者推薦,都會面臨這個問題,需求是要推薦的產品,供給是廣告位置,但位置并不是無限多,如何在需求和供給之間達到最好的匹配,這本身就是效率優化問題,只不過廣告和推薦使用的 CTR預估,而物流中使用的方法更加復雜一些。
配送中的復雜性,具體來說有幾點:
對美團配送來說,要完成這個任務,需要分為大概三個層次,如上圖最右側所示。
以上,主要是我們對整個配送的理解,接下來講述如何使用技術手段來進行落地和實踐。
對于 AI問題來說,整個配送在AI問題中的分類應該是什么樣?下圖給出了一個解釋。
我們可以從兩個維度來看AI問題。一個維度,是看機器與人工的對比,速度上是不是比人工更快,是不是比人工的效果更好。
另一個維度是AI所發揮的作用。首先是不是能夠感知世界,比如說現在做得圖像識別、語音識別以及OCR,都是像人一樣能夠感知這個世界。其次是不是能做到認知,比如說了一句話,“今天天氣怎么樣”,不但要把語音翻譯成文本,這里講的是“天氣”這個實體,還有“今天”這些限定因素。第三就是要做決策,現在比較火的人工智能應用都在“如何做決策”這個層面,而且要做比人做更好的決策。一些代表性應用,比如智能助手,特別是輔助人進決策權的(聊天機器人會差一些),可以幫你完成更好的任務;比如無人駕駛;比如在物流領域,如何分配訂單,并通過無人車或別的方式交付訂單;還有在游戲和醫療里面,AI輔助醫生做決策,在游戲里面,當用戶掉線時,游戲AI可以幫助用戶打怪升級。
可以看到在配送層面,我們會涉及智能助手、智慧物流、無人駕駛等多個維度,而為了提升配送的整體智能化程度,我們構建了自己的“美團配送 AI”,具體來說分為兩大部分:
為了完成這個“美團配送 AI”的具有挑戰的目標,并考慮整個行業的長期發展,我們在整個人工智能上的布局如下:
而美團外賣語音助手就屬于我們在廣度和深度結合比較好的案例。接下來就和大家分享一下我們在整個智能助手的實踐和設計過程中,以及在整個物流業務中,如何將人工智能技術更好的落地的一些經驗。
美團外賣智能語音助手定位
我們為什么要智能語音助手?騎手到底在什么情況下需要智能助手服務,整個服務里面的關鍵是什么?先解釋一下這個問題。如上圖所示,這個是整個騎手在配送過程中遇到的一些環節,可以分為兩大部分。
第一部分是線上的決策,而且涉及的決策各式各樣。舉個例子,這個騎手有定單,要送到一個用戶那里,他可能要做幾個決策,比如說要不要給用戶打電話,因為有些地方是不用打電話的,像住宅樓里面,騎手有很大概率知道這個用戶應該在家里的,不用打電話;有些必須打,比如寫字樓,因為騎手上不去,所以需要提前打電話讓用戶下來。
但需要提前多長時間呢?是提前一分鐘,兩分鐘,還是五分鐘?這個問題很關鍵,如果打電話時間比較早,用戶就會提前下來,會造成用戶等待騎手的問題,用戶體驗不好,可能會有投訴。如果這個騎手非常保守,到樓下再打,但用戶住在 10層,那么用戶下來包括等電梯的時間可能要需要 10分鐘,效率會變得非常低。
第二個部分是騎手操作過程,因為騎手會頻繁和手機交互。他要查看一個定單,步驟非常復雜,把手機拿出來,解鎖,打開 App,查看信息,做操作(比如說點擊完成),最后放回手機,大概需要五到六個過程。如果操作快,也需要 10到 20秒鐘。而且很多騎手是在騎行過程中做這些操作的,這樣會非常危險。
總結一下,配送騎手遇到的困難可以總結為三個大的層面:
基于這些考慮,我們做了美團外賣語音助手,它的定位主要包括以下三點:
上文的分析,基本上將我們怎么把智能語音助手在場景里落地的最關鍵的點分析出來了。我們要落地,最核心的就是要幫助騎手完成配送任務,而不是“聊天”或者“問答”。這就要求語音交互整個過程要非常便捷,同時也非常智能。
而我們遇到的第一個挑戰,就是交互模式如何設計的問題。
如上圖所示,左側是一般的語音助手方案,需要喚醒、應答、請求和再應答四個步驟,但是并不符合配送場景的要求。首先,騎手所在的場景,噪音很大,比如風噪、汽車噪音以及商場噪音等等,喚醒比較難實現。其次,需要四個步驟,還要考慮騎手的工作狀態,這個操作過程太繁瑣。
那怎么辦?我們思考,是否能做到一套不需要喚醒的解決方案呢?答案很肯定,可以做!
舉個例子,一個騎手身上可能有幾個訂單,他正在朝一個地方前進,通過場景分析,我們知道他要給具體哪個用戶配送,而且我們能了解用戶在這個樓里的幾層,下來大概需要幾分鐘,所以能夠推算出來,大概在哪個時間點提醒騎手打電話比較好。這樣我們就可以省略喚醒和應答流程,直接給騎手發提醒,騎手只要回答是或否夠可以了。這樣設計才符合騎手線下的實際配送情況,能夠真正給騎手解決實際問題,才能夠真正稱之為“智能”。
AI核心技術
具體技術分為幾個主要的部分。第一個部分是基礎設施,包括語音識別和語義理解,現在這方面開源的東西非常多,做通用的語音識別不是很難。
在我們場景中,要解決各種環境噪音的問題,可能騎手并沒有說話,但旁邊有些噪音,車的噪音或者別的噪音,甚至路上正在放一個歌,都會被識別為是騎手在說話,所以 VAD(靜音檢測)方面需要做很多工作。
另一個基本的組件是NLU,自然語言理解。舉個例子,騎手要給尾號 6551打電話,首先系統要知道,騎手的意圖是要打電話,后面要調起打電話的操作;其次要知道打電話的對象是誰,是用戶,而不是商戶,這就要找出用戶信息;第三,要做檢測,比如騎手已經送完某個訂單,再打電話可能是錯誤操作,需要提醒騎手。
即時配送場景是一個典型的時間序列問題。從上面的圖可以看出,場景包含前后關聯,一個騎手歷史的行為和決策會影響現在,同時現在的決策和行為會影響未來,這是個典型的時間序列問題。
場景識別要解決的兩個主要目標,一個是事件預測,要知道下一時刻大概會發生什么事情,比如騎手是不是已到商家,商家是不是已經出餐;另一個是時機預測,未來要打電話,到底什么時候打更合適?
為了更好的說明,舉個打電話的案例。
首先,要判斷是否需要打電話,如果在不需要的場景也頻繁提醒打電話,對騎手和用戶都是騷擾。上圖列舉了不同地址類型下騎手打電話的比例,可以看到,像在企業和寫字樓里面比例很高,但是住宅區就很低了,因為在住宅區,很大概率用戶都是在家的。
其次,要針對每一個小區和樓宇類型,給一個合適的打電話時機,即提前多久打電話,對騎手和用戶是最好的體驗。打電話太早,用戶在樓下等騎手,體驗比較差。 打電話太晚,騎手在樓下等用戶,效率太低。我們有精準的騎車軌跡數據,我們知道針對每一棟樓、每個小區,騎手在不同時刻打電話時會在樓下停留多久,所以可以畫出一個曲線。合適的區間就在兩條紅線之間。
前兩個主要是大數據分析,最后要實時決策,哪個訂單,什么時刻需要打電話。這里就要根據騎手的實時數據了,包括訂單狀態、軌跡狀態、環境情況等等,結合前面的大數據分析進行實時的預測騎手下一個配送地點和配送任務,并在合適的時機通過語音助手給出提醒。
具體到實現方面,場景識別需要三方面的技術:騎手軌跡挖掘、機器學習和數據挖掘。
先介紹一下軌跡,我們每天能有幾十億次的定位數據,進而可以基于這些數據做很多事情。
我們可以通過騎行軌跡來修正導航和定位。來看兩個例子。
第一個例子(左側)用戶在下單時定位的分布,因為大家在室內下單,定位偏離是非常大的。但通過騎手軌跡的修正,實際上大概只有四個點,每個點可以認為是這個這棟樓的一個門口,這大幅提升了用戶的定位精度,讓騎手配送更容易。
第二個例子(右側)通過騎手軌跡對 AB兩個點的騎行路徑進行修正,上圖中軌跡分析發現了更短路徑,穿過小區更節省時間;下圖中,原地圖導航要跨過中間過街天橋,但通過軌跡發現更多騎手是繞行通過,這才更符合真實的情況。
下面介紹一些機器學習相關技術,主要是應用在各種時間預估層面。
只有高精度的 ETA(預計到達時間)預估,這樣才能更加準確的預測騎手行為,我們會做三個維度的精細預估,包括平面的配送時長、上下樓時長以及商家出餐時長。這樣才能比較全面和精細的刻畫騎手的配送過程。
為此,我們做了很多基礎工作,比如實時特征平臺,機器學習平臺,包括深度學習在內模型等各種機器學習相關工作。同時我們還會做比較精細的配送知識圖譜建設工作,比如精細化地址解析。
地址對配送來說是非常重要的信息,通過 NLP和地圖搜索的方法,解析成層次結構,對分析商圈、樓宇維度的畫像非常有幫助。我們把一個地址分解為四個層次,小區、樓號、單元號和樓層等。其中要解決很多實際問題,比如用戶填寫的信息完全不標準、存在歧義等問題。
做了這些工作之后,能實際產生的效果還是很有意思的。我們通過“上下樓時間”這個具體場景來進行分析。
整體效果
上面整體介紹了語音助手依賴的場景識別技術,現在介紹一下語音助手的整體效果。首先語音助手提供了四個核心功能,包括定制耳機、語音交互、場景識別、智能引導等。
為什么要定制耳機呢?在騎手的使用環境中,需要克服很多噪音,很難通過軟件和程序去做,而必須通過硬件去做。所以我們和廠商進行合作,定制去噪效果好的硬件。
第二個功能是語音交互,它可以在派單、查詢、取餐、撥打電話等配送全流程中實現語音交互,騎手整個過程中不需要看手機,只要耳機提醒就可以完成智能配送。
第三個是智能引導功能,包括安全駕駛提醒,信息播報,任務地圖引導等,主要是讓騎手行駛更加安全,提供全面的信息服務,讓騎手配送更加方便和高效。
下圖是智能語音在線下推廣中的一些實際數據。
藍色的線是使用語音助手的騎手的操作次數,綠色的線是不使用的操作次數。可以看到,操作次數明顯下降。但是還沒有降為 0,有兩個原因:騎手在靜止狀態下,不需要使用語音助手;有些騎手的藍牙耳機還沒有下發到位。再來看下一張圖:
左圖是騎手接單時間時長分布,越往右騎手接單的時間越長外賣配送系統,用戶體驗越差。綠色的線就是之前騎手手動接單的一個分布,長尾情況比較嚴重,通過語音接單,接單時長明顯向左側靠攏,整體接單時長明顯縮小,比較好的提升了用戶體驗。
右圖是騎手在用戶交付外賣所花費的時間的比例,橫軸是騎手在樓下等待用戶的時長,越往右,騎手在樓下等用戶的時間越長。通過語音的提醒后,可以明顯降低騎手長時間等待的情況,節省了大量騎手的時間。
寫在最后
總結一下,語音識別和語音助手在實際落地過程中面臨很多挑戰,而且大多和場景有關系,場景識別非常重要,甚至比語音識別更為重要。
因為語音識別現在已經是比較通用的技術了,而且有很多專業廠商提供服務,硬件也是如此,進行定制化相對比較容易。因此目前做一個軟硬件結合的語音助手,從基礎技術來講都不是問題,想做一個 DEMO并不會存在太大的技術障礙。
反而在具體的業務中,如何結合業務場景,把語音助手落地,才是我們需要真正考慮的。也就是說,如何將語音助手從“能用”做到“好用”,再做到讓用戶“愿意用”,這些才是未來語音助手面對的真正挑戰。
語音識別和語音助手在實際落地過程中有很多挑戰,而且和場景有關系,場景識別比較重要的,甚至比語音識別更為重要,因為語音識別現在已經是比較通用的技術了,如何結合業務場景,把語音助手落地、用好,可能是未來一段時間的挑戰。
為了實現配送的全面智能化,美團點評在其中做了大量工作和嘗試,這里不單單是要做好機器學習,還包括如何進行更好的實時運籌優化、實時空間數據挖掘以及人機交互等多個方面的技術內容。
作者簡介
免責聲明:部分文章信息來源于網絡以及網友投稿,本站只負責對文章進行整理、排版、編輯,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如本站文章和轉稿涉及版權等問題,請作者在及時聯系本站,我們會盡快為您處理。