《人物》雜志發表了《外賣騎手,困在系統里》一文,文中從外賣騎手的視角出發,探究了目前外賣生態中外賣騎手送餐只能越來越快、越來越不顧自身安全的隱憂,導致你們對于外賣平臺以及其所設計下來的算法的批判,但是在序言中發起一個思索:
數字經濟的時代,算法到底應當是一個怎么的存在?[1]
固然,外賣平臺作為這一切的最大利益獲得者,是導致外賣騎手僵局的重要誘因;而且假如企圖把責任推給算法,把解決外賣騎手僵局的方式歸結于“加強程序員的培訓和價值導向”、“讓外賣平臺所有的產品總監和算法工程師都去當一個月騎手”,這么我們想說,數字經濟時代的算法不背這個鍋。
為何如此說呢?
為了研究外賣平臺所使用的算法,我們仔細閱讀了一篇由阿里本地生活智慧貨運團隊發布的論文《OrderCycleTimeforOn-Food》(外賣履約時間預估)[2]。該論文首次比較系統地披露了外賣平臺(餓了么)目前采用什么特點怎樣設計算法來預估從客戶下單到外賣員送餐到客戶手上所使用的時間,被KDD2020(數據挖掘領域頂尖大會)接收為口頭報告論文。
且聽我解釋。
一、關于算法導致騎手僵局的邏輯
《外賣騎手,困在系統里》一文中透漏下來的邏輯美團騎手系統派單破解,或則說你們腦海里關于算法導致騎手僵局的邏輯是這樣的:
首先,算法按照歷史數據決定減短配送時間,騎手為了防止訂單超時只得狂飆、逆行、闖紅燈,而騎手的這種舉動確實把實際送餐時間減短了,形成了更多的短時長數據,算法按照這種短時長數據決定再減短配送時間。這樣惡性循環讓騎手的配送時間越縮越短,算法讓騎手越來越深陷困境。
在這期間,算法只按照飯店到客戶的直線距離決定騎手配送時間,而不管實際路況、天氣狀況、餐廳出餐時間、騎手等扶梯時間。算法總是以盡可能減短配送時間為目標。
是這樣的嗎?
二、算法的目標
首先,我們這兒所說的算法,指的是通過歷史訂單等各類數據,找出影響配送時間的誘因及權重,以決定下一次騎手送餐時間長短的方式。
例如說,如果我們只把店家與下訂單者之間的距離作為誘因,現有3個歷史訂單數據:1公里內配送時間為15分鐘,2公里為30分鐘,3公里為45分鐘,這么我們按照這種歷史訂單數據就可以得出一個完美擬合歷史數據的算法模型:配送時間=距離*15。下一個訂單假如店家與下訂單者之間的距離是1.5公里的話,我們就可以使用這個算法模型預測騎手的配送時間為22分鐘30秒。
通過《OrderCycleTimeforOn-Food》這篇論文(下稱論文)我們曉得,餓了么平臺是通過設計一個深度神經網路算法來預測訂單的配送時間。
它的做法是選擇好多影響配送時間的誘因,使用歷史數據訓練一個深度神經網路,企圖找到一組參數讓這個深度神經網路算法預測下來的配送時間跟歷史訂單的配送時間最接近(也就是最小化算法的目標函數),這樣算法的預估配送時間就越確切。也就是說,這個算法的目標是怎樣讓算法愈發確切地擬合歷史數據,而不是盡可能地減短配送時間。
三、算法是受歷史數據影響的
里面說了,算法的目標是愈發確切地擬合歷史數據,以確切地預測配送所需的時間,所以毋庸置疑,算法是受歷史數據影響的。歷史數據的結構性變動會影響算法的參數。
回到前面簡單的事例,如果現今平臺上有兩名騎手,自愿或則被動地推動了送餐速率,其中一名騎手送2公里的餐食只用了20分鐘,一名騎手送3公里的餐食只用了25分鐘,這么對于算法來說,繼續使用【配送時間=距離*15】這個算法模型來預估送餐時間就早已不確切了,它可能會手動學習并調整為【配送時間=10+距離*5】,以更好地擬合新的數據。
這樣的話,看右圖可知小于1公里的距離,新算法模型的預測配送時間都減短了。這就是騎手推入困境的誘因。
并且這是算法的責任嗎?不是的。如果騎手集體延長配送的時間,算法也會修改自身的參數去擬合新的數據,這樣新算法模型的預測配送時間就會延長(其實這在實際中幾乎不可能發生)。
所以說,這并不是算法的責任,由于它天生的目的就是通過最小化目標函數來擬合歷史數據。那是誰的責任呢?我們前面再談這個。
四、算法預估配送時間采用的誘因
想要確切地按照歷史數據來預測配送時間,就必須考慮到各類影響配送時間的誘因,之后通過計算機來學習訓練出這種誘因影響配送時間的權重。為此,餓了么在設計算法時,從歷史數據中提取出了好多的誘因,這種誘因分為以下幾類:
1.訂單信息:包括訂單的空間誘因(用戶、餐廳的座標,城市、配送區塊的ID等)、訂單的時間誘因(小時時刻、是否工作日等)、訂單大小(食材數目和價位等);
2.聚合誘因:包括通過騎手手機的GPS軌跡等估算下來的聚合誘因;
3.食材誘因:例如說面條、披薩、火鍋等不同食材的種類等;
4.飯店備餐時間
5.供需關系誘因:一是騎手的供需關系(騎手手上的訂單越多,送餐越慢)、二是飯店的供需關系(飯店手上的訂單越多,備餐越慢);
6.騎手誘因:包括騎手到飯店的距離、騎手目前手上未完成訂單數目、訂單送達剩余時間等
7.多維度相像訂單的配送段ETA:配送段預計抵達時間即騎手抵達用戶目的地下車后,把餐食送到用戶手中所用的時間,例如說包括騎手等扶梯的時間;這部份時間的預估采用K近鄰算法找出與之維度相像的若干歷史訂單,估算加權平均時間;
8.氣象誘因:包括溫度、空氣質量指數、風速、天氣狀況等;
因而從前面所列的誘因看,算法工程師在設計算法的時侯,并非沒有考慮天氣狀況、餐廳出餐時間、騎手等扶梯的時間。基本上影響外賣履約時間的誘因,算法都考慮進去了。
那為何最后算法給出的預測時間,似乎是沒有考慮這種誘因呢?我們來瞧瞧論文中通過歷史數據提取這種誘因進行訓練得出的每組誘因的重要程度:
【注:這兒每組誘因重要程度使用清除掉這組誘因引起整個模型的平均絕對偏差(MAE)上升比率來比較,假如一組誘因去除后模型的偏差上升越高,說明這組誘因對于決定外賣履約時間越重要】
由表可知美團騎手系統派單破解,訂單信息、供需關系兩組誘因是影響外賣履約時間最重要的誘因,而氣象誘因、聚合誘因、菜品誘因是通過歷史數據學習到的、影響外賣履約時間最不重要的誘因。
哪些意思呢?意思就是說:算法在設計的時侯是考慮了氣象、騎手徒步軌跡等誘因的,并且騎手通過實際的歷史訂單數據告訴算法,這種誘因對于配送時間并沒有太大的影響。
然而如何會沒有影響呢?低溫天氣、暴雨天氣,騎手們的送餐時間跟平時沒哪些區別,緣由是哪些呢?就是騎手們為了防止超時,風里來雨里去嘛。
五、責任在誰?
如今我們從算法角度來總結一下:算法的目的是確切預估配送時間,它受歷史數據的影響,也考慮了多種誘因來預估配送時間。所以說,數字經濟時代,算法是沒有錯的。
這么究竟是誰導致了騎手們的困境呢?這就得回到這個循環,從是誰減短了騎手的配送時間說起。在這兒,主要的參與者有外賣平臺、騎手和用戶二者,我們明白,兩者都是逐利的(這無可厚非)。
其中外賣平臺是逐利的,因而它會人為地減短騎手的預計配送時間,借助算法的特點把這個無限循環惡化的游戲玩上去;
騎手也是逐利的,你們都想接更多的單賺更多的錢,所以一開始的時侯就有一部份騎手不遵循交通規則開始逆行、闖紅燈以減短配送時間,這促使算法預估配送時間變短、越來越多的騎手不得不開始逆行、闖紅燈,殊不知就這樣劣幣驅逐良幣,開始深陷惡性循環;
用戶也是逐利的,你們都想要在更短的時間內領到外賣,于是對外平臺和騎手的配送時間提出了要求。
所以說,對于騎手的僵局,外賣平臺、部分騎手、用戶二者都是有責任的(其實最大的責任方在外賣平臺)。惟有算法是任人裝扮借助、專門甩鍋的小女孩。
六、如何破解難題?
這么怎么破解目前的這個難題呢?有人說騎手團結上去構建一個工會能夠解決,有人說要讓外賣平臺跟騎手簽署勞動協議,這種從不同領域的角度出發的方式其實會有療效,可以留給專業人員去討論,我們不討論。
但是甚至有人說要強化程序員的培訓和價值導向?試想一群程序員出席完價值導向培訓以后回到辦公室,加班到晚上2點,第二天9點之前又通過釘釘打卡來下班,領導批評說模型形成的實際效益還不夠好,再把騎手的預估時間減短幾分鐘吧,不然大家這個月的績效就別指望了。這多奇幻現實主義呀。
這么究竟怎樣破解難題呢?在我看來,這還得看這場游戲中究竟誰在獲利誰在巨虧。
外賣平臺通過這個游戲提升效率,肯定是獲利的;部份騎手一開始是獲利的,而且你們都為了時間不顧生命危險拚命趕單時,便是巨虧的;用戶享受到了極其方便快速的外賣服務,也是獲利的。
還有誰呢?還有就是社會大眾。騎手為了省時逆行闖紅燈,社會大眾徒增了好多公路交通安全里面的危險,是巨虧的。涉及到社會大眾的問題,使用屬于大眾的公權利來解決是一個合理的選擇。
面對外賣平臺,須要有監督和懲罰機制,當重罰也被納入考慮誘因的時侯,便能促使平臺去規范自身的行為;
面對騎手,天津實行的電子馬甲騎手扣分制,便是一個思路:每位騎手必須穿上印有編號的電子馬甲,一個季度齊肩完36分不容許再上路。
面對用戶,平臺應當給以騎手對于用戶給差評的申述機制,以及騎手和用戶之間的單向評分機制,防止用戶無理要求以及隨便給差評。
至于算法,不管是不是數字經濟時代,關鍵的都不是算法,而是資本和人。
引用:
上一篇:客來云掃碼點餐功能正式上線
免責聲明:部分文章信息來源于網絡以及網友投稿,本站只負責對文章進行整理、排版、編輯,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如本站文章和轉稿涉及版權等問題,請作者在及時聯系本站,我們會盡快為您處理。