台灣大車隊:用 Vertex AI 打造預測叫車熱點的機器學習模型,提升計程車駕駛的載客效率
為了降低計程車駕駛的空車率,並提高團隊生產力,台灣大車隊在 Google Cloud 上建立了資料倉儲,以支持 Vertex AI 上能準確預測叫車熱點的機器學習模型,同時加速業務分析報表的生成。
Google Cloud 結果
1. 在 Vertex AI 上建立的預測叫車熱點機器學習模型協助降低計程車駕駛的空車率達 8%,減少汽油成本
2. 處理資料的時間從一天縮短為 6 分鐘
3. 即時生成業務分析報表,加速決策過程
4. 自動化功能讓小型資料分析團隊得以進行更大範圍、更複雜的分析
在台灣的都會地區,計程車是一個不可或缺的交通工具。政府統計數據指出,台灣超過 20 億美金的計程車市場吸引了不少跨國叫車公司加入,為當地的計程車業者帶來了競爭壓力。
為了提升在市場上的競爭力,台灣大車隊成為台灣計程車業界進行數位轉型的先驅。2011 年,台灣大車隊推出了自家的叫車應用程式,運用 Google Maps 大幅簡化了乘客叫車的流程。除此之外,該公司也開發了一款協助計程車駕駛更有效率載客的APP,讓駕駛不用在馬路上迷茫找乘客在哪?
「台灣大車隊將自己定位為以人為中心、科技驅動的服務媒合平台,」台灣大車隊大數據發展事業處主管林念臻表示:「我們一直在改善我們的科技服務,讓乘客的生活更方便,並協助計程車駕駛處理日常業務。例如,我們的叫車應用現在也提供居家清潔、洗衣等居家服務。」
目前,空車率過高是台灣計程車駕駛面臨的主要挑戰之一。由於大多數計程車駕駛都靠經驗尋找乘客,他們往往必須花許多時間在火車站等傳統叫車熱點前排隊等候,或是開著空車到處找下一個乘客。台灣交通部公布的一項調查顯示,台灣 40% 的全職計程車駕駛將三分之一的工作時間花在尋找或等候乘客上。
為了協助全台灣旗下 22,000 名計程車駕駛提升生產力,台灣大車隊在 2020 年初決定打造一個能根據該公司過去幾年的乘車紀錄,準確預測叫車熱點的機器學習模型。同時,台灣大車隊也希望能將一部分的內部資料從地端資料庫搬到雲端,以增進資料分析的能力,做出更快、更好的商業決策。在評估過幾家雲端服務提供商之後,台灣大車隊選擇用 Google Cloud 和 Vertex AI 來建立其機器學習模型,並進行地理空間資料分析。
「我們之所以會決定遷移到雲端,不只是為了提升資料處理的效率,也為了利用 AI 技術完全發揮資料的價值,」台灣大車隊大數據發展事業處專案經理蔡欣融解釋:「Google Cloud 的頂尖 AI 技術,以及其在雲端資料倉儲中進行地理空間資料分析的能力,絕對可以幫助我們更好地運用我們的資料,提供更優質的服務。」
運用 Vertex AI 和 BigQuery 降低計程車駕駛的空車率
為了要在 Vertex AI 上打造預測叫車熱點的機器學習模型,台灣大車隊首先建立了將存有所有乘車紀錄的地端資料庫與 BigQuery 上資料倉儲連接的資料傳輸系統。每個叫車紀錄的時間和地點都會以每五分鐘更新一次的頻率上傳到 Cloud Storage,經由 Cloud Functions 和 Cloud Run 即時處理,再匯入 BigQuery 以供分析。
根據這些過往資料紀錄,台灣大車隊和其夥伴、AI 和雲端服務提供商 CloudMile 聯手在 Vertex AI 上開發了可以提前 15 分鐘預測叫車熱點的機器學習模型,準確率超過 90%。台灣大車隊的駕駛可以在駕駛應用程式上看到根據他們所在位置算出的熱點預測結果,讓他們能更輕易、更有系統地找到下一個乘客。
「叫車熱點預測模型對我們的新駕駛和兼職駕駛特別有幫助,即使開計程車的經驗較少,他們也能有更高的機會找到乘客,」蔡欣融說:「在 Vertex AI 上機器學習預測模型的協助下,我們計程車駕駛的空車率降低了 8%,不僅減少了汽油成本,也降低了廢氣的排放。在 COVID-19 疫情改變人們叫車的習慣時,機器模型的即時分析也幫助我們的駕駛迅速適應新的市場環境。」
以強大的資料處理能力支持高分析效能
對於台灣大車隊的資料分析團隊來說,使用 Google Cloud 最大的好處就是資料處理速度得到大幅提升。由於儲存在 Cloud Storage 上的資料可以直接在 BigQuery 上檢索並分析,台灣大車隊得以在 Google Cloud 上將資料儲存和資料分析分開進行,只在 BigQuery 上進行資料分析,以維持資料處理的高效能。這個架構讓台灣大車隊能無限制地上傳資料,不用擔心儲存的資料太多會影響資料分析的速度。
林念臻指出,Google Cloud 這個分工架構所提供的高資料分析速度,讓台灣大車隊的團隊十分驚豔。「在使用 Google Cloud 以前,我們在地端處理 70GB 的資料需要一整天才能完成。現在,我們只要一到六分鐘就可以在 Google Cloud 上處理相同數量的資料,」她補充說。
隨著需要處理資料的數量增加,台灣大車隊使用 Cloud GPUs 來進一步提升機器學習模型的運算速度,並運用 Cloud Logging 和 Cloud Monitoring 紀錄日誌檔,以供錯誤發生時查明原因。除此之外,台灣大車隊也用 Cloud NAT 和 Virtual Private Cloud 來建立高度安全的專用網路,確保資料安全。
「Google Cloud 讓我們得以快速地建立具有高分析效能、高拓展性和高安全性的資料倉儲,」林念臻說:「如此一來,在遷移過程中,我們可以花更多時間專注在改善機器學習模型上,而不需要太過擔心基礎架構的問題。」
即時生成報表,加速商業決策過程
在將資料倉儲遷移到 Google Cloud 之前,台灣大車隊完全仰賴資訊部的員工手動撈資料並製作業務分析報表。要手動製作一份報表,往往需要兩到三天,不只十分耗時,也容易發生人為錯誤。
在 Google Cloud 上,台灣大車隊透過 Compute Engine 上的虛擬機器,將 BigQuery 上的資料倉儲連接到一個第三方商業智慧軟體。由於資料在 BigQuery 上就已經經過分析處理,只要點幾下滑鼠,該商業智慧軟體就能立即生成並視覺化業務分析報表。如此一來,台灣大車隊的主管們便可以在任何需要的時候獲得商業洞見,大幅加速了決策過程。
「自動化帶來的業務分析效率和準確率提升對我們來說非常重要,因為我們內部只有三名資料分析師,」林念臻表示:「由於人力上的限制,我們以前只能處理少量的資料,進行簡單分析。現在,我們有能力進行更大範圍、更複雜的資料分析,而且需要的時間更短。」
發揮資料的價值,提升計程車的乘車體驗
有了 Google Cloud 的資料分析工具,台灣大車隊現在已經準備好繼續發揮資料的價值,進一步增加駕駛的營運效率,並提升乘客的乘車體驗。台灣大車隊計畫將更詳細的資料匯入 Vertex AI 上的叫車熱點預測模型,以在大城市裡更精確地指出叫車熱點。在更長遠的未來,台灣大車隊也希望能根據即時叫車熱點預測派遣計程車駕駛,縮短乘客的等候時間。
此外,為了確保乘客的安全,台灣大車隊也計畫用 Vertex AI 上的機器學習模型分析計程車行車記錄器錄下的影像,辨識危險的駕駛行為。
「Google Cloud 的資料分析和機器學習工具協助我們達到的初期成果,讓我們有信心繼續擴大資料分析和應用的範圍,」林念臻說:「我們相信,我們的資料還潛藏許多未釋放的潛力,可以讓我們進一步提升生產力,並持續改善服務。」