Gate 廣場創作者新春激勵正式開啟,發帖解鎖 $60,000 豪華獎池
如何參與:
報名活動表單:https://www.gate.com/questionnaire/7315
使用廣場任意發帖小工具,搭配文字發布內容即可
豐厚獎勵一覽:
發帖即可可瓜分 $25,000 獎池
10 位幸運用戶:獲得 1 GT + Gate 鸭舌帽
Top 發帖獎勵:發帖與互動越多,排名越高,贏取 Gate 新年周邊、Gate 雙肩包等好禮
新手專屬福利:首帖即得 $50 獎勵,繼續發帖还能瓜分 $10,000 新手獎池
活動時間:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49112
大規模電子商務:軟體工程師如何系統性解決屬性混亂
排序產品屬性聽起來很簡單——直到你必須為三百萬個SKU執行此操作。電子商務系統的隱藏複雜性並不在於分散式搜尋或即時庫存等巨大挑戰。真正的支柱是資料一致性:尺寸、顏色、材質及其他產品屬性必須以精確且可預測的方式結構化。
這個問題是真實存在的。在實際的產品目錄中,可以看到混亂的值:尺寸如 “XL”、“Small”、“12cm”、“Large”、“M”、“S” 混合使用。顏色如 “RAL 3020”、“Crimson”、“Red”、“Dark Red”。材質如 “Steel”、“Carbon Steel”、“Stainless”、“Stainless Steel”。每一個不一致看似微不足道,但在數百萬產品中會形成系統性問題。篩選器運作不穩定,搜尋引擎的相關性降低,客戶體驗受到影響。
核心策略:具有明確規則的混合智慧
而非使用黑盒式AI,一位軟體工程師設計了一個受控的混合流程。目標不是神祕的自動化,而是一個同時具備以下特點的解決方案:
此流程結合了大型語言模型(LLMs)的情境思考能力與確定性規則及商家控制。它能智能行事,但始終可追蹤——是有導引的AI,而非失控的AI。
離線處理取代即時:一個策略性決策
所有屬性處理都在背景作業中進行,而非在即時系統中。這是有意為之,因為在電子商務規模下的即時流程會導致:
相較之下,離線作業提供:
這種客戶界面與資料處理流程的分離,在數百萬SKU的情況下尤為關鍵。
處理流程:從原始資料到智慧
在應用AI之前,會進行一個關鍵的預處理步驟:
此步驟大幅降低雜訊,並顯著提升語言模型的思考能力。規則很簡單:乾淨的輸入=可靠的輸出。在大規模操作中,即使是微小的錯誤也會累積成問題。
接著,LLM服務會接收:
藉由這些上下文,模型能辨識「Spannung」在電動工具中是數值型,「尺寸」在服裝中遵循標準尺寸,「顏色」可能符合RAL標準。回傳結果包括:
確定性備援:只在必要時使用AI
並非所有屬性都需要AI處理。流程會自動辨識哪些屬性較適合用確定性邏輯處理:
這樣可以減少不必要的LLM調用,提升系統效率。
人工控制與信任
每個分類都可以標記為 LLM_SORT (模型決定) 或 MANUAL_SORT (商家定義)。此雙重系統確保人類最終決策,同時由AI完成繁重工作。商家可以隨時覆蓋模型,無需中斷流程——這是建立信任的重要機制。
所有結果都會存入MongoDB資料庫,包括:
方便後續檢查、覆蓋、重建與同步其他系統。
資料流程線:從原始資料到搜尋
排序完成後,資料會流入:
確保:
架構概覽
模組化流程如下:
此循環確保每個排序或手動設定的屬性值都能反映在搜尋、商品推廣與客戶體驗中。
實務成果
將原始值轉換為結構化輸出範例:
這些範例展現了情境思考與明確規則的結合。
可衡量的影響
核心結論
最大的一個學習點:電子商務中最重要的問題,往往不是那些轟動一時的,而是每天在每個產品頁面上持續存在的隱性挑戰。透過智慧的系統架構與混合AI方法,讓混亂變得系統化且具擴展性。