摘要:当你在电商平台搜“红色连衣裙”时,看到的结果是“法式显瘦通勤约会温柔初恋风浅蓝红色搭配皮靴”这种堆了20多个关键词的标题,你会不会觉得头疼?过去十年,电商搜索就像在玩一场“关键词捉迷藏”——商家拼命往标题里塞词,系统机械匹配,用户在一堆杂乱商品里翻找,工程师在
当你在电商平台搜“红色连衣裙”时,看到的结果是“法式显瘦通勤约会温柔初恋风浅蓝红色搭配皮靴”这种堆了20多个关键词的标题,你会不会觉得头疼?过去十年,电商搜索就像在玩一场“关键词捉迷藏”——商家拼命往标题里塞词,系统机械匹配,用户在一堆杂乱商品里翻找,工程师在后台调上百个特征旋钮。但现在,这场游戏被快手彻底掀翻了。
没人想到,第一个把电商搜索从“流水线拼接”推进到“端到端生成”的,不是手握最多电商数据的阿里,不是以算法见长的拼多多,而是靠短视频起家的快手。他们推出的OneSearch框架,用一个大模型把召回、排序、结果生成“一口气做完”,直接拆掉了沿用十几年的多阶段搜索架构。这不是小修小补,而是把整条旧赛道铲平,重新铺了一条新路。
一、传统电商搜索的“十年死结”:流水线越补越堵
要理解快手这次突破的震撼,得先看清传统电商搜索有多“拧巴”。过去十几年,搜索技术从“翻字典”进化到“机器学习排序”,再到“深度学习语义匹配”,但始终没跳出一个怪圈——多阶段流水线。就像工厂里的生产链:第一步从仓库(商品库)粗筛一批货,第二步挑出看着还行的,第三步精细打包,但每一步各干各的,信息在传递中不断损耗,前面漏了好货,后面再精细也白搭。
1. 商家被逼成“关键词堆砌工”
你见过最长的商品标题有多长?电商平台上,一条连衣裙标题能塞进30多个词:“法式连衣裙女夏显瘦气质通勤约会温柔初恋风浅蓝红色搭配皮靴小个子”。为什么要这么干?因为传统搜索靠关键词匹配,词越多,被搜到的概率越大。但模型看到这堆词,根本抓不住重点——这到底是通勤穿的还是约会穿的?是主打显瘦还是温柔风?商家为了曝光被迫“内卷”,用户却在信息垃圾里找商品,双方都累得够呛。
2. 工程师在“调音台”前拧旋钮
传统搜索的排序模型,本质是个“巨型调音台”。价格、销量、品牌、颜色、用户性别、年龄……工程师要把这些特征一个个手动做成“旋钮”,调上百次才能让结果“像样”。就像你想调一杯奶茶,得手动加奶、加糖、加珍珠,还得精准控制比例,少一点太苦,多一点太甜。更麻烦的是,这些“旋钮”是死的——用户今天突然想买露营装备,明天又回归日常穿搭,模型根本跟不上这种“兴趣急转弯”,只能等下一轮人工调参。
3. 流水线各扫门前雪,信息一路“掉链子”
传统搜索分三步:召回(从10亿商品里筛出1万)、粗排(从1万挑1000)、精排(从1000排100)。但这三步各用各的模型,各算各的特征,就像三个盲人摸象——召回只看关键词,不知道后面精排关注什么;精排拿到的候选,可能早就被前面的模型“误杀”了。比如用户搜“户外帐篷”,召回阶段可能因为“户外”关键词筛出一堆廉价沙滩帐篷,而精排模型其实更想推专业露营帐篷,但候选池里根本没有,只能“巧妇难为无米之炊”。
这套流水线跑了十几年,大家都在“打补丁”:召回加个语义向量,粗排用个轻量模型,精排堆更复杂的特征。但补丁越打,系统越重,算力浪费越严重——据行业数据,传统搜索的算力利用率(MFU)通常不到5%,大部分算力都耗在各阶段重复算特征、传递候选上,就像一辆满载货物的卡车,却用一半马力拖着空车厢跑。
二、为什么是快手?这家公司藏着“破局基因”
当阿里、京东还在优化流水线时,快手直接把整条线拆了。为什么偏偏是快手?这背后藏着三个关键逻辑:它的用户更“难伺候”,数据更“接地气”,技术团队更“敢冒险”。
1. 下沉市场的“长尾需求”逼出来的创新
快手的用户画像和传统电商巨头不同——更多下沉市场用户、更多“非标准化需求”。比如有人搜“给妈妈买的软底鞋”,有人搜“能装下笔记本的布袋子”,这些需求没法用标准化关键词定义,传统搜索要么返回一堆不相关结果,要么根本搜不到。被逼急了,快手必须找到一种“能理解模糊需求”的搜索方式,而大模型的语义理解能力正好对症。
2. 短视频积累的“多模态数据”是天然优势
做生成式搜索,最缺的是“理解商品”的数据。传统电商商品主要靠文本描述,而快手有短视频和直播——一条连衣裙,用户能看到模特穿上后的效果、面料的垂感、走动时的动态;一双鞋,能听到鞋底敲击地面的声音、看到弯折时的弹性。这些图像、视频、音频数据,比纯文本标题更能帮模型“看懂”商品。就像你相亲时,看照片和视频聊天,肯定比只看文字介绍更能了解对方。
3. 没有历史包袱,敢“从零开始”
阿里、京东的搜索系统跑了十几年,背后是成千上万行代码、无数业务逻辑的堆砌,就像老房子改造,动一块砖可能塌半面墙。而快手电商起步晚,搜索系统“家底薄”,反而能轻装上阵。就像新能源车颠覆燃油车,不是因为技术更先进,而是没有发动机、变速箱的历史包袱,敢直接用电机和电池重构动力系统。快手这次拆流水线,本质是“没有旧架构的拖累,所以敢建新架构”。
三、OneSearch的“三板斧”:把流水线变成“一个大脑”
快手OneSearch的核心,不是在流水线上加零件,而是把整条线换成“一个端到端大模型”。就像原来三个厨师分工切菜、炒菜、装盘,现在一个厨师从头做到尾,全程掌控火候和口味。为了实现这个目标,他们干了三件“反常识”的事:
1. 给商品办“语义身份证”:让模型一眼看穿“重点”
传统搜索看商品标题,OneSearch直接给商品建“档案”。它用一种叫“KHQE层次量化编码”的技术,把商品从大到小拆解:先归大类(服饰—女装—连衣裙),再标细节(浅蓝、修身、真丝、通勤风),最后压缩成一段“语义向量”。就像给商品发了张身份证,上面写清“职业(通勤裙)、外貌(浅蓝修身)、性格(真丝材质)”,模型一眼就能认出“这是给上班族设计的裙子”,而不是被标题里的“约会”“皮靴”等无关词带偏。
这招直接治好了“标题堆词”的顽疾。现在商家不用再硬塞关键词,只要商品本身属性清晰,模型就能准确识别。有商家反馈,改了简洁标题后,搜索曝光反而提升了——因为模型终于能“看懂”他的商品了。
2. 让模型“住进用户的脑子”:从“猜你喜欢”到“懂你此刻想要”
传统搜索的“个性化”是后补的:先按通用规则排结果,最后再用用户历史数据“微调”。OneSearch反着来——从第一步就把用户画像喂进模型。它会实时抓取用户最近的搜索、浏览、加购行为(比如“昨天看了5款露营帐篷”),给新行为更高权重;同时提炼长期偏好(比如“平时总买高性价比商品”),压缩成“向量胶囊”塞进模型。就像你和朋友逛街,他既知道你现在想买帐篷,又记得你平时不买贵的,推荐时自然又准又贴心。
更妙的是,它还能应对“兴趣突变”。比如用户突然搜“婴儿车”(可能刚当爸妈),模型会用“滑动窗口”技术,把近期行为和长期偏好结合,既不被短期热点带偏(比如只推婴儿车),也不忽略新需求(比如同时推适合新手爸妈的母婴用品)。
3. 端到端优化:算力利用率暴涨8倍,成本砍到四分之一
传统搜索的算力有多浪费?召回、粗排、精排各用一套模型,重复计算商品特征、用户特征,就像三个画家画同一幅画,各画各的,最后拼在一起。OneSearch把这三步合并,用一个模型统一建模,特征只算一次,推理一次完成。数据显示,它的算力利用率从3.26%飙升到27.32%(翻了8倍),推理成本直接砍到原来的四分之一。
这不是“堆参数”堆出来的,而是“架构革命”的必然结果。就像原来三辆车跑三段路,现在一辆车直达终点,油费自然省了。更重要的是,端到端优化让“用户点击、下单”等目标能直接反馈给模型——用户不喜欢某个结果,模型下次就会调整,形成“搜索-反馈-优化”的闭环,越用越聪明。
#优质图文扶持计划#
四、这场革命才刚开始:电商搜索要“活”过来了
快手OneSearch的落地,不是技术秀,而是实实在在改变了游戏规则。线上数据显示,它让单品点击率(CTR)提升1.67%,页面点击率提升3.14%,转化率(CVR)提升1.78%,订单量增长3.2%。更关键的是,中长尾搜索和新商品冷启动的效果提升更明显——过去搜“小众设计感帆布包”可能只返回10个结果,现在能精准匹配到50个;刚上架的新商品,哪怕没销量没评价,也能被模型“看懂”并推荐给合适的用户。
这背后,是电商搜索从“工具”向“伙伴”的进化。传统搜索是“你问我答”,你说“红色连衣裙”,我给你红色连衣裙;而生成式搜索是“你没说的,我也懂”——你搜“红色连衣裙”,模型知道你最近在看通勤装,自动推荐“红色通勤款连衣裙”,甚至搭配“适合通勤的红色高跟鞋”。
对行业来说,这可能是一场“降维打击”。商家不用再内卷标题,用户不用再翻垃圾信息,平台不用再养一堆调参工程师。更重要的是,它撕开了一个口子:如果搜索能端到端生成,那推荐、广告、客服呢?未来的电商平台,可能不再需要“搜索框”,而是你刚打开APP,模型就知道“你今天想买什么”,直接把结果推到眼前。
当然,挑战也不少。端到端模型对数据和算力的要求更高,小平台玩不起;模型“黑箱”可能带来新的偏见(比如总推贵的商品);用户隐私保护也需要更严格的机制。但无论如何,快手已经证明:电商搜索不是“只能这样”,而是“可以完全不一样”。
十年前,我们以为搜索的终极是“搜得准”;十年后,快手告诉我们,搜索的未来是“不用搜,我就知道你想要”。这场由短视频平台掀起的搜索革命,才刚刚开始。而那些还在“调音台”前拧旋钮的巨头们,或许该抬头看看——新赛道已经铺好了,再不上车,就真的追不上了。
来源:小钱科技每日一讲