淘宝订阅是基于C-B关系的用户/商家双私域产品,用户侧与推荐-猜你喜欢互补,构建订阅-我的喜欢心智。商家侧与商家深度联动,结构化,自动化引入优质供给,帮助商家更好地运营粉丝会员。
初期构建了从商家后台内容发布,到算法分发推荐,再到前台消费和数据回收的完整链路;后期为了精细化运营,提升内容推荐体验,开始探索内容特征,搭建内容特征圈选系统。
1、内容在推荐分发时需要使用特征
2、内容运营时需要使用特征圈选
内容圈选是对现有内容的的一个筛选操作,圈选内容指标维度多,数据量大,对数据预览也有一定要求,因此需要整体设计一个方案,来使得圈选内容更加精准。另外,技术上也需要考虑到未来的扩展性,使得后续增加数据指标筛选更加方便。
下面是内容特征生成和订阅圈选系统的设计方案。
因此,就可以将问题转变为基于筛选项schema和筛选项value,按不同指标过滤,进行数据查询的操作。
现有圈选系统已经支持了配置化,可以自定义数据源和指标进行圈选。圈选过程中,多个筛选项翻译成可执行查询语句的过程就是圈选引擎最核心的部分。筛选引擎需要对不同的筛选项映射到不同的表中的字段,生成可执行语句,再在筛选引擎中进行执行得到筛选结果。基于业务场景,我们总结出对筛选引擎的核心诉求如下:
通过在阿里集团内外的大量调研,并最终在几款产品之间做了详细的对比,具体如下:
方案对比 | MaxCompute | Hologres共享集群 |
灵活性 | 一般可多表关联条件查询,需指定表空间 | 高可聚合到同一空间多表关联条件查询 |
成本 | 低 | 中,无需数据导入导出就能直接查询 |
查询速度 | 一般单次查询15s以上 | 亿数据量级,单次查询秒级 |
通过调研和测试,最终选择了Hologres集群作为订阅系统的计算引擎。下面将会介绍订阅系统基于Hologres集群的最佳实践。
1、使用成本低
2、查询效率高
通过Hologres共享集群搭建的订阅圈选系统流程如下图所示:
运营只需要在后台圈选页面勾选筛选项和填写筛选值,圈选系统将会自动生成Hologres SQL语句(如下示例)并在Hologres中执行获取数据,最终将数据返回到前端,并进行前台投放。运营再根据投放效果不断优化圈选方案,提升圈选效果,达到更加精细化运营的目的。
整个过程,不需要数据在各个系统之间的导入导出,仅通过页面点击的方式,就能转化为SQL进行计算。同时可以根据业务逻辑调整圈选内容,复杂的SQL也能快速高效的计算出想要的圈选数据结果,节约获取数据的时间。使得整个链接变得非常的简单高效。
SELECT feed_id
FROM qn_xxx_provider AS a
WHERE a.xxx_pv > 30000
AND a.xxx_pctr > '0.1'
AND a.last_publish_time >= '2022-06-17 08:00:00'
AND a.biz_xxx_code = '111'
AND a.ds = MAX_PT('xxxxxx_table')
AND CAST(a.owner_xxx_id AS VARCHAR) IN (SELECT b.domain_xxx_id FROM xxxxxxx_table AS b WHERE b.rule_type = 12 AND b.channel_xxx_id = 137 AND b.dataset_xx_id = xxxxx AND b.ds = MAX_PT('xxxxx_odps_channel') )
and a.feed_id in (SELECT feed_id from xxxxx_submission_feed_hh where activity_id = 222 and approval_status=1 and ds = MAX_PT('xxxxx_submission_hh') and hh = '13')
;
通过Hologres共享集群搭建的淘宝订阅系统,支撑了1000+场运营圈选活动任务,支持了双11、618、新势力周等多场大促活动,支撑了订阅玩搭场景等的多个二级页面配置,简化了订阅系统的搭建,无需数据导入导出就能直接加速离线数据,降低了运营的上手成本,能让业务更加高效的专注于业务增长。
在未来,我们也将会持续使用Hologres来丰富订阅系统的功能,以此来保持业务的高速增长,我们希望圈选系统能够:
作者:杜仲舒 (花名:神天) 淘宝订阅开发,现主要负责淘宝订阅业务,主研内容特征理解。
原文链接:http://click.aliyun.com/m/1000347779/
本文为阿里云原创内容,未经允许不得转载。
留言与评论(共有 0 条评论) “” |