有时候,不同的角度或身份可以让我们透视不同内容背后的逻辑,比如在短视频内容背后,当你站在内容策略产品视角上来看时,你会发现其背后其实是标签跟数据体系的建构逻辑。具体如何理解?不妨来看看作者的解读和分析。
日常刷小红书,我们有时候只是会感觉内容挺好的,对特定目标人群来说比较有价值,如果在内容策略产品视角来看,背后则是标签跟数据体系的建构逻辑。
这个命题之中,短视频基础内容体验是过程,为谁提供体验是服务目标。用户与内容本质上来说是两类完全不同的体裁,需要通过过程服务好目标来实现。
一、什么是内容?
正常来讲,短视频内容池子里,基础内容可以简单理解为平台内支持了大部分DAU的消费vv的内容。具体到各平台的内容形态不同,表现情况可能会不一致,如果我们拆解平台DAU增长的情况来说,vv的形态基本上可以表达70%的DAU趋势,所以在当前平台,我们以vv(video view)来描述内容在平台的呈现情况。
二、什么是好的内容体验?
回归到定义出发,vv是表达基础内容的兑换数据,那么好的基础内容体验直观来说就是能带来持续vv供给的内容。如果说策略一定要有北极星做指标的话,vv可以算得上是内容体验的北极星指标,至少满足以下四个属性(可量化、可执行、可监控、可分析)。
那vv持续增长就一定是好的吗?如果真的要拆解这个定义,那又要回归到好内容的本质问题:内容多样性、可持续、安全。在vv持续增长的情况下,内容要求足够的多样,输出多样内容的持续性也需要不断加强,与此同时,这些向外输出的内容得守住平台底线。
1. 如何量化?上述的基础内容体验?
可持续看投稿,创作者在平台渗透率、日均投稿量、过程指标则会关注跟投稿有关系的曝光、互动、分发。
2. 安全性
看过滤,主动过滤看badness率,被动过滤看举报渗透率。
3. 多样性
多样性在目前任何一个平台都是主要的功课,如何做好多样性、如何量化多样性既需要持续修炼内功(内部指标),也需要横向对比其它平台各内容类目占比。
向内求,如何抓住内部的生态,通过流量控制也能帮助我们挖掘多样性的缺失,比如周期性开AB,观察在某类内容供给占比减少/增多的情况下用户消费的时长是否会增多/保持不变?
向外求,横向对比不同类目下各平台的内容优质量、内容分发量。
以上是我们去思考内容好的几个重要参照,不过话说回来,内容生态本质上是围绕用户做供给的,最终评估的视角还是要回到目标群体上。
在这里可以思考下,如果我们想要给线上用户提供基础内容,我们要怎么做?在回答这个问题之前,首先要挖掘用户类型。跟做内容标签跟数据拆解一个思路,用户本身是平台给出的用以定位用户的载体,而从内容分发的视角来看,这些实体再往深一层则是数据跟标签,如何拆解这些标签?
三、我们通常会把用户标签分成描述型、计算型、预测型
描述型:表达客观的用户使用平台过程中产生的数据信息。
按照数据来源方向可以拆解为:设备信息、用户基本信息、行为数据。设备信息:设备型号、IMEI、常用登录WiFi、IP等;用户注册手机、用户名、平台ID。行为数据:消费内容数据,互动数据,搜索数据、关注数据
计算型:经过数据加工与分析获得大致描述用户在平台特征的数据。时间相关:月消费天数、日使用时长、日互动次数、关注量级、粉丝量级、日消费额。
预测型数据:本质上生成的是平台通过预测规则对用户的画像体现,从而生产的标签。具体的标签如何按照类目划分可能是:喵星、人文景色。
按照类目表现类型还可以分为:纪录片、饲养方式、可可爱爱。
按照预测可信度,可以在每个标签后都给出预测数值,从0-1的区间做分类,可信度分数的获得方法通过用户在平台的行为获取,比如用户历史浏览过、并且给他人分享过;跟用户相似度较高的其它用户曾经浏览过;浏览过相同内容的用户浏览过并且有分享行为。
那么通过预测型数据我们可以得到的结果就是:用户A在可可爱爱的喵星标签关联可信度0.98,这样就可以解释为什么我们打开抖音刷出的内容都是自己比较喜欢的内容。
以上是关于取悦用户要从用户行为标签需要做的努力。
四、GID的引入
那这里会有个问题是,如果线上所有的用户都用这套方法,算法的压力得打爆了,怎么做到简单高效的分发逻辑确保基础内容的消费用户快准狠的达到目标用户身上呢?这里需要引入一个GID的概念(groupID)。
GroupID是个虚拟的概念,它相当于对线上相似内容、相似用户做了聚合。引入GID的概念能有效的把目标用户跟目标内容快速关联,快速试错,快速调整推荐的方向。
举个例子,最近线上产生了一些新内容形态,这些内容被70后大量转发点赞,如果复用线上的推荐流程,我们可以先给满足70相似度高的GID10%的流量进行boost,结果发现这类内容的消费vv短时间被打到高热,如此便能够很快的切换推流视角。而我们推荐的70后GID相似度也高的政务GID同样可以做相似的推荐。那么这类信息流在平台就很容易达到“基础内容高热”的目标。
以上介绍的都是推荐侧的基础常识,如果把这套架子搭建起来是不是就意味着我们可以高枕无忧了?然而,流量无论如何也是有天花板的,当我们把一切基建搞定之后,面临的难题则会聚焦在“存量用户持续活跃”“流失用户的再度召回”。这俩命题之所以能难搞,主要原因是大刀阔斧的工作已经做到了80分,而细枝末节的策略还尚待挖掘,细枝末节的策略如果也希望做一个完整的策略链路,驱动力跟收益都会受到挑战。
五、面对这些问题常用的策略手段
- 正向解法:用户刷feed的问卷(GID分发逻辑调整)。
- 负向解法:双栖用户在平台定义为低频率的用户类型(补齐特定内容供给的问题)。
- 离线评估:自查,会不会有内容聚集的问题。
以上,都只是围绕内容本身。但现阶段,所有大厂都在做聚合,这么一来还需要回答的问题在于:从基础内容能最大化满足目标人群的口子里,我们需要分配多少流量给用户创作、给内容分发、给本地生活、给商家投广告?
除了决策层的意见输出之外,回答这个问题本质上还是要回到背后的数据跟标签,只是这些数据标签要拆解的更细,比如刚刚提到的,服务目标人群的量化,除了现有基础内容的价值、频次之外,还需要引入价值因子,即用户实际的消费潜力。
关于消费潜力本质上也是标签的预测能力,未来详细介绍关于商业化视角对消费潜力的拆解动作。
本文由 @蓝莲花zx 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议