请选择 进入手机版 | 继续访问电脑版
立即注册找回密码

豆芽吧-抖音论坛

社区官方指定联系方式

工作时间: 周一到周五早上09:00-11:00, 下午01:30-05:00, 晚上08:30-11:30(周六、日休息)
点击这里给我发消息 点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
QQ: 734888190  抖音  douyaba  微信  douyabacnTEL: 15374320896  18870201819  E-Mail: admin@admin.com
用户交流QQ群
①群 926671960 ②群 926671960 ③群 926671960 ④群 926671960 ⑤群 926671960 ⑥群 926671960 ⑦群 926671960 ←提醒: 请勿重复加群, 谢谢合作

抖音系统级推荐算法、告诉你机器如何准确理解短视频内容?

[复制链接]

33

主题

202

帖子

39

积分

破土阶段

Rank: 1

积分
39
发表于 2020-12-2 14:28:45 | 显示全部楼层 |阅读模式
短视频的推荐严重依赖视频的标签,但想把标签打准却不容易。
人工打标签,只能挑少数重要的视频打,全部都打,成本承受不了。从而推荐物料池里都是头部大V视频,中小V的视频机会很少,久而久之,中小V生产用户离场。
深度学习技术打不准,打不细。连抖音都不能分辨两个相同的视频↓↓↓,重复推送,别的平台更不能了。推荐不太准,消费用户不喜欢,久而久之,消费者离场。

微信图片_20201202142738.png

用户志愿者免费审核,像内涵段子那样。标签很多,难度大,专职打标签的姑娘们还经常犯错,志愿者不能胜任。
那标签怎么打才好呢?

发布者自打标签
相对于拍摄、剪辑视频,打标签的工作量微不足道。生产用户对视频的理解最深刻,标签打算最准,也有动力去打准。
自打标签能同时达成几个目标,标签准确、成本低廉、垂类聚焦、及时发现新标签、识别搬运视频。
这里给出一个粗略的方案,用于说明思路。
在视频发布之前,生产用户可以选填下列7类标签和字幕。
一级标签1个:最粗的类别,例如搞笑、体育、美女。
二级标签1个:较粗的类别,例如夫妻搞笑、动物搞笑、相声、小品。
三级标签1个:最细的类别,例如西欧女友搞笑、俄罗斯女友搞笑、东北年轻夫妻搞笑。
四级标签0~3个:只含实体,不包含概念。例如对一个电视剧剪辑视频,实体标签可以为:电视剧《铁齿铜牙纪晓岚》、和坤、纪晓岚。
地点标签0~1个:如果有地域特色那么标记地点。例如视频内容是颐和园景色,那么地点标签可设为颐和园;如果视频内容是美女跳舞,只是实际拍摄地点为颐和园,那么不用设地点标签。

主题标签1个。自定义,长度不超过30个字,用于概括整个视频,尽量能用它唯一地搜索到这个视频,例如“纪晓岚让弘历记住沙河深(杀和坤)”。
话题标签:自定义,例如“女孩跑步上班引围观”,目的是按此话题能搜索到一批视频。
字幕脚本:视频中字幕的文字稿。
一二三级标签由推荐系统定义,四级标签可以选用推荐系统定义的标签,也可以自定义新的标签。7类标签和字幕对消费用户不可见,只对发布者和推荐系统可见。
一至四级标签能让推荐系统按喜欢程度选择消费用户,四级标签相同的消费用户最喜欢,一级标签相同的消费用户可能一般喜欢,设定反馈指标阈值时需要考虑喜欢程度。自定义标签用来帮助推荐系统发现新标签,字幕可以用来检查是否违规、自打的标签是否合理。如果一个视频没有自打标签,特别是没有字幕脚本,那么它很可能是搬运过来的,或者质量较低(不值得生产用户花费微小的精力)。

自打标签作弊怎么办?
如果推荐系统不加审核地按照自打标签进行推荐,那么生产用户就可能为了流量而作弊。例如为冷门视频打上热门话题标签、为广告打上非广告标签。
解决办法是一套组合拳。
门槛、审核与处罚。生产用户要达到一定级别之后才能获得自打标签权限;用算法打标签,然后与自设标签对比,将可能作弊的标签提交人工审核;对作弊严重的生产用户进行限流、封号。这些是常规操作,不赘述。
限定垂类。生产用户要提前选定自己的1~2个垂类,例如搞笑,一旦选定,一段时间内不能更改。视频的一级标签只能在这1~2个垂类中选择,二三四级标签只能在一级标签的下级标签中选择。这个规定能够用代码自动执行。
消费用户检验。将视频试投给兴趣标签一致的消费用户,用播放、互动数据找出作弊标签。例如,视频有标签“德云社相声”, 挑选一批消费用户,他们的兴趣标签里有“德云社相声”。如果完播率、转评赞数据明显偏低或偏高,那么该标签可能作弊,转交人工审核。迭代调整阈值,在人工审核数量和发现几率之间找到一个平衡点。
信用分。如果视频的标签准确、消费用户反馈数据良好,那么给生产用户加分。反之减分。如果生产用户的信用分高,那么多给流量,反之少给流量。
经过这几步操作,生产用户为持续获得流量,会诚实地设置标签,消费用户的兴趣标签也越来越准确,人工审核成本持续下降。投机取巧的生产用户,会被逐渐标记出来,流量越来越少,直至改邪归正或者离场。

深度学习理解视频的能力还很弱,适当设计产品规则,也许能达到准备理解的目标。

31

主题

230

帖子

37

积分

破土阶段

Rank: 1

积分
37
发表于 2020-12-2 14:32:58 | 显示全部楼层
我关注了一个人,可是她每次更新我都看不到,要跑到动态里才能看到?什么原因?

0

主题

13

帖子

0

积分

破土阶段

Rank: 1

积分
0
发表于 2021-1-1 13:11:20 | 显示全部楼层
楼主分享了很有价值的东西,支持

0

主题

21

帖子

0

积分

破土阶段

Rank: 1

积分
0
发表于 2021-1-4 14:02:47 | 显示全部楼层
有道理,准备实操下看看!
使用高级回帖 (可批量传图、插入视频等)

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
豆芽吧-抖音论坛|短视频社区 社交自媒体运营经验分享 网站地图 
Copyright © 2018-2023 All Rights Reserved.
快速回复 返回顶部 返回列表