有人翻小红书种草,有人却翻到了最新AI技术趋势

2022-04-24 09:29:41   来源:商业新知网

小红书变了。

你以为它还在“美妆”、“穿搭”,但现在在社交媒体上,关于小红书的不少说法画风却有些令人意外。

俨然有了那么一点“搜索引擎”的味道。

这是发生了甚么事?

扒了扒数据,我们发现,去年一年,小红书科技数码内容同比增长500%、体育赛事同比增长1140%,美食类消费DAU甚至一度超过美妆。

而在小红书的首页,下拉菜单中的品类标签已经多达30多个。做菜教程、居家指南、户外露营、旅游攻略、考研考公甚至是创业,其内容之广泛,早已远超当年安身立命的美妆赛道。

更有意思的一个数据是,小红书此前对外披露, 有高达30%的用户进入到小红书之后会直接进行搜索 。

也就是说,不断泛化的UGC内容正在不断冲击突破小红书的社区内容版图,而随之而来的用户行为,也已完全不同于外界对小红书的固有想象。

从外界看去,小红书的变化不可谓不大。从内部技术的角度出发,面临的挑战其实也正在成倍递增。

内容泛化和高频搜索,加上图片、文字、视频等不同模态内容混杂,对搜索和推荐优化来说都提出了更高的要求。

再者,互联网用户对于内容质量的要求日益提升,要求平台、机器能更进一步把握用户心理的需求始终都在增长。

所以,背后愈加复杂的搜索、推荐机制,应该如何应对?

内容社区的多模态挑战

作为为数不多的大量图文+短视频混杂的内容社区,小红书给出的关键词是: 多模态学习 。

所谓多模态,指的是文本、图像、声音等不同的信息表现形式。

而多模态学习,要做的就是建立起能把不同类型信息结合起来的统一模型。

简单来说,一旦AI能够将不同形态的信息,如图像和文字融会贯通,就能在“理解”这件事上更进一步。

也就能达成这样的效果:

让AI根据“空中天使,虚幻引擎效果”的提示作画,AI会给出如下答案。

如果说AI看文作画还只是让人觉得“不明觉厉”,多模态技术对于互联网产品更实际的意义究竟在何处?

就在最近,小红书技术团队举办的一场对外的AI公开课,就分享了他们在多模态算法上的探索。从中恰好可以一窥当前学术界热度正酣的“多模态学习” + 拥有海量UGC内容的内容社区会产生怎样的化学反应。

多模态搜索

先来看搜索。

在打开小红书搜索结果页时,App还会给用户推荐更多相关的搜索词:

以往,这些查询词是纯文本的形式。

而在应用多模态技术之后,现在,这些查询词多了一层更美观且有关联性的“底图”。也就是说,AI会自动筛选出与查询词相匹配的图案,并在搜索结果界面展示给用户。

别看只是这么一个简单的改变,小红书多模算法组负责人汤神透露,加入该功能后,UVCTR(独立访客点击率)和PVCTR(页面浏览量点击率) 提升了2-3倍 。

除此之外,多模态技术在搜索中的另一重点体现,就是 以图搜图 。

有关商品、植物花卉等特定物品的图片搜索,并不鲜见。不过,如果用户想要搜索的是某种氛围感、某种整体风格呢?

这实际上是给AI提出了一个新的挑战:复杂环境下的物体检测与识别。

△ 搜表情包

为了解决这个问题,小红书技术团队以三个核心模块实现了离线构建和在线索引的能力:

前置模块

特征大规模检索

排序模块

在前置模块中,技术团队研发了多种多模态标签,覆盖目标检测、主题识别、商品属性、人体属性等诸多维度。

在特征模块中,技术团队通过基于Norm Classifier的多任务学习,解决了召回结果类目不一致的问题。

在排序模块中,技术团队利用OCR以及标题中抽取出的品牌词等NLP相关信息,进行多模态信息集成,显著提升了检索准确率。

内容质量评价体系

而如果说搜索的变化更容易被看见,多模态技术在内容质量评价中的应用,则在更深层次上影响着小红书的整体“画风”。

去年7、8月份开始,在给各种笔记打类目标签、构建纯分类多模态系统的基础上,小红书技术团队开始更多关注到笔记内容质量评价体系的建立。

也就是说,让AI学会去判断 什么样的笔记更“有用”、更具美学价值 。

为此,小红书技术团队列举了两个比较核心的基础原子能力:

封面图画质美学模型

多模态笔记质量分模型

前文提到的搜索推荐词底纹图片,其实也是基于这样的基础能力实现的。另外,依托于这套内容质量评价体系,还能实现图文、视频等不同种类笔记的结构化,搜索结果页的去重等等优化功能。

说了这么多,简单总结一下,多模态技术在业务场景中的应用,对于小红书最大的影响就是: 让优质的内容能更容易被需要的人看到,让呈现在用户眼前的整体画风和内容审美得到提升 。

如此一来,对于一个以UGC为主的社区来说,用户与内容生产者之间的正向循环也就更容易达成,对于整体的社区氛围而言无疑是有利的。

这也正是其笔记内容越来越多元,用户构成越来越多元的关键所在。

小红书为什么会变?

前文已经说到,小红书“画风”的优化,与当下整个互联网工业界的技术新趋势不无关系。

现在,图文内容和短视频内容在社交媒体上已然成为主流,而传统的单一模态,显然已经难以完整描述这些文本、图像、声音交汇的信息。

融合多个模态的特征信息,逐渐成为各种实际应用场景,尤其是搜索、推荐等对内容理解有着高要求的领域中普遍存在的新挑战。

而小红书本身在场景和业务角度,早已具备关键条件和迫切需求。

首先,从场景角度来看,小红书上发布的内容以图文和视频为主,天然拥有海量多模态数据。

并且,这些多模态数据背后,还配套有丰富的用户反馈数据。

其次,业务高速发展中的小红书会面临各种corner case。比如用户发布的内容,不仅涵盖美食、美妆、家居、科技产品等等诸多不同的类目,还可能出现只有图片的没有文字的笔记、图片+音乐的笔记、没有标题的短视频等等情况。

而这些新的挑战和独一无二的多模态应用场景,也恰恰给多模态技术的落地提供了充足的空间。

从对内满足业务需求到对外输出

实际上,为了应对用户需求的变化,小红书内部技术的积累展开得更早。并且如今已经发展到了一个从对内满足业务需求,到对外实现技术输出的新阶段。

比如今年,小红书技术团队就中了2篇CVPR论文,分别涉及视频检索和视频内容理解。

而就在这两天,小红书还对外开启了“AI公开课”,上海交大、北航、上科大的博导教授都参与其中,着实吸引了不少来自学界的关注。

这场名为“ REDtech来了 ”的线上直播,主题正是关注多模态在学界和工业界的最新发展趋势。

在4月20日举办的上半场活动中,北京航空航天大学教授、博导刘偲,上海科技大学信息学院副教授、博导高盛华,上海交通大学电子信息与电气工程学院副教授、博导谢伟迪,以及小红书多模算法组负责人汤神,围绕多模态内容理解展开技术分享。

除了前文提到的小红书多模态技术实践详情,还有“ AI+音乐 ”、“ 跨模态图像内容理解和视频生成 ”,以及“ 自监督学习在多模态内容理解中的技术与应用 ”等诸多干货分享。

而针对当前多模态研究的产学研现状,大咖们也分享了不少精彩观点。

谢伟迪老师谈到:

“每个模态中含有不同的不变性和共存性。例如,在文字中,当我们提及“吉他”,它可能对应着视觉中的成千上万种不同样子的吉他。我们听见狗叫的时候,很大概率也会在视觉上看见狗。

因此,合理地利用不同模态数据的特性进行协同训练,能够实现更加高效的表征学习,向下游推理任务进行泛化。”

“弱相关的数据集,就是相关性问题,并没有弱相关的问题,如果做机器学习的话,一定是从输入到输出,中间就是学了一些function而已。”

“模态之间的不对齐一定不是弱相关,一定是会有很强的相关性,不然的话,网络学不出来。当然我们现在想尝试去做因果性,大部分我们认为的因果性,很多都是由相关性来决定的。”

当然啦,除了内容理解,随着多模态学习研究热潮而备受关注的,还有AI内容创作,也就是包括数字人技术在内的多模态人机交互。

比如最近,就有一个名为“Dream by WOMBO”的AI看文作图工具,连续多日登上Apple Store图形和设计区榜第一。

而这也正是小红书在探索的另一大多模态技术方向。

所以“REDtech来了”的下半场技术分享,就将围绕“ 多模态理解与创作 “展开。

关键词: 技术团队 质量评价

上一篇:
下一篇:
精彩阅读

有人翻小红书种草,有人却翻到了最新AI技术趋势

热点

小红书变了。你以为它还在“美妆”、“穿搭”,但现在在社交媒体上,关于小红书的不少说法画风却有些令人意外。

日本教授发明咸味放大筷子,少盐食物也能有滋味了!此前还搞出舔屏尝味电视

热点

让筷子帮你放大食物咸味,这脑洞恐怕也就霓虹国能想到了。

为什么 AI 驱动的分析对于数据驱动的决策至关重要

热点

当今的企业依靠人工智能(AI)支持的分析正在成为数字化转型的“标配”。

阿里云 VMware 服务正式上市

热点

4月23日消息,据阿里云官方宣布,VMware服务于2022年4月18日起正式商业化售卖。

测试版微信可以定向清理缓存,小容量手机有救了?

热点

2011年1月21日,影响了国内移动互联网发展软件——微信正式推出。

【机器视觉】从传感器到算法原理,机器人视觉避障原来是这样的

热点

不管是要进行导航规划还是避障,感知周边环境信息是第一步。

互联网凉了?

热点

最近看到一种观点,有人说互联网凉了,已经不再适合创新创业。

一座2500人的意大利小城 正在实验“比特币挖矿”

热点

在意大利,环保比特币开采正在成为可能,并为可再生能源生产商提供额外支持。

科大讯飞 2021 年营收 183 亿元,同比增长 40.6%

热点

2021年,科大讯飞研发投入持续增长,达29 36亿元,同比增长21 50%。

财富

全球第一!宁德时代2021年净利润159.31亿元

资讯

4月21日晚间,宁德时代发布2021年财报,数据显示,2021年营业收入约1303 56亿元,同比增加159 06%;归属于上市公司股东的净利润约159 31亿元

13mini不受欢迎 苹果将停产5.4英寸iPhone14mini

资讯

苹果要放弃mini系列是有原因的,因为用户都不是很买单。消费者数据研究机构CIRP的一份新报告展示了iPhone阵营各款手机的销售状况。iPhone

联想承诺2025年全线计算机产品100%含再生塑料

资讯

越来越多的科技公司开始参与环保事业,不仅推进清洁能源,也在加大对再生材料的支持,全球最大的PC厂商联想今天承诺到2025年,全线计算机产

为环保不再标配充电器,苹果被巴西法院罚款

资讯

从iPhone 12系列开始,苹果为环保不再标配充电器,这一举措导致苹果被罚款。4月22日消息,据当地媒体Tecmundo报道,巴西戈亚尼亚市一家法

东微半导体2021年净利润1.47亿元,同比增430.66%

资讯

东微半导体昨日发布2021年年度报告。报告期内,公司实现营业收入7 82亿元,较去年同期相比增加153 28%;归属于上市公司股东的净利润约1 47亿

当下自动驾驶商业化落地过程中的五大难点

资讯

当聊到自动驾驶商业化落地的时候,我们通常可能会想到Robotaxi、物流、矿山、港口码头、固定路线区域接驳、无人环卫、自主泊车等等。每一个

石头科技披露2021年年报及2022年一季报 净利润14.02亿元

资讯

4月21日晚间,石头科技披露了2021年年报及2022年一季报。年报显示,2021年石头科技实现营业收入约58 37亿元,同比增长28 84%;归属于上市公

致欧科技更新招股书,财务资料过期被交易所中止申报

资讯

随着移动互联网技术的发展,电商已成为人们购物的重要方式之一。作为世界工厂的中国,凭借着在供应链方面的优势,在亚马逊、ManoMano、Cdis

微信也有热搜榜了!内测“搜索发现”功能,可删除搜索词

资讯

现在各大新闻平台都有热搜榜,让用户一眼就能看到当前最火的内容。而一直标榜小而美的微信,似乎也要上线类似功能了。近日,有网友发现微信

天孚通信2021年净利润3.06亿元,同比增9.77%

资讯

苏州天孚光通信股份有限公司(以下简称天孚通信)昨日发布2021年年度报告。报告显示,公司2021年实现营业收入10 32亿元,较上年同期增长18 2%

日本教授发明咸味放大筷子,少盐食物也能有滋味了!此前还搞出舔屏尝味电视

让筷子帮你放大食物咸味,这脑洞恐怕也就霓虹国能想到了。

为什么 AI 驱动的分析对于数据驱动的决策至关重要

当今的企业依靠人工智能(AI)支持的分析正在成为数字化转型的“标配”。

阿里云 VMware 服务正式上市

4月23日消息,据阿里云官方宣布,VMware服务于2022年4月18日起正式商业化售卖。

测试版微信可以定向清理缓存,小容量手机有救了?

2011年1月21日,影响了国内移动互联网发展软件——微信正式推出。

【机器视觉】从传感器到算法原理,机器人视觉避障原来是这样的

不管是要进行导航规划还是避障,感知周边环境信息是第一步。

锐龙55600G评测:台积电7nm工艺,6核心12线程

自从AMD推出Zen3架构的锐龙5000系列处理器后,在市面上大杀四方,不论是单核性能、多核性能还是游戏性能都远胜于Intel10代和11代酷睿,甚至

欧菲光:公司8P镜头项目已研发成功,目前处于试产阶段

曾经为苹果提供镜头模组的欧菲光今日在互动平台表示,公司团队历经多年技术攻坚,突破高端镜头技术壁垒,一亿像素7P光学镜头已量产,长焦镜

支付宝:处置69375个违规账号和参与“跑分”的账号

4月19日下午,支付宝安全中心官方发布了 关于持续打击电信网络诈骗、租售账号等违规行为的公告 。为保障用户账户安全,营造清澈、安全的

华润啤酒频现“超标排放”环保问题遭罚款

4月18日,北京商报记者在聊城市生态环境局注意到,华润雪花啤酒(聊城)有限公司(以下简称雪花聊城公司)因涉嫌超标排污被聊城市生态环境局罚

Eurocom推出15.6英寸笔记本电脑工作站

Eurocom 正推出 15 6 英寸的 Raptor X15 Mobile Supercomputer,该工作站采用 LGA1700 插槽的英特尔第 12 代桌面处理器。通过最

帅丰电器发布2021年年报,净利润同比增长26.95%

4月13日,帅丰电器(605336)发布2021年度报告,报告期内公司实现营业收入977,641,254 43元,同比增长36 93%;归属于上市公司股东的净利润246,