darthracer 发表于 2023-6-10 08:47

DeepMind AI模型能为YouTube Shorts视频自动加描述,提升曝光度



Google旗下AI业务群DeepMind本周发布能为短视频服务YouTube Shorts自动产生描述文本的AI模型Flamingo,方便这些视频为用户搜索。

YouTube Shorts为类似Tiktok的短视频,通常只有几分钟,大部分也都未包含描述文本及有用的标题,使这些视频难以被人搜索。因此DeepMind推出视觉语言模型Flamingo以协助产生描述文本。

DeepMind说明,Flamingo分析Shorts视频最初的帧后即可解释屏幕上的内容为何,例如“一只狗头顶着一叠饼干”。这段文本可存成YouTube的metadata,以便更有效率分类视频,并且让搜索引擎找给用户。

目前新上传的数十万则Shorts视频已经都有AI产生的视频描述,YouTube计划把这项技术渐次推到所有Shorts视频。

Flamingo是DeepMind和YouTube合作的最新一项项目,也是4月间Google宣布DeepMind和Google Brain整合成一个单一AI业务群的最新成果。

最早DeepMind以其AI模型MuZero改善YouTube压缩发送的VP9 codec。2018年DeepMind又和YouTube合作,教育视频创作者如何借由为视频搭配符合YouTube政策的广告以增加营收,因此两公司发展了标签品质模型(label quality model,LQM)以更精准标注内容。模型提升了广告精准度,也强化YouTube上的观众、创作者及广告商的信任度。

而后YouTube视频增加分段篇章,方便观众更快找到想要的段落,为此DeepMind又和YouTube搜索部门开发可自动处理视频、影音内容转录文本,以及建议篇章切分及标题的AI系统。名为AutoChapters的功能在Google I/O 2022上,由首席执行官Sundar Pichai宣布,不再需要用户辛苦慢慢寻找,也缩短创作者加篇章的时间。现在AI自动分篇章的视频已经用于800万则视频,DeepMind计划明年扩展到8000万则 。

YouTube Shorts生产机制部门对媒体表示,Flamingo产生的metadata不会显示给创作者,目的在大幅提升搜索精确性。同时Google也会确保Flamingo所产生的文本符合其责任标准,不会出现文本负面呈现视频内容的情形。

Flamingo AI标示准确性值得观察。8年前Google Photos曾将2个非裔人士标注为黑猩猩,因此Google Photos这服务迄今不会标注任何东西为“猴子”。

cs6615882 发表于 2023-6-10 09:19

也是老优秀了{:11_490:}
页: [1]
查看完整版本: DeepMind AI模型能为YouTube Shorts视频自动加描述,提升曝光度