《追AI的人》之AI科普系列短视频,将持续用简单清晰的语言向公众解释对于人工智能的普遍疑问,推动社会就人工智能的发展和治理达成共识。
首先,我们来探讨Sora在技术实现上的一些缺陷。从Sora官方发布的视频中,我们可以观察到该技术在模拟物体交互和物理过程上,目前仍未达到完美的水平。
举例来说,在左边的视频中,展示的是杯子倒水和液体流到桌子上的场景。在这个模拟过程中,我们可以看到杯子倾倒动作和液体流动表现并未形成一个统一的,连贯的状态。同样,在右侧视频中,当笔掉落到纸上时,笔落的位置和随后产生的绘画痕迹并没有完全吻合,显示出了细节交互上的不足。因此,可以说Sora在一些细节和交互方面的处理可能仍不够完美。
接下来,我们讨论的是关于局部合理性与整体异常性的问题。举个例子,观察左侧跑步机上男子跑步的视频,我们可以看到他跑步的姿势、与跑步机的接触乃至跑步机的整体形态,在任何一个细节上看似乎都没有太大问题。
然而,当我们从整体上审视这段视频时,便会发现一些奇怪之处——这名男子跑步的方向是相反的。正常情况下,谁会反着跑步机的方向跑步呢?此外,在右侧的视频中,类似于魔术般的场景,考古人员仿佛从沙子中变出了一把又一把的椅子。
这些例子凸显了Sora在处理画面总体语义层面时可能会遇到的问题。
1、AI商品图检测技术
接下来,我将给大家介绍一下我们AIGC检测技术的实际应用情况。第一个落地场景是AI商品图的检测问题,简而言之,这就是对买家秀和卖家秀的检测,亦或是我们希望实现买家秀与卖家秀之间的一致性。
在现在AI模型生成图像、视频的时候,在某些场景下,对于细节和一些客观事实的模拟并没有做得十分到位。哪怕是现在,我们已经知道了Sora这一模型,即使在真实世界模拟方面做得非常出色,也仍然有一些不足之处。
具体来说,传统上我们是如何拍摄模特图的?假设现在我有一件衣服,于是我花钱请一个模特,让他穿上衣服,然后我给他拍照,再将照片上传到我们的平台或店铺,作为商品图,这是常规的做法。
但现在,我们可以怎么做呢?我手持这件衣服的照片,直接使用AI合成技术,让这件衣服仿佛被AI穿在一个模特身上。在这个过程中,必然会存在一些不真实的地方。但如果我是商家,我的目的并不是追求真实,而是追求美观,因为只有商品图看起来足够吸引人,消费者才可能购买我的商品。
因此,有些用户或商家在生成商品图时可能会过度修饰,创造出非常夸张的卖家秀,就像我们图中可以看到的,左边和右边的对比中,一边是公主,一边是村民。我们希望对抗的就是这种极度夸张的买家秀与卖家秀。
因此,我们通过生成内容检测模型,及时给消费者或顾客一个预警,告诉他们正在浏览的商品图可能是AI生成的,请他们注意鉴别。这样一来,当消费者在浏览商品时,如果看到一张可能是AI生成的图片,他们在选择时就不会完全信任所看到的图片,而是能够更有辨识度地看待这些商品图。这就是我们开展这个方向工作的出发点。
2、AI生成引流内容检测技术
第二点,我们要讨论的是关于AI生成的引流内容检测。随着AI技术的普及,我们可以看到在我们所提供的示例图像中,有些引流的二维码被设计得非常可爱,甚至图片中的云朵都被变造成加微信的样式。这实际上是较为新式的引流手段。在这种情况下,传统的引流检测模型可能就比较难以识别了。
因此,我们基于现有的AIGC检测模型或生成内容的检测模型,针对性地开发了这样的一个模型,我们可以称之为专精模型或定制化模型,用来检测这些AI生成的引流图像,并判定这张图像是否涉及AI引流活动。
这里也和大家分享一下我们现有的AIGC检测模型在检测Sora的表现。大家可以看到,包括那张人脸的图像,还有海龟的视频,我们都以高置信度检测出了它们是AI合成的,这些实例都证明了我们现有方法对于检测Sora是有效的。
1、网络反诈
首先要讨论的是反诈问题。正如前面所提到的,当利用Sora等人工智能生成的视频进行诈骗时,我们可能很难做出防备。
那么,生成内容检测或AIGC检测的意义在哪里呢?在你接到这样一个视频电话,我们的系统能够在屏幕下方弹出一行提示文字,警告你说:“您正在通话的这个人可能是AI生成的,请您注意鉴别。”这样一来,我们的防范意识是否会立即增强,就像在当前发生电信诈骗时的劝阻电话、短信情况一样。这种即时的警示可能会在关键时刻提升我们的警惕性,帮助我们避免成为诈骗的受害者。
我们坚信,这项技术在网络诈骗的应用场景下,一定能够发挥出色的效果,不仅对平台,对社会整体而言,我们都相信它将是一个有益的应用。
2、实人认证
下一个我们即将着手的应用场景是实人认证。此处所说的实人认证可能比较广义,并不仅限于狭义的实人认证场景,而是指对真实人类的认证。
因此,我们希望能够将数字人检测等技术应用到直播的画面中,以此来确保主播的真实性,无论是对于人脸识别的系统,还是直播平台的安全,我们都希望引入这些检测技术来提高识别真实与虚拟的能力。
实际上,AI生成的内容并不仅限于人物,它甚至有可能是手中的商品都是AI生成的。我们也能够通过AI的方式将一些不寻常的元素插入到直播流中。我们希望通过这种方式,帮助大家判断他们所看到的这个物品或人物是否真实。
3、虚假新闻检测
很多新闻中的人物我们并不熟悉,我们无法像联系父母那样简单地进行二次验证。你可能会怀疑特朗普的某条新闻是否真实,但大多数人无法直接拨打电话给特朗普来核实。
所以,我们希望也能通过生成内容检测技术,来减少虚假新闻带给大家的困扰,甚至减少它对社会秩序的破坏,以及对个人财产的损失。通过这种技术的应用,我们能够为真实信息的辨识提供更多支持,增强社会的信息鉴别力。
4、版权保护
最后,我们要讨论的是版权保护问题。我们不希望自己的面孔被某些模型,尤其是商业模型所利用,一下子生成出来,这无疑对我们个人是一种侵权行为。
因此,在版权保护方面,我们期望能够通过一个专门的模型来判定某个模型的训练数据是否使用了我们的版权图像,为版权所有者提供一种保护自己作品的有效途径。
📌往期推荐
📖2023生成式人工智能治理系列丛书生成式人工智能的发展以及担忧|生成式人工智能的治理愿景和框架...👉点击查收全文链接
🌟2022人工智能治理系列丛书 精华大图集锦版 | 如何维护电商平台信息真实和竞争公平…👉点击查收白皮书全书连载
🔥《追AI的人》系列直播解读AI背景下的数字水印!|当”巨兽”成为”宠物”!|如何避免ChatGPT被滥用…👉点击查收过往36期直播的全部文字回放
🎈《算法治理制度》系列丛书内容和电商领域推荐算法的应用与治理差异|“大数据杀熟” 的背后…👉点击阅读更多算法治理干货
📺 AI治理科普短视频流量为王的时代,教你如何“破圈”创作 | AI生成图与电影画面傻傻分不清?| 信息茧房和马太效应是什么…👉点击观看往期25期精彩视频
👇AAIG课代表,获取最新动态就找她
关注公众号发现更多干货❤️
有启发点在看喔👇