ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定|当前热点

2023-06-08 12:04:10   来源:商业新知网

一组神秘的“虚拟老婆”照片,最近在国内外社交媒体上传疯了。


(资料图片)

怎么回事?

试着用手机扫一下,就能发现其中的玄机——

原来这些看起来颇为自然的照片,都是藏了 二维码 的图像。它们不仅能被手机相机识别,跳转的网站还都是有效的:

从推特到Reddit,每隔几条就能刷出这些二维码照片,下面全是一片“竟然扫出来了”的惊叹声。

最关键的是,这些照片并非手动绘制,而是用 Stable Diffusion 生成的,背后再一次加持了神奇的 ControlNet 魔法。

生成的二维码图像风格,也远非只有二次元虚拟人像这一种,一起来看看~

8种图像风格任意可选

除了上述的二次元插(lao)画(po)风格以外,作者们还展示了另外8种二维码图像的生成效果。

这是 立体风格 的二维码图像,看起来就像一张真正的城市照片一般:

有网友感叹,简直可以在物理世界中构造一个真的二维码城市了:

甚至它只能在特定的地点、特定的日子、特定的时间被扫出来,有寻宝游戏内味了。

这类立体作品不仅细节可控(如更多的草木植被),还可以改变风格,生成更具机械感的科幻二维码图像:

3D城市看得不过瘾,还有2D 抽象风格 的作品,数据都藏在小房子里了:

除此之外,二维码还能被融入 中国传统纹样风格 中,或是被巧妙放置在瓷器或壁画一类的装饰物里:

更具艺术性的 水墨风格 也能hold住,无缝衔接画作笔迹:

又或是这种 水彩风格 的画作:

日式的 浮世绘风格 也没问题:

还能嵌进 PCB风格 图像里,以后电路板要找售后,直接扫码就行(doge):

显然,除了二维码图像可控,模型就连插画风格都能很好地控制。

这背后究竟是依靠什么技术实现的?

LoRA和ControlNet齐出动

要想实现这种图像风格+二维码可控的效果,需要Stable Diffusion结合 LoRA 和 ControlNet 一起实现。

其中,LoRA负责控制整体的图像风格,ControlNet则负责确保二维码“放进”了图像中。

LoRA 全称Low-Rank Adaptation of Large Language Models,能很好地实现少样本学习,从而对Stable Diffusion的图像风格生成进行更精准的控制。

换而言之,最少只需要 几十张 同种风格的图片,就能训练一个LoRA,用来调教Stable Diffusion生成的效果。

目前,比较有特色的如中国传统风格和浮世绘风格的图像,作者们都已经在 Civitai 和 Hugging Face 等平台上开源了对应的LoRA模型。

像浮世绘风格LoRA模型,就已经可以在Civitai上直接下载:

训练这样一个浮世绘风格的LoRA模型,并不需要很多照片,像这个模型就只用了 46幅 葛饰北斋《富岳三十六景(追加十景)》的浮世绘。

风格变化更加多样的,如生成不同中国传统纹样的图片,也只需要 近百张 图片训练:

就可以得到能画出不同纹样的LoRA模型:

QR Code ControlNet 则是作者们新训练的一个二维码图像生成专用ControlNet模型,目前还在不断优化中。

作者们尝试了不同的Stable Diffusion Checkpoint、LoRA和QR Code ControlNet的组合,生成了上面这些二维码图像的效果。

值得一提的是,结合最近的PS新出的 Generative Fill 功能,这些二维码还能被很好地嵌进一大块AI生成图像中:

有网友调侃,未来就连广告也会变得更好看了。

作者介绍

制作这个二维码生成项目的作者一共有四位,分别来自中国传媒大学和北京航空航天大学。

其中, 倪豪 和 陈柏宇 是中国传媒大学大四本科生, 王照涵 是中国传媒大学一年级研究生, 陈智勇 是北京航空航天大学大四本科生。

在这次的AI二维码图像生成项目前,倪豪和陈智勇就已经做出过一个参数化二维码生成器,不过主要采用的还是图形学方面的技术。

据倪豪介绍,他们之前的研究方向主要集中在图形学和交互艺术上,随着这段时间AIGC爆火,团队也对这方面的技术产生了兴趣。

这段时间里,他们开发了不少不同风格的LoRA模型,以及可控制光影的ControNet等,目前模型也都已经放在Civitai上。

团队表示,目前这个二维码图像生成模型还在持续优化中,后续如果有更多的进展更新,也会同步到这个网站上。

关键词:

精彩阅读

ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定|当前热点

热点

一组神秘的“虚拟老婆”照片,最近在国内外社交媒体上传疯了。

首个百度文心千帆大模型平台成立# 注册资本1.2亿_世界速递

热点

股东信息显示,该公司由无锡市梁溪人才集团有限公司、广东极目产业科技

VITURE完成近千万美金A+轮融资:产品定位于高端消费级XR眼镜-速讯

热点

2022年底,VITURE获得了《TIME》年度发明奖,是消费级AR VR领域唯一获奖品牌。

世界速看:苹果Vision Pro:何止吊打Oculus、pico、谷歌眼镜

热点

我们纵向对比苹果其他产品,VisionPro的确是定价较高。

苹果头戴式设备Vision Pro会成为吹响下一代社交设备的号角产品吗_焦点报道

热点

也许这个交互设备会分流手机的体验,家庭影院和智能电视体验的市场份额

一次讲透一个CRM更新【2】

热点

线索进入CRM后,立即锁定电话和邮箱字段。

AI,数字时代的“生产力革命” 实时

热点

ChatGPT与很多互联网产品不同的一点是:用户数增长是相当快的。

常被忽视:游戏与科技的休戚与共

热点

人工智能(AI)可能是最近二三十年对人类社会影响较深远的科技之一。

互联网的底层逻辑是如何运作的?|当前速看

热点

深入了解互联网的底层逻辑,不仅能够让我们更好地理解数字世界的运作方

财富

每日头条!韩媒:苹果大幅削减MR头显销售目标至15万台

资讯

韩媒:苹果大幅削减MR头显销售目标至15万台,当地时间6月6日,据硅谷多

特斯拉动员中国供应商出海,去墨西哥复制“上海工厂” 世界热门

资讯

特斯拉动员中国供应商出海,去墨西哥复制“上海工厂”,特斯拉正在动员

十元店重回巅峰:新穷人与日本1990s 当前消息

资讯

十元店重回巅峰:新穷人与日本1990s,中产没钱了,但“新穷人经济”很赚

客人去哪了?五一后各地餐饮生意直线下滑,突然就没人了

资讯

客人去哪了?五一后各地餐饮生意直线下滑,突然就没人了,今年以来,餐

美国社交电商再起波澜:TikTok商城开张,Meta却要闭门做生

资讯

美国社交电商再起波澜:TikTok商城开张,Meta却要闭门做生,“寸草不生

元禾能源完成数千万元Pre-A轮融资 环球即时

资讯

元禾能源完成数千万元Pre-A轮融资,近日,元禾能源宣布完成数千万元Pre-

每日热议!柔创纳科获数千万元融资

资讯

柔创纳科获数千万元融资,近日,国内新能源储能器件隔膜开发商柔创纳科

造“风”的AIGC,“吹灭”了元宇宙?

资讯

造“风”的AIGC,“吹灭”了元宇宙?,以文心一言和ChatGPT为代表的生成

全球聚焦:苹果画的Vision Pro“大饼”,全球创业者抢着吃

资讯

苹果画的VisionPro“大饼”,全球创业者抢着吃,苹果“栽树”,“后人”

极兔收购丰网,受伤的只有加盟商?

资讯

极兔收购丰网,受伤的只有加盟商?,入“兔”无门,无“网”可归

首个百度文心千帆大模型平台成立# 注册资本1.2亿_世界速递

股东信息显示,该公司由无锡市梁溪人才集团有限公司、广东极目产业科技

VITURE完成近千万美金A+轮融资:产品定位于高端消费级XR眼镜-速讯

2022年底,VITURE获得了《TIME》年度发明奖,是消费级AR VR领域唯一获奖品牌。

世界速看:苹果Vision Pro:何止吊打Oculus、pico、谷歌眼镜

我们纵向对比苹果其他产品,VisionPro的确是定价较高。

苹果头戴式设备Vision Pro会成为吹响下一代社交设备的号角产品吗_焦点报道

也许这个交互设备会分流手机的体验,家庭影院和智能电视体验的市场份额

一次讲透一个CRM更新【2】

线索进入CRM后,立即锁定电话和邮箱字段。

世界视讯!肺结节影是怎么回事严重吗_肺结节影是怎么回事

1、肺结节影是由结核杆菌造成,人类致病的有人型结核杆菌和牛型结核杆

光绪(关于光绪的基本详情介绍) 天天百事通

光绪,绪的基本详情介绍很多人还不知道,那么现在让我们一起来看看吧!

中信建投:弱复苏背景下,成长板块2月预计仍占优

2月1日消息,中信建投研报认为,短期政策+基本面预期共振向上难以证伪

关注:铁角飞驰怎么去(铁角飞地怎么去 魔兽世界7 0至高岭铁角飞地在哪里)

1、你好,铁角飞地在破碎群岛-至高岭地图的偏左下方,是采矿和锻造任务

【天天新要闻】汉语语法问题探究_关于汉语语法问题探究简述

1、《汉语语法问题探究》是2021年商务印书馆出版的图书。2、 。文章到

兴业证券:给予龙湖集团(00960.HK)“买入”评级 目标价24.00港元_天天速看

兴业证券6月7日发布公告。维持“买入”评级,目标价24 00港元:公司年