让创意在幻觉中肆虐: 认识Illusion Diffusion AI - 程序员泥瓦匠 -
人工智能新境界 在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注Illusion Diffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。 AI算法的魔力所在 Illusion Diffusion 的核心是借助
Story Diffusion 字节的漫画作品一致性开源了?牛牛!可以生成一致性连贯的视频和图片。 -
Clara998: 试用 demo:Story Diffusion 介绍: https://storydiffusion.github.io/ 源码: https://github.com/HVision-NKU/StoryDiffusion 不过,他说可以生成视频,我试了下,怎么一直没找到?
【comfyui】40个工作流一次让你彻底掌握controlNet的使用场景(2)-法线和深度处理器 -
highlight: darcula theme: smartblue 我计划使用40个工作流分成3-4篇文章来介绍Stable Diffusion的controlNet各种预处理器以及它的使用效果。 并且做成像字典一样的记录,后面需要使用时,也可以随时查阅,当然这些工作流我也会分享,需要的朋友可以在文章底部加我微信获取。 这是我们的第二篇,本篇主要介绍stable diffusion controlNet 法线和深度预处理器。 第一篇: 【comfyui】40个工作流一次让你彻底掌握SD control
comfyUI 安装及初体验 -
写在前面 今天在公众号看人提到ComfyUI,出于好奇,上git上浏览了一番。花了3h左右时间体验了一波,感觉很不错,向大家推荐一波~~~ 简介 ComfyUI是一个基于节点流程的Stable Diffusion操作界面,其特点包括显存要求低、启动与出图速度快,以及高生成自由度。用户可以通过调整模块连接定制工作流程,实现精准的工作流定制与完善的可复现性。此外,ComfyUI还支持多种模型和模式,并能保存和复用工作流,提高工作效率。地址:github 安装前检查 查看自己电脑是否支持GPU 方式一:通过设备管
unity 2D 像素精灵的生成有推荐的方法吗? -
Fffys: 看到官方有推出付费版的 Muse ,不知道效果怎么样,价格每月 30 刀感觉有点小贵 Midjourney 也是收费的,还没有尝试,而且需要制作动画,看到有人说 MidJourney 制作动画不如 Stable Diffusion ; Stable Diffusion 有尝试了,但是感觉不是很好调整,每生成一个精灵都要花很长的时间,动画目前还在摸索,刚接触 SD 没几天目前还没有成功制作动画。 还有其它的方法推荐吗? 或者,unity 之外的选择,只要能够用来做 2D 像素游戏,并且 2D
【comfyui】40个工作流一次让你彻底掌握SD controlNet的使用场景(1)-线性处理器 -
我计划使用40个工作流分成3-4篇文章来介绍Stable Diffusion的controlNet各种预处理器以及它的使用效果。 并且做成像字典一样的记录,后面需要使用时,也可以随时查阅,当然这些工作流我也会分享,需要的朋友可以在文章底部私信我获取。 长文预警,建议收藏/点赞再阅读。 Stable Diffusion 的 ControlNet 是一个控制预训练图像扩散模型的神经网络。它允许输入调节图像,然后使用该调节图像来操控图像生成。ControlNet 最近非常火,它和 Stable Diffusion
实现diffusion模型(手写数字集) -
前段时间阅读了 Denoising Diffusion Probabilistic Models论文,最近在MNIST数据集进行了实现,效果还不错。如图1所示,展示的是去噪的过程,图片左上角是时间戳。当时间戳=1000时候,是一个白噪声;当时间戳=1时候,是一张清晰的手写数字。 图1. 恢复过程(去噪过程) 模型介绍 Diffusion 模型是加利福尼亚大学Jonathan等人提出的,该模型在图像生成、多模态模型方面具有巨大的影响力。比如,给一个模糊的图片,你可以使用Diffusion模型得到更清晰的高
人大卢志武:只要拿到更多算力,超过Sora也不是那么难的事|中国AIGC产业峰会 -
编辑部 整理自 凹非寺量子位 | 公众号 QbitAI一支人大系大模型团队,前后与OpenAI进行了三次大撞车!第一次是与Clip,第二次是与GPT-4V,最新一次撞在了Sora上:去年5月,他们联合并联合伯克利、港大等单位于在arXiv上发表了关于VDT的论文。那时候,该团队就在在技术架构上提出并采用了Diffusion Transformer。并且,VDT还在模型中引入统一的时空掩码建模。这个团队,正由中国人民大学高瓴人工智能学院教授卢志武带队。Sora问世已经两个多月,现在这支国产团队在视频生成领域的
用大模型生成带文字的海报 -
本文代码讲整合在: GitHub - liangwq/Chatglm_lora_multi-gpu: chatglm多gpu用deepspeed和 这篇文章介绍如何利用VLM+diffusion模型来搭建一条文本生成海报的链路。搭建这条链路有两个应用:1.实际的业务中需要批量生产文字+图海报可以用,2.可以用来造训练数据。 首先介绍下这篇文章的整体框架安排: 1.生图模块 2.字排版模块 3.图文混合模块 4.图审核验证模块 生成模块 部署文本生成图片模型pixart-sigma: 1.安装环境和下载
下滑推荐(鼠标滚轮下滑)