StableDiffusion实时推荐

让创意在幻觉中肆虐: 认识Illusion Diffusion AI - 程序员泥瓦匠 -

6天前 https://www.cnblogs.com/Alandre/p/18190405

人工智能新境界在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品。敬请关注Illusion Diffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造出迷人的视错觉和超现实意境。 AI算法的魔力所在 Illusion Diffusion 的核心是借助

让机器准确「看懂」手物交互动作，清华大学等提出GeneOH Diffusion方法 -

13天前 https://www.jiqizhixin.com/articles/2024-05-07-2

Story Diffusion 字节的漫画作品一致性开源了？牛牛！可以生成一致性连贯的视频和图片。 -

16天前 https://www.v2ex.com/t/1037670

Clara998: 试用 demo：Story Diffusion 介绍： https://storydiffusion.github.io/ 源码： https://github.com/HVision-NKU/StoryDiffusion 不过，他说可以生成视频，我试了下，怎么一直没找到？

【comfyui】40个工作流一次让你彻底掌握controlNet的使用场景(2)-法线和深度处理器 -

16天前 https://juejin.cn/post/7364418751481331746

highlight: darcula theme: smartblue 我计划使用40个工作流分成3-4篇文章来介绍Stable Diffusion的controlNet各种预处理器以及它的使用效果。并且做成像字典一样的记录，后面需要使用时，也可以随时查阅，当然这些工作流我也会分享，需要的朋友可以在文章底部加我微信获取。这是我们的第二篇，本篇主要介绍stable diffusion controlNet 法线和深度预处理器。第一篇：【comfyui】40个工作流一次让你彻底掌握SD control

comfyUI 安装及初体验 -

16天前 https://juejin.cn/post/7363836438935142435

写在前面今天在公众号看人提到ComfyUI，出于好奇，上git上浏览了一番。花了3h左右时间体验了一波，感觉很不错，向大家推荐一波~~~ 简介 ComfyUI是一个基于节点流程的Stable Diffusion操作界面，其特点包括显存要求低、启动与出图速度快，以及高生成自由度。用户可以通过调整模块连接定制工作流程，实现精准的工作流定制与完善的可复现性。此外，ComfyUI还支持多种模型和模式，并能保存和复用工作流，提高工作效率。地址：github 安装前检查查看自己电脑是否支持GPU 方式一：通过设备管

unity 2D 像素精灵的生成有推荐的方法吗？ -

17天前 https://www.v2ex.com/t/1037612

Fffys: 看到官方有推出付费版的 Muse ，不知道效果怎么样，价格每月 30 刀感觉有点小贵 Midjourney 也是收费的，还没有尝试，而且需要制作动画，看到有人说 MidJourney 制作动画不如 Stable Diffusion ； Stable Diffusion 有尝试了，但是感觉不是很好调整，每生成一个精灵都要花很长的时间，动画目前还在摸索，刚接触 SD 没几天目前还没有成功制作动画。还有其它的方法推荐吗？或者，unity 之外的选择，只要能够用来做 2D 像素游戏，并且 2D

【comfyui】40个工作流一次让你彻底掌握SD controlNet的使用场景(1)-线性处理器 -

17天前 https://juejin.cn/post/7364051847176814592

我计划使用40个工作流分成3-4篇文章来介绍Stable Diffusion的controlNet各种预处理器以及它的使用效果。并且做成像字典一样的记录，后面需要使用时，也可以随时查阅，当然这些工作流我也会分享，需要的朋友可以在文章底部私信我获取。长文预警，建议收藏/点赞再阅读。 Stable Diffusion 的 ControlNet 是一个控制预训练图像扩散模型的神经网络。它允许输入调节图像，然后使用该调节图像来操控图像生成。ControlNet 最近非常火，它和 Stable Diffusion

实现diffusion模型(手写数字集) -

17天前 https://juejin.cn/post/7363823940606066728

前段时间阅读了 Denoising Diffusion Probabilistic Models论文，最近在MNIST数据集进行了实现，效果还不错。如图1所示，展示的是去噪的过程，图片左上角是时间戳。当时间戳=1000时候，是一个白噪声；当时间戳=1时候，是一张清晰的手写数字。图1. 恢复过程(去噪过程) 模型介绍 Diffusion 模型是加利福尼亚大学Jonathan等人提出的，该模型在图像生成、多模态模型方面具有巨大的影响力。比如，给一个模糊的图片，你可以使用Diffusion模型得到更清晰的高

人大卢志武：只要拿到更多算力，超过Sora也不是那么难的事｜中国AIGC产业峰会 -

17天前 https://hub.baai.ac.cn/view/36843

编辑部整理自凹非寺量子位 | 公众号 QbitAI一支人大系大模型团队，前后与OpenAI进行了三次大撞车！第一次是与Clip，第二次是与GPT-4V，最新一次撞在了Sora上：去年5月，他们联合并联合伯克利、港大等单位于在arXiv上发表了关于VDT的论文。那时候，该团队就在在技术架构上提出并采用了Diffusion Transformer。并且，VDT还在模型中引入统一的时空掩码建模。这个团队，正由中国人民大学高瓴人工智能学院教授卢志武带队。Sora问世已经两个多月，现在这支国产团队在视频生成领域的

用大模型生成带文字的海报 -

20天前 https://juejin.cn/post/7363490901341552678

本文代码讲整合在： GitHub - liangwq/Chatglm_lora_multi-gpu: chatglm多gpu用deepspeed和这篇文章介绍如何利用VLM+diffusion模型来搭建一条文本生成海报的链路。搭建这条链路有两个应用：1.实际的业务中需要批量生产文字+图海报可以用，2.可以用来造训练数据。首先介绍下这篇文章的整体框架安排： 1.生图模块 2.字排版模块 3.图文混合模块 4.图审核验证模块生成模块部署文本生成图片模型pixart-sigma： 1.安装环境和下载