Imagic笔记 Imagic笔记 先前的工作大多数方法目前仅限于以下一种:特定的编辑类型(例如,对象叠加,样式转换),合成生成的图像,或需要一个共同对象的多个输入图像。文章作者展示了将复杂的基于文本的语义编辑应用于单个真实图像的能力。与之前的工作相反,这篇文章提出的方法只需要一个输入图像和一个目标文本(所需的编辑)。它生成一个与输入图像和目标文本一致的文本嵌入,同时微调扩散模型以捕获特定于图像的外观。 扩散模型是 2023-03-29 笔记 #文字生成图片
UE,Unity和WebGL技术对比 UE,Unity和WebGL技术对比 随着科技的不断进步和数字化时代的到来,元宇宙(Metaverse)已经成为了人们对未来虚拟世界的向往和探索。构建一个具有真实感、互动性和无限可能性的元宇宙需要借助于强大的技术平台。UE(Unreal Engine)、Unity和WebGL作为当前最主流的数字娱乐和游戏开发引擎,被广泛应用于游戏、影视等领域。那么在构建元宇宙的过程中,这三种技术平台各自有什么优缺 2023-03-21 #ThreeJS #元宇宙
ControlNet笔记 ControlNet笔记 作者的代码开源在GitHub。 想要体验ControlNet看我的文章 介绍 作者在文章开头先对当前大型text-to-image model提出了疑问:这种基于提示的控制是否满足我们的需求?例如在图像处理中,考虑许多具有明确问题公式的长期任务,这些大型模型能否被应用于促进这些特定任务?我们应该建立什么样的框架来处理广泛的问题条件和用户控制?在特定任务中,大型模型能否保持 2023-03-20 笔记 #文字生成图片
Cascade EF-GAN笔记 Cascade EF-GAN Cascade EF-GAN可以更好地保留与身份相关的特征和细节,特别是在眼睛、鼻子和嘴巴周围,进一步帮助减少生成的面部图像中的伪影和模糊。 模型架构 作者设计了一种级联式网络,同原本对一张人脸做更改变成了对一张人脸和脸上几个部分同时做更改。因为对一个人类来说分辨一个人的方式就是看人的眼睛,鼻子和嘴巴。Cascade EF-GAN能够识别面部表情编辑中局部重点的重要性 2023-03-12 笔记 #文字生成图片
Everybody Dance Now笔记 Everybody Dance Now 为了完成给定一个人跳舞的视频到另一个人的目标,文章作者将这个过程分成三部:pose detection, global pose normalization, and mapping from normalized pose stick figures to the target subject pose detection 使用openpose对骨骼点进行 2023-03-11 笔记 #文字生成图片
从0开始写c语言课设 从0开始写c语言课设 项目简述 管理系统是C语言课设的经典项目,但是在chatGPT已经兴起的今天依然有不少同学因课设而困扰,本文将从0开始写一个简单的药店管理系统。 项目开源于 GitHub flowchart TD; login-->read_from_file login-->encrypt-->login read_from_file-->* 2023-03-03 工具 #C语言
DALLE2笔记 DALLE2笔记 Abstract graph LR; 文本--CLIP模型-->文本特征; 文本特征--prior生成图像特征-->两阶段模型; 两阶段模型--decoder-->图像; 文本--ground truth-->两阶段模型; 基于扩散模型的解码器能够通过给定信息的解码器,生成很多不一样的图片 ,语义信息和风格比较接近,只是细节不一样。 可以直接修改和编 2023-02-09
yolov5和yolov5-face环境搭建和常见踩坑 yolov5环境搭建 在随便哪新建一个requirements.txt文件 内容是 1234567891011121314151617181920212223242526272829303132333435363738394041424344# YOLOv5 requirements# Usage: pip install -r requirements.txt# Base ----------- 2023-02-07 踩坑 #机器视觉
copliot才是代码开发神器 copliot才是代码开发神器 本文使用copilot和chatGPT辅助完成 copilot是微软的AI代码生成器,可以帮助我们快速完成代码编写(这句copilot简介是copilot写的)。在openai的chatGPT出现后,copilot的风头有所下降,直到刚才…… 几分钟前我在写我的博客ThreeJS实现屏幕坐标转3d坐标时,原本的第一段代码是这样的: 12345678910111213 2023-02-04 工具 #Microsoft
ThreeJS实现屏幕坐标转3d坐标 ThreeJS实现屏幕坐标转3d坐标 本文使用chatGPT辅助完成 在虚拟世界中,3D坐标与屏幕坐标之间的转换是一个重要的问题。使用ThreeJS开发3D场景时,经常需要将屏幕坐标转换为3D坐标。在本文中,我们将介绍如何使用ThreeJS实现屏幕坐标转3D坐标的两种方法 根据相机的投影矩阵和射线拾取 在我的笔记摄像机模型中详细推导了相机的投影矩阵。 在ThreeJS中,相机的投影矩阵是一个4x4 2023-02-04 工具 #ThreeJS