DDPM,Denoising Diffusion Probabilistic
Models,以其生成细节丰富,指标优秀而闻名。广为人知的是其正向加噪的马尔可夫链和逆向过程,但是概率公式推导却少有人真正掌握得得心应手。在此浅谈,更多是记录,以做“烂笔头”的用。
Forward Process
基础假设
众所周知,DDPM前向过程基于一个巧妙的假设: 从概率学的角度理解,这符合了马尔可夫链(M...
Intro
不同的Epoch之间的数据准备总是会有间隔,这耗费了不必要的时间。并且搭配使用Lightning时,如果不合理的使用Validation,这个问题会更加显著。这里主要讨论使用MultiEpochDataloader和Lightning
Validation策略解决这个问题,实测Epoch之间无缝衔接。
MultiEpochDataloader
Torch.utils.data.D...
写在前面
以往的文章大多侧重于理论探讨和学术分析,而这篇文章的重点则是记录我们在实际工程实现过程中遇到的具体问题和解决技巧。通过这些记录,我们希望能够为未来的项目提供有价值的参考材料,使得在面对类似挑战时能够更加高效地找到解决方案。此外,这篇文章也将作为一个实用指南,便于团队成员和其他读者在需要时进行查阅,以汲取经验和启发。
本文将不断更新,以字典的形式记录在项目搭建和实现过程中遇到的各种值...
UV
UV是Astral团队开发的python包管理工具,功能十分强大。
在github上拥有着31.2k的star(截止2024.12)
uv的设计主要是用于包管理,使用venv等虚拟环境,或者轻量化的代码不使用虚拟环境的时候便捷运行代码。uv的设计并没有集成conda的接口,但是集成了pip的接口,这给我们使用conda环境提供了可能。以下展示uv和conda的配合使用。
uv和c...
1 AE(AutoEncoder)
自编码器的基本结构如图所示,由一个编码器(Encoder),解码器(Decoder),两个之间是一个瓶颈(潜在空间)。
1.1 主要的运行逻辑:
编码器把数据分布映射到潜在空间中,然后通过解码器把潜在空间中的分布映射回真实数据所在的空间中,以达到提取数据特征(编码器)和数据生成(解码器)的目的。
1.2 如何理解图像分布?
先说说数据分布
例如对于骰子而...
Vim简介
Vim是从vi发展出来的一个文本编辑器。其代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。和Emacs并列成为类Unix系统用户最喜欢的编辑器。
Vim适用于纯文本的编辑(代码、markdown文件、LaTeX源码等)
优势:
高效的移动
高效的编辑
高效的批量处理
“Edit Test at the Speed of Thought”
Vim基础知...
前言
image-20240913194016060
学习生成方向一定绕不开的一定是在这个领域的开山之作GAN,于是跟着b站李沐老师一起读了这篇论文,醍醐灌顶。为了加深对其中数学原理的理解和加深记忆,特此记录。
这里挂上论文原文和李沐老师的视频链接
论文链接
视频链接
一个关于GAN起名的有趣的背景故事
当年一作Ian在选择名字的时候,有若干个名字可以选,GAN是其中一个,有一个人...
图床是什么&为什么需要图床
“图床”是一个网络术语,它指的是一种用于存储和托管图片的在线服务。通常情况下,图床允许用户上传图片文件,并提供一个链接或者嵌入代码,使得用户可以在网页或者论坛等地方方便地分享和展示这些图片。
图床服务的主要功能包括:
图片存储:
用户可以将图片上传到图床服务器上,服务器会为每张图片分配一个唯一的URL用于访问。
图片托管:
图床服务将用户上传的图片存储在...
Lighting是什么
Pytorch-Lightning是一个轻量级的Pytorch深度学习框架,旨在简化和规范深度学习模型的训练过程。它的好处在于提供了一组模块和接口,使用户能够更容易地组织和训练模型。同时减少样板代码的数量。PyTorch-Lightning的设计目标是提高代码的可读性和可维护性,同时保持灵活性。它通过将训练循环的组件拆分为独立的模块(如模型、优化器、调度器等),以及...
以最广受欢迎的ubuntu20.04LTS为例 ## ios系统镜像
可以在以下网站下载ubuntu发行版 http://releases.ubuntu.com/20.04/ ##
下载启动盘制作工具(强烈推荐!非常好用!)
http://rufus.ie/downloads/
下载好之后,准备一个大概8GB的u盘即可
装系统
装机的时候插入U盘,启动时进入BIOS,选择从U盘启动即可按照...