Poly Space – 第 2 页 – a blog driven by interest～

MiniMind 学习笔记 07：RoPE 旋转位置编码，从代码到三角公式

2026-05-172026-05-17 作者 PengChao

Attention 本身只看 token 内容，不天然知道 token 的位置。如果两个 token 的内容 … 阅读更多

MiniMind 学习笔记 06：Attention 详解，QKV、Mask、GQA 与 MQA

2026-05-172026-05-17 作者 PengChao

Attention 是 LLM 里最核心、也最容易让初学者卡住的模块。 MiniMind 的 Attentio … 阅读更多

MiniMind 学习笔记 05：Transformer Block 里到底发生了什么

2026-05-172026-05-17 作者 PengChao

上一篇看了 MiniMind 的整体结构：这篇进入每一层 MiniMindBlock。在 Min … 阅读更多

MiniMind 学习笔记 04：模型结构总览，Config、CausalLM 与 Backbone

2026-05-172026-05-17 作者 PengChao

前面已经看过 tokenizer、dataset 和训练循环。现在进入模型结构。 MiniMind 的模型代码 … 阅读更多

MiniMind 学习笔记 03：从 train_pretrain.py 看懂 LLM 训练循环

2026-05-172026-05-17 作者 PengChao

理解 LLM 训练，最好的入口不是一上来就看复杂的分布式训练框架，而是先看一个足够小、足够完整的训练脚本。 M … 阅读更多

MiniMind 学习笔记 02：LLM 的数据如何进入模型

2026-05-172026-05-17 作者 PengChao

上一篇从 tokenizer 讲起：文本会被切成 token，再变成一串整数 input_ids。但 … 阅读更多

MiniMind 学习笔记 01：从 Tokenizer 开始理解 LLM

2026-05-172026-05-10 作者 PengChao

学习 LLM 工程时，很多人会直接从 Transformer、Attention 或训练脚本开始。但如果从工程 … 阅读更多

波动率 Volatility

2024-10-202024-10-20 作者 PengChao

波动率被用来衡量标的波动幅度，同时也影响衍生品的定价。这里主要介绍期权的波动率。参考资料：一、IV和HV … 阅读更多

img2table实用脚本

2024-10-07 作者 PengChao

使用img2table将图片转化为excel表格的脚本（https://github.com/xavctn/i … 阅读更多

OpenCL Vision Image Extension

2024-09-172024-09-16 作者 PengChao

OpenCL Vision Image Extension 使用的指令集，又叫做 EVIS （Enhanced … 阅读更多

3dgs部署问题记录

2024-05-282024-05-24 作者 PengChao

3d gaussian splatting（3dgs）的出现是三维重建和图形渲染的里程碑。这里主要是关于把3d … 阅读更多

KAN论文笔记

2024-05-172024-05-04 作者 PengChao

KAN（Kolmogorov-Arnold Networks）相比于MLP的改进在于激活函数的可学习，可以用更少量的参数来做更深层次的拟合，极大减少了网络参数，增强了网络的可解释性，KAN缺点在于训练过于缓慢，这篇笔记主要是对论文主干的翻译，我们先看看KAN的论文。（Paper有48页，慢慢啃）

Mamba论文笔记

2024-04-302024-04-30 作者 PengChao

简单记录一下Mamba相关几篇paper的创新和改进过程，首先SSM把RNN和CNN结合起来，可以像RNN一样 … 阅读更多

omniverse与blender交互

2024-04-172024-04-17 作者 PengChao

omniverse和blender结合有两种方式，一种是blender中的模型导入到omniverse中产生形态键动画，然后再导回blender，这种方式可以直接参见nvidia的视频guide，另一种方式是omniverse直接产生动画，在blender中利用插件完成绑定，我们这里介绍后面这种。

这篇博客主要介绍利用Omniverse驱动人体模型和面部表情映射的大致基本流程，主要介绍两套工具之间的桥梁，不会具体到每个参数，如果需要系统学习，可以单独找omniverse或者blender的课程，它们会介绍的更详细。开始之前，需要有blender操作基础，以及对Riggfy，ARP（Auto Rig Pro）和Faceit 动画绑定插件有一些基本了解。

PyCharm调用wsl调试器问题记录

2024-03-142024-03-12 作者 PengChao

记录pycharm启动wsl调试器时出现问题和解决方法。 1. 报错：wsl a localhost prox … 阅读更多

pyRender离线渲染的一些问题

2024-03-132024-03-12 作者 PengChao

记录一下使用pyRender在没有显示器的服务器端做场景渲染时遇到的一些报错和解决。

写在前面，pyrender真是个大坑，渲染还很慢， realrender用cpu渲染也很快，问题没这么多，如果还没有绑定pyrender可以早些转投realreader，调试时候也需要灵活些，发现egl后端问题解不了，可以先用osmega后端，两个可以切换着来。

Codebook机制和CodeFormer图像恢复

2024-03-03 作者 PengChao

这篇博客主要介绍Codebook机制和CodeFormer，之前介绍了一种类似包含dictionary的算法 RestoreFormer和RestoreFormer++，他们有一些共通的机制，之前看VQ-VAE时候没有把Codebook梳理清楚，这里补补坑。