CLIP(Contrastive Language-Image Pre-training),OpenAI给的title:Connecting text and images,被用作文本监督信号来训练可迁移的视觉模型。CLIP是一种基于对比学习的多模态模型,训练数据是文本-图像对(一张图像和其对应的文本描述),模型能够学习到文本-图像对的匹配关系。以下内容搜集自论文、知乎、OpenAI Blog Page (一手资料参阅以下链接的openai blog)
PengChao
HSV颜色空间的运动判出
来自论文: iccv99.pdf (ed.ac.uk) Change Detection in Color I … 阅读更多
cmake引用pybind11
python调用C++用pybind11来封装接口比较方便易用,由于pybind11和python环境有匹配关系,cmake构建工程时先检测python环境,然后导入pybind11环境,这篇博客提供一个参考的cmakelists和一个简单的测试。
Python保存函数入参到文件,并从文件load再次调用
在部分调试场景下,我们需要保存函数运行的现场,方便直接从函数入口开始调试(而不是从头开始运行整个工程),我们通常会选择把函数入参保存到文件,再次调试时我们从文件运行即可。下面的代码段提供了一个功能,把函数所有入参保存到文件,然后重新从文件load函数入参,并调用函数。泛型入参都打包到字典,保证代码复用。
Demosaic算法的零散笔记
demosaic算法主要过程是判边(Direction)和插值,同时需要考虑区域的饱和度(Saturation … 阅读更多
2008-2023经济数据摘录
数据来源是东方财富网站,博客只做贴图(特别留意几个时间点:2018年贸易战,2019-2022疫情情前后的变化),数据本身很有趣,博主的comments不构成投资建议,不过毫无疑问的是我们正处于通缩周期中。
香港REITs(一)发展
不动产投资信托(Real Estate Investment Trusts,缩写REITs)又称房托基金、地产信托,于1960年发源于美国,是一种通过发行收益信托凭证/股份汇集资金,由管理人进行房地产投资、经营和管理,并将投资总和收益分配给投资者的证券。
对于投资者而言,REITs由不动产的证券话以及许多投资人的资金募集,使得没有庞大资本的一般投资人也能以降低门槛参与不动产市场,活动不动产市场交易、租金与增值所带来的收益。同时投资人不需要实质持有不动产标的,就可在正确市场交易,因此市场流通性由于不动产。
德国银行N26信用卡开户
参考链接: https://wzproject.com/n26-review/
Pyside6 Graphview鼠标框选
上一篇博客给了一个QImageView类,其中实现了图片浏览器的基础鼠标操作,在此基础之上,进一步实现鼠标框选的操作。具体实现时,我们先构建一个场景类QImageScene,用于管理场景中的Item,场景中的Item主要有两类,一类是图像,另一类是选择框。对于选择框的操作,我们把鼠标事件定义在QImage Scene类中。
Pyside6实现的ImageView类
实现了一个ImageView类,继承自QGraphicsView,主要overwrite鼠标和滚轮事件,实现基本的拖拽,以鼠标中心点进行缩放。
图像高斯噪声情况下的运动判别
问题是我们估计一对图像之间是否存在局部运动,我们知道这两张图像各自的噪声分布,在某个亮度下服从正态分布sigm … 阅读更多
MATLAB符号工具箱(三)求导数和驻点
使用符号工具箱求导函数,以及使用solve解方程的一个简单例子:
MATLAB符号工具箱(二)解带约束条件的方程组
两个例子, 一是用solve函数解带约束条件的方程组, 二是用fmincon函数解带约束条件的最小化问题 一个 … 阅读更多
Matlab符号工具箱(一)化简方程
翻老代码发现之前写了一个简单的符号工具箱化简方程,好久不用遗忘了,留个代码备份
几何流形工具书
一、偏微分方程
精细光流估计
这篇博客是论文:High Accuracy Optical Flow Estimation Based Theory for Warp 的笔记,论文为2004年,在2015年EpicFlow方法中引用。
在稠密光流估计中,最后一步往往是将光流图进行Refine和smooth,来确保光流在空间上连续,大部分区域符合刚体运动假设,同时也会处理遮挡,为遮挡区域提供连续的光流值。
在介绍的论文中,建立了一个能量函数,将光流图的优化和优化能量函数联系起来。论文偏向传统,但是也很经典,接下来一起看下做法。