avatar
Articles
871
Tags
281
Categories
185

Yan 的杂物志_个人主页分享
Search
图像处理之_OpenCV入门
Created2017-06-01|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _OpenCV 入门 1. 带着问题看 OpenCV 1) 实现了哪些功能,如何调用? OpenCV 实现了图像处理(类似 PhotoShop),校正,分割前景背景,视频监控,运动跟踪,人脸识别,手势识别等功能,并支持机器学习算法。和很多开源工具一样,它提供的是很基础的功能。程序开发者利用基本函数的组合,适配场景,实现具体功能。它本身只是一个工具集,不是具体问题的解决方案。 只在应用层面调用的话,知道基本的数据结构,函数接口,就可以了。 2) 如何应用数学知识? 可以把学习 OpenCV 看做应用“数学”的过程,空间,矩阵,微积分,统计等工具都在其中使用。图像处理是应用数学较多的领域,具体实现可以通过源码看到,更重要的是了解数学方法的具体用途,才能举一反三。 了解其中的数学方法,是较深入的层面,如果大学数学都已经忘记了,就很容易卡住,或者似乎明白了,又似乎不明白。不妨把它作为一个切入点,带着这些问题去看数学书,然后会发现数学很有用。OpenCV 还有一个好处是,它能很直观地看到操作之后的效果,用实例理解抽象的概念。 3) 如何组织和处理视觉信息? OpenCV 在数据存储, ...
图像处理之_卡尔曼滤波
Created2017-05-19|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 卡尔曼滤波 1. 用途 根据一些已知的量来预测未知的量。常用于运动预测。 2. 定义 卡尔曼滤波(Kalman filtering)一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。 由于观测数据中包括系统中的噪声和干扰的影响,最优估计也可看作是滤波过程,因此叫作卡尔曼滤波。 3. 原理分析 1) 第一部分:预测值与误差 假设你和我两个人每天给同一头猪测体重,但两个称都不准。你测 x1 斤,正负误差在σ1 斤左右(假设预测成高斯分布,标准差反映了测量值好坏程度的不确定性),我测 x2 斤,正负误差在σ2 斤左右。结合两个人的预测,简单计算猪的体重是 x1 和 x2 的平均值。 图片.png 假如我的称更准,即误差更小,σ2<σ1,结合两个人的测量,应该以我为主,因此根据误差加权组合。 图片.png (通过概率函数导数的最大值推出上述公式,不在此详述) 由公式可知:如果你的不确定性σ1 越大,我的测量值 x2 在新均值中占的比例越大(权值更大)。 后来你走了,用上一次的加权平均(x1,σ1)替代你的测量,我的测量 ...
Python函数绘图
Created2017-05-19|2_Note0_Technic3_编程Python大数据
Python 函数绘图 最近看数学,发现有时候画个图还真管用,对理解和展示效果都不错。尤其是三维空间和一些复杂函数,相当直观,也有助于解题。 本来想用 mathlab,下载安装都太费事,杀鸡不用牛刀,Python 基本就能实现,三维图还可以拖动图像来回旋转。 下面分别在二维三维举例说明。 1. 二维绘图 描述: 绘制极坐标系中 r=1 和 r=2cosθ的相交部分(没画的时候,确实没看出 r=2cosθ也是正圆) 程序 123456789101112131415import numpy as npimport matplotlib.pyplot as pltplt.figure(1)ax = plt.subplot(111)x = np.linspace(0, np.pi * 2, 200)  # 在0到2pi之间,均匀产生200点的数组 # r = 2cosθr = 2 * np.cos(x)  # 半径ax.plot(r * np.cos(x), r * np.sin(x))# r = 1r = 1ax.plot(r * np.cos(x), r * np.sin ...
图像处理之_傅立叶变换
Created2017-05-09|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 傅立叶变换 #图形图像 1. 图像处理中的傅立叶变换 将一幅图像从其空间域(spatial domain)转换为频域(frequency domain)。图像处理用到的主要是离散傅立叶变换(Discrete Fourier Transform),下文中简称 DFT。 图片.png 如上图所示,左边是原始图像(左白右黑),中间是 DFT 变换,右侧为变换后生成的频谱图(幅度相位共同决定了图中点亮度)。 上图展示了红色点 (x,y) 的变换,在纵轴方向,它所在的列颜色值都为 0(黑色),因此组成它的波形也能量也都为 0,在横轴方向,如中间图所示,左则为 255(白色),右则为 0(黑色),将其拆分成正弦波的组合,再利用拆分后的各个波的幅度(亮度)相位(亮度)以及频率大小(位置)生成频谱图(上图中简化了相位)。 原始图中的每个像素点,是由不同频率波投射在该点的能量叠加而成的,而频谱图中的每个点是原始图中每个像素点在该频率上的能量叠加而成的。它们之间都是一对多的关系,不存在一一对应。 2. 如何理解公式 图片.png 以上公式分别是一维和二维 DFT 的定义(摘自《 ...
图像处理之_轮廓匹配
Created2017-05-09|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 轮廓匹配 1. 引子 图像识别可通过轮廓,直方图等方式实现,像人脸识别这种复杂应用,实现它的方法很多,通常是基础方法的改进版与机器学习组合。 基于轮廓的识别,需要把图像拆分通道,寻找边缘,转换为轮廓(多边形逼近,特性概括等),然后进行轮廓匹配(图像与图像匹配,图像与模板匹配)。 程序员根据不同情境,选择适合图像抽象方法和匹配方法。 轮廓的匹配主要是解决大小,位置,旋转角度,精度不同图像间的匹配问题。方法包括轮廓矩,成对几何直方图,凸包和凸缺陷,等级匹配等等,下面以轮廓矩为例,看看它是如何实现的,同时也了解一下矩在图像处理中的应用(基于统计的方法)。 2. 是什么矩(moment) 数学定义:实函数相对于值 c 的 n 阶矩为 图片.png 从上述公式可以看到,它就是一个加了权重的积分,而权重是 (x-c)^n,其中 n 是阶数(n 阶矩),如果把它想成一个平面直角系中,c 是 x 轴上的一点,(x-c)^n 是各个 x 点相对于 c 点值的 n 次方。以下是个积分的图示,只要想象一下,它的每个小方块再乘上权重:(xi-c)^n 即可得到矩。 图片.png 轮 ...
图像处理之_仿射变换与透视变换
Created2017-05-03|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 仿射变换与透视变换 1. 仿射变换 1) 用途 旋转 (线性变换),平移 (向量加).缩放 (线性变换),错切,反转 2) 方法 仿射变换是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”(直线经过变换之后依然是直线)和“平行性”(二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的位置顺序不变)。任意的仿射变换都能表示为乘以一个矩阵 (线性变换),再加上一个向量 (平移) 的形式. 图片.png 以上公式将点 (x,y) 映射到 (x’,y’),在 OpenCV 中通过指定一个 2x3 矩阵实现此功能(公式中的 m 矩阵,是线性变换和平移的组合,m11,m12,m21,m22 为线性变化参数,m13,m23 为平移参数,其最后一行固定为 0,0,1,因此,将 3x3 矩阵简化为 2x3) 3) 举例 以原点为中心旋转,2x3 矩阵为: 12345[ cos(theta), -sin(theta), 0 ],[ sin(theta), cos(theta), 0 ]则x’ = x * cos(theta) - sin(thet ...
图像处理之_聚焦效果LogPolar
Created2017-05-03|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 聚焦效果 LogPolar #图形图像 #数学 1. LogPolar LogPolar 是将笛卡尔坐标到对数极坐标的变换.即:将 (x,y) 映射到 (log(ρ),θ) 2. 笛卡尔空间&笛卡尔坐标 笛卡尔坐标系 (Cartesiancoordinates) 就是直角坐标系和斜角坐标系的统称.本文中用到的是平面直角坐标系. 图片.png 3. 极坐标 在平面上取一定点 o,称为极点,由 o 出发的一条射线 ox,称为极轴。再取定一个长度单位,通常规定角度取逆时针方向为正。这样,平面上任一点 P 的位置就可以用线段 OP 的长度ρ以及从 Ox 到 OP 的角度θ来确定,有序数对(ρ,θ)就称为 P 点的极坐标,记为 P(ρ,θ);ρ称为 P 点的极径,θ称为 P 点的极角。 图片.png 4. 笛卡尔坐标到极坐标变换 图片.png 在 OpenCV 中使用函数 CartToPolar() 实现. 5. 自然常数 e(欧拉数) 自然常数 e(约为 2.71828)其是公式为 图片.png 6. 对数定义 若 a^n=b(a>0 且 a≠1) ...
图像处理之_导数微分
Created2017-04-28|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 导数微分 #图形图像 #数学 1. 一阶导数应用:图像的梯度 1) 用途: 在图像处理中, 常用梯度求取图像的边缘, 这是一个很基础的应用. 下图为在 OpenCV 中使用 cvSobel() 函数的具体效果. 四张图分别为: 原图, 在 x 方向上的梯度, y 方向上的梯度, xy 方向上的梯度. 图片.png 2) 二元函数 这里我们只讨论二元函数 z=f(x,y) 的导数, 通常把二元函数想像成一个曲面, 公式中的 x,y,z 分别映射到坐标系中的 x,y,z 轴. 于是我们看到了很多像山坡一样的三维图, 切线, 切面, 很看来很复杂.我觉得从图像处理的角度看二元函数似乎更容易理解, 为了简化, 我们以一张黑白图为例. x,y 轴分别对应成图像的宽和高, 颜色的灰度对应 z 值: z = f(x,y),每个像素点的颜色值是其坐标 (x,y) 的函数. 图片.png 3) 梯度的定义 函数 z = f(x,y) 在区域 D 内具有一阶连续偏导数,则对于每一个属于 D 的点 P(x,y),都可定出一个向量,这个向量称为函数 z = f(x,y) 在点 P ...
图像处理之_霍夫(Hough)变换
Created2017-04-28|2_Note0_Technic2_算法8_图形图像基础方法
图像处理之 _ 霍夫(Hough)变换 #图形图像 1. 用途 Hough 变换是一种在图像中寻找直线,圆及其它简单形状的方法.当我们对图像进行边缘检测之后,可用 Hough 变换识别图像中的简单形状.该转换也是对图像的一种抽象(由繁到简).下面介绍最基本 Hough 变换:寻找直线算法. 2. 思路 Hough 变换通过从直角坐标系到极坐标系的转换,将直角坐标系中的一条"直线",转换为极坐标系上的一个"点",落在这条"直线"上的像素点越多,这个极坐标中"点"的权越重,最终通过分析各个"点"的权重(局部最大值),获取重要线段.为区别直角坐标系中的点和极坐标系中的点,下面我们将直角坐标系中的点称为像素点. 3. 具体实现 图片.png 如图所示,假设我们有一个桃心图形,由多个红色像素点组成(红色为其有意义的像素点,即轮廓值),想提取出其中的直线.如果将各个像素点连成直线,直线将会有很多条,有些有意义,有些没意义.一般认为像素点足够多的直线更具意义,比如图中的绿色和蓝色的直线.在直角坐标系中,可以用斜截式 y=kx+b 来表示一条直线(k 是斜率,b 是 y 轴上的截距).转换到极坐 ...
Android开发_精准排布控件位置
Created2017-04-24|2_Note0_Technic3_编程Android
1. 简述 在Android系统上开发程序,很多时候需要精准的排布控件的位置和大小.并且适合各种比例的屏幕(4:3,16:9…),下面分别介绍在高版本和低版本的Android中的实现方法. ## 2. Android Studio/高版本Android实现 1) 说明 使用高版本android内置的android-support-percent-lib库,通过设置百分比的方法,实现了该功能, Demo一般都是android studio,Eclipse下需要下载支持库:http://download.csdn.net/detail/sbsujjbcy/8857747 在Layout中设置百分比:PercentRelativeLayout/PercentFrameLayout/PercentLinearLayout 2) Layout文件 1234567891011121314151617<?xml version="1.0" encoding="utf-8"?><android.support.percent.PercentFr ...
1…717273…88
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
871
Tags
281
Categories
185
Follow Me
Announcement
This is my Blog
Recent Post
赣锋锂业公司分析2025-09-25
七日阿勒泰喀纳斯旅行指南2025-09-24
采棉产业的科技变革2025-09-24
股票_相关知识2025-09-14
量化交易入门2025-09-14
Categories
  • 0_IMO90
    • 工作1
    • 方法1
      • 工作1
    • 说给一个人听88
      • 01_自我建构36
        • 实修3
        • 思考与觉悟17
Tags
大模型/应用 历史 编程语言 行为模式 Django 医学 网络 区块链 机器学习/算法 社会关系 文化反思 主题笔记 Android/theme 自我反思 阅读/心理学 Arduino 智能家居 现实认知 markdown 插件推荐 日常记录 开源项目 自我剖析 宗教 语音识别 社会学 Transformer 深度学习/扩散模型 视频生成 插件开发 后端测试 知识库 编程语言/前端 阅读/经济学 自然语言处理/统计方法 语音 Python/图形图像 卡片 移动开发 股票预测
Archives
  • September 202512
  • August 202519
  • July 202539
  • June 202537
  • May 202529
  • April 202516
  • March 20258
  • February 20252
Info
Article :
871
Total Count :
1218.8k
UV :
PV :
Last Push :
©2020 - 2025 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database