按时间归档:2022年05月
-
基于Python的视觉词袋实现数据分类
1. 问题描述 从训练集中随机选择 200 张图用以训练,对每一张图提取归一化 RGB颜色直方图(8*8*8=512 维),同时执行问题 2 对其进行图像分割,(分割为 50~70…
-
Pytorch中DataLoader && TensorDataset 的基本用法
DataLoader: DataLoader(dataset=torch_dataset,batch_size=BATCH_SIZE,shuffle=True,num_worker…
-
机器学习三要素总结
针对机器学习三要素,模型、策略和算法,对所学《机器学习》中各个算法逐步总结。 模型 策略 算法 适合问题 一元线性回归 线性模型 最小化均方误差,极大似然估计 一阶导为0 回归 多…
-
ConvNeXt理论讲解
A ConvNet for the 2020s 论文下载链接:https://arxiv.org/abs/2201.03545 论文对应源码链接:https://github.co…
-
语义分割系列11-DAnet(pytorch实现)
DAnet:Dual Attention Network for Scene Segmentation 发布于CVPR2019,本文将进行DAnet的论文讲解和复现工作。 论文部分…
-
机器学习——主成分分析(PCA)
#先随便创建一个具有相关性的数据集 import numpy as np from matplotlib import pyplot as plt from numpy impor…
-
【双目视觉】双目立体匹配
一、双目立体匹配算法 在opencv中用的比较多的双目立体匹配算法有两种:BM和SGBM。SGBM是BM立体匹配算法的优化版,属于半全局匹配,相对于BM花的时间要更多,但效果优于B…
-
【OCR入门】二、文本识别(CRNN+CTC)
前言 这篇主要是介绍下CRNN+CTC的原理和主要代码。 有两个难点: 双向LSTM原理 CTC Loss原理 一、文本识别背景 文本识别是OCR的一个子任务,主要是识别一个固定区…
-
AI-理论-吃瓜教程-基础-task2
AI-理论-吃瓜教程-基础-task2 (Datawhale37期组队学习) 1知识点 基本 线性回归 对数几率回归 线性判别分析 多分类学习 类别不平衡问题 2具体内容 2.1基…
-
[阅读笔记] Learnable Multi-scale Fourier Interpolation for Sparse View CT Image Reconstruction
本文提出直接学习一种插值方法,该方法由多尺度DNN建模,用于从极坐标系中的可用系数预测笛卡尔坐标系中的二维傅里叶系数。实验表明,与现有的基于DNN的解相比,所提出的…