按时间归档:2022年
-
Bert:Pre-training of Deep Bidirectional Transformers forLanguage Understanding
原文链接:https://arxiv.org/pdf/1810.04805.pdf 概述 本文提出了一种新的语言模型-Bert,由transformer中的标准的双…
-
【论文阅读】RepVGG: Making VGG-style ConvNets Great Again
论文 RepVGG: Making VGG-style ConvNets Great Again 论文地址 https://openaccess.thecvf.com/conten…
-
神经网络与深度学习(五)前馈神经网络(2)自动梯度计算和优化问题
注:本次使用的数据集依旧是前两章的Moon1000数据集 from nndl.dataset import make_moons 【详细代码见 神经网络与深度学习(五)前馈神经网…
-
解决:ARIMA模型,用BIC矩阵确定p、q参数的时候BIC矩阵输出全是None
ARIMA模型,用BIC矩阵确定p、q参数的时候BIC矩阵输出全是None 最近学习时间序列,学习到ARIMA模型时,采用了前人的教程(在此感谢),但在新的版本上运行出现错误。 P…
-
COLING 2022 | Pro-KD:循序渐进的平滑知识蒸馏
©PaperWeekly 原创 · 作者 | werge 研究方向 | 自然语言处理 Overview 随着神经模型规模的不断扩大,知识蒸馏作为模型压缩的重要工具收到越来越多的关注…
-
Transformer模型的训练后剪枝方法
Paper地址:https://arxiv.org/abs/2204.09656 GitHub链接:https://github.com/WoosukKwon/retraining…
-
python多项式拟合:np.polyfit 和 np.polyld
python数据拟合主要可采用numpy库,库的安装可直接用pip install numpy等。 这段代码可以直接用,但是要用自己的值 #多项式拟合 y = data_jied…
-
梯度下降算法原理讲解——机器学习
目录 1. 概述: 2. 梯度下降算法: 2.1 场景假设 : 2.11 参数 2.12 实例: 1. 概述: 梯度下降在机器学习的运用非常的广泛,它的主要目的就是找到目标函数的最…
-
贝叶斯神经网络的 MCMC 训练 MCMC Training of Bayesian Neural Networks
from: http://www.fields.utoronto.ca/talks/MCMC-Training-Bayesian-Neural-Networks 一、贝叶斯神经网络…
-
[论文阅读]A Joint Training Dual-MRC Framework for Aspect Based Sentiment Analysis
摘要 基于方面的情感分析 (ABSA) 涉及三个基本子任务:方面术语提取、观点术语提取和方面级情感分类。早期的工作只专注于单独解决这些子任务之一。最近的一些工作集中在解决两个子任务…