kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

Kaggle

机器学习竞赛、托管数据库、编写和分享代码

注册:

安装插件:Header Editor  (参考链接见文末)

注册后:首页:

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

导航栏、搜索栏、社交栏、个人信息

 kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

代码查找、下载

数据集下载:

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

 下载全部数据、下载单个数据、命令行(安装pip install kaggle)

代码:

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

保存至自己的项目

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

 修改项目题目、保存

 

项目建立、运行、模型保存

上传数据集:

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

也可以直接拖动文件到空白处上传。有文件夹的情况,压缩再上传。 

编写代码:

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

保存、添加/选择数据集、输入、输出、语言

 

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

训练结果(可打开、保存)

机器学习竞赛:

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

打开任意一个:

Data数据模块:注意数据规模、数据类型,用合适的服务器。kaggle 用户的每个 kernel 可以有 16G 的内存和 4 CPU,这足够打多数比赛了。另外,提供了 GPU,在新建 kernel 的时候可以选择开启 GPU,但当打开 GPU 时,CPU 和内存资源会少一些。

 kaggle 平台上的比赛分4类: 挖掘、图像、语音、NLP

Rules :比赛规则。提交次数:这里会写明每天允许的最大提交次数,一般是5次。 另一个是组外私自分享代码和结果,这也是明令禁止的。组队之后队员之间可以分享,或者通过公开的 kerneldiscussion区分享。每个队伍最多4个人,并且是可以共享代码 Kernels :核心代码。支持 Python 语言的脚本 .py .ipynb,和 R 语言的脚本 .R .ipynb public kernel private kernel Discussion :讨论区。Leaderboard:排名区,分 public LB private LB。比赛方会将 test 数据集中一部分(比如 30%)拿出来做为 public LB 评分和排名,剩下的部分作为 private LB(最终结果)的评分和排名。

每天都可以提交并查看自己的答案在 public LB 的得分和排名情况,在比赛结束前需要选择两个提交作为自己的最终答案,比赛结束后,平台会计算答案的 private LB 得分并自动挑选得分高的一个作为最终成绩。

CV scoreLB score,指的是模型本地交叉验证的得分和提交后的 public LB 得分。shake uppublic LB 得分可能会和 private LB 得分差别很大,一般是模型过拟合了。

kaggle简单使用教程(代码查找.下载、项目建立.运行、参加比赛)

参考链接

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年2月26日 上午8:36
下一篇 2023年2月26日 上午8:37

相关推荐