AIS数据下载并处理(python)

最近由于项目需求,需要下载AIS数据,其实也就是船舶位置数据。

首先通过百度发现目前一些网站下载的AIS数据都是收费的,如船达通等等。

船达通是只能查找近一个月的船舶轨迹信息,下载需要支付收费。

但是最后我终于找到了一个免费下载AIS数据的网站,并且下面附上了处理说明,可以通过python代码批量处理

通过以下的文档可以详细了解如何下载数据,将AIS数据中的时间、经度、纬度、航速提取出来。

最后通过ArcMap处理成为shp,方便可视化。

我是从中国海洋卫星数据网站下载的。

网站地址:https://osdds.nsoas.org.cn/#/

需要注册后使用。

有关网站注册和注册登录不上的问题,可以去邮件网络官方,我当时用没问题,我啥都不知道!

另外不方便借账号!

一、数据说明文档

首先从首页的AIS数据下载并处理(python)下载AIS 0-1级产品数据格式说明V1.0.pdf

打开后可以看到,HY-C/D的L1A产品是可以直接使用的,因此从网站上下载该产品

AIS数据下载并处理(python)

二、数据下载

点击网站首页的数据获取,点击左边的海洋水色卫星数据获取可以得到右边这个界面。

按需求选择。

AIS数据下载并处理(python)

加入订单,下载即可,我觉得有点麻烦的是,批量勾选,每勾选一次自动跳回第一页= =。

最后就等等审批(应该很快,几分钟?),然后就可以下载了/

推荐使用DownThemAll批量下载器,火狐的插件。

三、数据处理

数据下载下来,压缩包格式,解压后,L1A后缀文件才是AIS数据,是csv格式的,并且用逗号分隔,可以用excel打开。

那么批量处理我主要是分成两个程序了。

1、解压

# -*- coding: utf-8 -*-
"""
Created on Sat Feb  6 22:02:47 2021
解压tar.gz文件
@author: 就是一只白
"""

import tarfile
import os
import glob
def untar(fname, dirs):
    t = tarfile.open(fname)
    t.extractall(path = dirs) 
rootdir = "H:\\AIS\\20210104_20210119\\"
outfolder='H:\\AIS\\20210104_20210119\\process\\'
files = glob.glob(rootdir+"*.tar.gz")
#filelist = os.listdir(rootdir)
for file in files:
    print(file)
    untar(file,outfolder)

2、提取时间、位置等数据

报文的解析可以看pdf文件,CSV文件每行代表一个报文消息,每一列是该条信息的一个字段(如速度、时间)。一共有27个报文类型,不同类型的报文后面的信息字段不同。

我下面的代码只筛选了几种进行处理,因为通过excel表筛选发现其他的我这边没有。

以下代码可以获取两个csv文件,代码注释写了两个文件的区别。

最后其实只需要用position的文件即可,数据有四项:时间、航速、经度、纬度

通过修改下方的mmsi号修改查找的船舶

# -*- coding: utf-8 -*-
"""
Created on Sun Feb  7 10:24:29 2021

@author: jiushiyizhibai
"""


import os
import glob
from pandas.core.frame import DataFrame
import csv
import numpy as np
import datetime
#按照mmsi号查找报文信息
rootdir = "H:\\AIS\\20210104_20210119\\process\\"
outfolder='H:\\AIS\\20210104_20210119\\csv\\'
mmsi='309351666'
files = glob.glob(rootdir+"*.l1a")
result=[]
#filelist = os.listdir(rootdir)
for file in files:
    print(file)
    table=open(file,'r')
    s = [i[:-1].split(',') for i in table.readlines()]
    s=[n for n in s if n[5]==mmsi]
    print(len(s))
    if len(s)>0 :
        for i in s:
            result.append(i)
data=DataFrame(result)
time=[]
speed=[]
lon=[]
lat=[]
for row in data.itertuples():
    if row[4]=='1' or row[4]=='3':
        time.append(datetime.datetime.strptime(row[1],'%Y-%m-%d %H:%M:%S'))
        speed.append(float(row[9]))
        lon.append(float(row[11]))
        lat.append(float(row[12]))
    elif row[4]=='27':
        time.append(datetime.datetime.strptime(row[1],'%Y-%m-%d %H:%M:%S'))
        speed.append(float(row[12]))
        lon.append(float(row[10]))
        lat.append(float(row[11]))
    else:
        print("没有查到此类报文:",row[4])
        
presult = DataFrame({'time':time,
                      'speed':speed,
                      'lon':lon,
                      'lat':lat})
presult=presult.sort_values(by='time')
#['time','speed','lon','lat']
#print(data)
data=data.values
#输出文件csv,这里是只输出时间速度和位置
presult.to_csv(outfolder+mmsi+'_AIS_position.csv',index = False)
#输出所有报文信息的文件
csvfile = open(outfolder+mmsi+'_AIS.csv', 'w')  #打开方式还可以使用file对象
writer = csv.writer(csvfile)
writer.writerows(data)
csvfile.close()

3、将csv转成点和线的shapefile轨迹文件(ArcMap)

如何将Excel经纬度坐标数据导入ArcGIS

看上面的即可,点转线用的是点集转线这个功能。

PS:XY建立点数据的时候,选择坐标系统,不要选择投影系统!!不然就会出现点不知在哪的情况

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年3月10日
下一篇 2023年3月10日

相关推荐