Geoserver加载大文件

WGS84教信者 included in 各种姿势

2023-01-07 2119 words 5 minutes

Contents

背景

希望用geoserver提供大量栅格的wms服务。例如3000+个2MB以内的小geotiff，代表了美国的精细人口密度,分辨率30米。
本文主要参考这个workshop，辅以搜索到的各类教程。

三种可能的处理方式

单tif文件，内部tiling+overview+compression
多个tile的mosaic，辅以内部优化
构建金字塔，辅以内部优化

如何选择处理方式？主要和数据量大小有关

如果数据小于1-2GB，基本推荐单tif文件，但需要优化并且生成合适的内部tile和overview。
大于2GB的数据需要分成小文件，同时建立内部的金字塔和tile。
如果文件特大、且需要再各个缩放层级使用，则需要使用外部的金字塔。

方法1 单tif文件

直接build vrt，之后可以用gdaltranslate转换成tiff，并用gdalado生成overview。
具体参数命令见此博客和官方示例

使用参考：

如何生成overview：
overview级别计算据说边长n倍就是n级别
gdal的tif处理命令示例官方文档
包括gdalinfo、gdal_translate、gdaladdo、Process in bulk、gdalwarp、gdalbuildvrt、gdal_rasterize、gdal_merge.py、gdal2tiles.py、gdal_calc.py、gdal_edit.py
设置压缩参数
gdalado中各个压缩方式参数如何设置官方文档
如何测试性能
在培训资料里给了一个jmeter测试脚本，修改就可以用。参见此处

方法2 生成mosaic

geoserver可以直接安装image mosaic的插件，但性能受限，仍需要优化(参考此回答)。我实际比较过前述的人口数据在geoserver中的使用情况，确实mosaic最慢。
但如果转换成单个文件后太大（压缩完还是20-30GB以上，影响读取速度）或者要同时加载多个时间、波段的文件时，则不得不使用此方法。

方法3 金字塔

金字塔的每个mosaic都存储在一个单独的文件中，虽然有合成时的开销但可以加快图像处理，因为每个overview都是tiled。（与单GEOTIFF不同，其基本级别都可以tile，但overview不会）

使用参考：

使用gdal_retile.py来生成金字塔，并在geoserver使用image pyramid插件。说明和简要步骤见官方示例
图层发布步骤、发布设置、gdal_retile.py使用、USE_JAI_IMAGEREAD设置的官方教程

三种方法外的其他优化

(还是参考了workshop的内容)

JAI设置

Geoserver使用JAI(Java Advanced Imaging)读取影像。可以调整的设置有

Memory capacity和Memory threshold，与TileCache相关
TileThreads 经验是使用CPU核心数量的2倍的线程做Tile Calculation
Tile Recycling 只在内存足够时启用这个功能

Coverage Access设置

调整Geoserver如何使用多线程，对于打开mosaic最重要。主要调整

Core Pool Size 执行线程池的大小
Maximum Pool Size 还可以用上面的经验，设置为CPU核心数量的2倍的线程
ImageIO Cache Memory Threshold 对于WMS不重要，但是对于WCS的大数据量来说，此设置影响缓存到磁盘而不是内存的阈值

重投影设置

-Dorg.geotools.referencing.resampleTolerance 设置重投影的错误范围，默认0.333，数字越大投影错误越多性能越好，注意调太大了和矢量数据一起显示时可能会出问题。

Contents

Geoserver加载大文件

背景

相关知识

目标

一般使用的文件格式

什么是overview

如何选择tiling和金字塔参数

压缩方式

其他需要注意

三种可能的处理方式

方法1 单tif文件

使用参考：

方法2 生成mosaic

方法3 金字塔

使用参考：

三种方法外的其他优化

JAI设置

Coverage Access设置

重投影设置