Giới Thiệu
Làm việc với GIS đồng nghĩa với việc làm việc với rất nhiều định dạng file khác nhau. Mỗi định dạng được sinh ra cho một mục đích riêng, với ưu nhược điểm riêng. Hiểu rõ chúng giúp bạn chọn đúng công cụ, tránh mất dữ liệu, và tích hợp hệ thống hiệu quả hơn.
Bài viết này phân loại và giải thích các định dạng file phổ biến nhất trong GIS, chia theo nhóm: vector, raster, cơ sở dữ liệu, web, và định dạng chuyên biệt.

Nhóm 1: Định Dạng Vector
Dữ liệu vector biểu diễn đối tượng địa lý qua điểm (point), đường (line), và vùng (polygon) — kèm theo thuộc tính.
1.1. Shapefile (.shp)
Shapefile là định dạng vector ra đời từ năm 1998 bởi ESRI, từng là “ngôn ngữ chung” của ngành GIS.
Cấu trúc file (gồm nhiều file đi kèm):
my_data.shp ← Dữ liệu hình học (bắt buộc)
my_data.shx ← Chỉ mục vị trí (bắt buộc)
my_data.dbf ← Bảng thuộc tính (bắt buộc)
my_data.prj ← Thông tin hệ tọa độ
my_data.sbx ← Chỉ mục không gian
my_data.cpg ← Mã hóa ký tự
Ưu điểm:
- Hỗ trợ rộng rãi — gần như mọi phần mềm GIS đều đọc được
- Đơn giản, dễ chia sẻ
- Kích thước nhỏ
Nhược điểm:
- Giới hạn 2 GB per file
- Tên trường tối đa 10 ký tự
- Không hỗ trợ kiểu dữ liệu DateTime, Unicode đầy đủ
- Không lưu được topology (quan hệ không gian)
- Thực tế là nhiều file, dễ thiếu khi chia sẻ
Dùng khi nào: Trao đổi dữ liệu giữa các hệ thống khác nhau, dữ liệu đơn giản, quy mô nhỏ.
1.2. GeoJSON (.geojson / .json)
GeoJSON là định dạng text dựa trên JSON, được thiết kế cho web và API.
Ví dụ cấu trúc:
{
"type": "FeatureCollection",
"features": [{
"type": "Feature",
"geometry": {
"type": "Point",
"coordinates": [105.8342, 21.0278]
},
"properties": {
"name": "Hà Nội",
"population": 8000000
}
}]
}
Ưu điểm:
- Con người đọc được (text thuần)
- Tích hợp web/JavaScript dễ dàng
- Hỗ trợ đầy đủ Unicode
- Không giới hạn kích thước
Nhược điểm:
- Dung lượng lớn hơn Shapefile
- Không nén mặc định
- Ít phần mềm desktop GIS hỗ trợ chỉnh sửa trực tiếp
Dùng khi nào: Web mapping (Leaflet, Mapbox, Google Maps), API, dữ liệu mở.
1.3. KML / KMZ (.kml, .kmz)
KML (Keyhole Markup Language) — định dạng của Google Earth/Google Maps. KMZ là phiên bản nén (zip) của KML.
Ví dụ cấu trúc:
<?xml version="1.0" encoding="UTF-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2">
<Placemark>
<name>Hà Nội</name>
<Point>
<coordinates>105.8342,21.0278</coordinates>
</Point>
</Placemark>
</kml>
Đặc điểm:
- Gắn liền với Google Earth / Maps
- Hỗ trợ 3D (Camera, Model)
- Dễ tạo, dễ chia sẻ với người không chuyên
- Metadata phong phú (style, description, Timespan)
Nhược điểm:
- Không phải chuẩn mở hoàn toàn (do Google duy trì)
- Chỉ hỗ trợ hệ tọa độ WGS84 trực tiếp
- Xử lý chậm với file lớn
Dùng khi nào: Trình diễn, chia sẻ với người dùng không chuyên, kết hợp Google Earth.
1.4. GPX (.gpx)
GPX (GPS Exchange Format) — chuẩn mở cho dữ liệu GPS.
<?xml version="1.0" encoding="UTF-8"?>
<gpx version="1.1">
<trk>
<name>Đường đi bộ</name>
<trkseg>
<trkpt lat="21.0278" lon="105.8342">
<ele>12</ele>
<time>2026-04-05T08:00:00Z</time>
</trkpt>
</trkseg>
</trk>
</gpx>
Đặc điểm:
- Lưu trữ điểm (waypoint), tuyến đường (route), và track log
- Tích hợp độ cao (elevation) và timestamp
- Được hầu hết thiết bị GPS, app thu thập dữ liệu hỗ trợ
Dùng khi nào: Thu thập dữ liệu GPS thực địa, app như Geocollect xuất dữ liệu, Garmin, Strava.
1.5. GeoPackage (.gpkg)
GeoPackage là chuẩn mở của OGC (Open Geospatial Consortium), lưu trong database SQLite.
Ưu điểm:
- 1 file duy nhất chứa tất cả (vector, raster, metadata, style)
- Không giới hạn kích thước
- Hỗ trợ topology, topology rules
- Tương lai thay thế Shapefile
Nhược điểm:
- Ít phần mềm hỗ trợ hơn Shapefile
- Đọc/ghi phức tạp hơn
Dùng khi nào: Dự án cần 1 file duy nhất, lưu cả vector + raster, chuẩn mở.
1.6. MapInfo (.tab / .dat / .id / .map)
MapInfo TAB là định dạng vector của MapInfo Corporation (nay thuộc Precisely), rất phổ biến trong ngành lâm nghiệp và quản lý tài nguyên Việt Nam.
Cấu trúc file (gồm 4 file đi kèm):
VN_Rung.tab ← Định nghĩa cấu trúc bản đồ
VN_Rung.dat ← Dữ liệu thuộc tính
VN_Rung.id ← Chỉ mục liên kết
VN_Rung.map ← Dữ liệu hình học
Ưu điểm:
- Hỗ trợ rộng rãi trong lâm nghiệp, quy hoạch, môi trường tại Việt Nam
- Quản lý bảng thuộc tính mạnh (liên kết bảng, truy vấn SQL)
- Chuyển đổi dữ liệu với các cơ quan nhà nước (Chi cục Lâm nghiệp, Ban Quản lý rừng)
- Tương thích tốt với phần mềm lâm nghiệp chuyên dụng
Nhược điểm:
- Cũng gồm nhiều file đi kèm — dễ thiếu khi chia sẻ
- Độc quyền MapInfo (dù đã có thư viện đọc mã nguồn mở)
- Ít phổ biến ở ngoài ngành lâm nghiệp / tài nguyên
Dùng khi nào: Dữ liệu lâm nghiệp, ranh giới rừng, bản đồ đất đai, trao đổi với các cơ quan nhà nước Việt Nam.
Nhóm 2: Định Dạng Raster
Dữ liệu raster biểu diễn bề mặt dưới dạng lưới ô vuông (grid/pixel), mỗi pixel mang giá trị (nhiệt độ, độ cao, reflectance…).
2.1. GeoTIFF (.tiff / .tif)
GeoTIFF là định dạng ảnh TIFF mở rộng, chứa thông tin georeference trong metadata.
Đặc điểm:
- Lưu trữ ảnh vệ tinh, aerial photography, DEM
- Chứa thông tin tọa độ, projection, datum
- Hỗ trợ nén (LZW, JPEG, LZ77, ZSTD…)
- Hỗ trợ nhiều kênh (band) — đa phổ, siêu phổ
Nén raster phổ biến:
| Phương pháp | Tỷ lệ nén | Mất dữ liệu |
|---|---|---|
| None | 1x | Không |
| LZW | ~2-3x | Không |
| Deflate | ~2-3x | Không |
| JPEG | ~10-20x | Có |
| ZSTD | ~3-5x | Không |
| COG (Cloud Optimized) | Tùy | Không |
Dùng khi nào: Ảnh vệ tinh, DEM, ảnh nền GIS, chuẩn “ngôn ngữ chung” cho raster.
2.2. ERDAS Imagine (.img)
Định dạng raster chuyên dụng của Hexagon Geospatial (ERDAS IMAGINE).
Đặc điểm:
- Hỗ trợ đa phổ, siêu phổ đầy đủ
- Metadata phong phú cho viễn thám
- Xử lý raster chuyên nghiệp
Dùng khi nào: Phân tích viễn thám chuyên sâu, xử lý ảnh vệ tinh.
2.3. JPEG2000 (.jp2)
Định dạng nén thế hệ mới, nén hiệu quả hơn JPEG truyền thống.
Đặc điểm:
- Nén tổn hao hoặc không tổn hao
- Truy xuất theo vùng (progressive decoding) — tải nhanh trên web
- Hỗ trợ Wavelet transform
Dùng khi nào: Ảnh vệ tinh cần truyền qua mạng, lưu trữ diện rộng.
2.4. MBTiles (.mbtiles)
MBTiles lưu trữ tile raster/map dạng 256x256 pixel PNG/JPEG trong SQLite.
Đặc điểm:
- 1 file duy nhất, dễ sao chép, di chuyển
- Được hầu hết ứng dụng di động (Geocollect, Mapbox, TileMap…)
- Offline map tiêu chuẩn
Dùng khi nào: Bản đồ offline, ứng dụng di động, chia sẻ tile set.
2.5. DEM / DSM / DTM
| Định dạng | Mô tả |
|---|---|
| DEM | Digital Elevation Model — độ cao mặt đất |
| DSM | Digital Surface Model — độ cao mặt đất + vật thể (cây, nhà) |
| DTM | Digital Terrain Model — độ cao mặt đất, đã loại bỏ vật thể |
Định dạng phổ biến: GeoTIFF, ASCII Grid (.asc), FLT, UTM
Nhóm 3: Cơ Sở Dữ Liệu GIS
3.1. File Geodatabase (.gdb)
FileGDB là định dạng database của ESRI (lưu dạng folder chứa nhiều file).
Đặc điểm:
- Lưu trữ nhiều feature class, raster, table trong 1 thư mục
- Hỗ trợ topology, relationship class, network dataset
- Không giới hạn kích thước (so với Shapefile)
- Chỉ đọc được “đầy đủ” trên ArcGIS
Nhược điểm:
- Độc quyền ESRI
- Cấu trúc phức tạp
3.2. SpatiaLite (.sqlite / .spatialite)
SpatiaLite = SQLite + hỗ trợ không gian. Cơ sở dữ liệu GIS nhẹ, mã nguồn mở.
Đặc điểm:
- 1 file database — dễ sao lưu, chia sẻ
- Truy vấn SQL không gian (ST_* functions)
- Miễn phí, mã nguồn mở
- Hoạt động tốt trên mobile (QGIS, apps)
Dùng khi nào: Dự án vừa và nhỏ, cần database nhẹ, QGIS + web stack.
3.3. PostGIS (Database Server)
PostGIS là extension không gian của PostgreSQL — cơ sở dữ liệu quan hệ có khả năng GIS.
Đặc điểm:
- Server-based — nhiều người dùng đồng thời
- Truy vấn không gian mạnh mẽ (spatial joins, routing…)
- Hỗ trợ raster, topology, 3D
- Thường dùng làm backend cho Geoportal, GeoCloud
Dùng khi nào: Dự án lớn, nhiều người dùng, web GIS backend, Geoportal.
Nhóm 4: Định Dạng Web / Tile
4.1. Tile Map Service (TMS) / WMTS
TMS phục vụ bản đồ theo tile pyramid — chia nhỏ bản đồ thành ô 256x256 ở nhiều zoom level.
z=5/x=17/y=10.png ← Zoom 5, cột 17, hàng 10
Phân biệt:
| Giao thức | Đặc điểm |
|---|---|
| TMS | Chuẩn mở OGC |
| WMTS | OGC, hỗ trợ REST & KVP |
| XYZ | De facto standard (slippy map) |
4.2. Vector Tile (.mvt / .pbf)
Vector Tile lưu dữ liệu vector (điểm, đường, vùng) dưới dạng Protobuf (MVT) — nhỏ gọn, render phía client.
Ưu điểm:
- Kích thước nhỏ hơn raster tile nhiều lần
- Style động — thay đổi màu, nhãn mà không cần tile mới
- Phóng to/thu nhỏ mượt mà
Dùng khi nào: Web map hiệu năng cao (Mapbox, MapLibre, OpenLayers 3+).
Nhóm 5: Định Dạng Chuyên Biệt
5.1. DXF (.dxf) — AutoCAD
DXF (Drawing Exchange Format) là định dạng của AutoCAD.
- Trao đổi dữ liệu GIS ↔ CAD
- Hỗ trợ đối tượng 2D, 3D phức tạp
- Không có khái niệm projection trong file
Dùng khi nào: Bản vẽ kỹ thuật, quy hoạch, hạ tầng.
5.2. OpenStreetMap (.osm)
OSM là định dạng native của OpenStreetMap.
- Lưu trữ bản đồ toàn cầu, cộng đồng contribute
- Dạng XML hoặc PBF (nén Protobuf)
- Có thể import vào PostgreSQL/PostGIS
Dùng khi nào: Dữ liệu nền miễn phí, tạo base map, nghiên cứu.
5.3. GML (.gml) — Geography Markup Language
GML là ngôn ngữ đánh dấu của OGC, định dạng XML cho dữ liệu không gian.
- Chuẩn mở, dùng trao đổi giữa các hệ thống
- Phức tạp, verbose
Dùng khi nào: Trao đổi dữ liệu theo chuẩn INSPIRE (EU), WFS (Web Feature Service).
Bảng Tổng Hợp So Sánh
Cột “Web” nghĩa là gì? — Định dạng đó có thể phục vụ trực tiếp trên nền tảng web (trình duyệt) mà không cần phần mềm GIS desktop. ✅ = hỗ trợ, ❌ = không hỗ trợ, ⚠️ = hạn chế.
| Định dạng | Loại | Mã nguồn | Kích thước lớn | Web |
|---|---|---|---|---|
| Shapefile | Vector | Mở | ⚠️ Giới hạn 2GB | ❌ |
| GeoJSON | Vector | Mở | ⚠️ File lớn | ✅ |
| KML/KMZ | Vector | ✅ | ✅ | |
| GPX | Vector | Mở | ✅ | ✅ |
| GeoPackage | Vector+Raster | Mở | ✅ | ⚠️ |
| MapInfo TAB | Vector | MapInfo | ✅ | ❌ |
| GeoTIFF | Raster | Mở | ✅ | ✅ (COG) |
| MBTiles | Raster Tile | Mở | ✅ | ✅ |
| FileGDB | DB | ESRI | ✅ | ❌ |
| SpatiaLite | DB | Mở | ✅ | ⚠️ |
| PostGIS | DB Server | Mở | ✅✅ | ✅ |
| Vector Tile | Tile | Mở | ✅ | ✅✅ |
Ngoài ra, các sản phẩm của TLGeo như Geocollect hỗ trợ nhập và xuất hầu hết các định dạng phổ biến trên. Xem chi tiết: Geocollect hỗ trợ những định dạng nào?
Cách Chuyển Đổi Giữa Các Định Dạng
Công cụ phổ biến
- QGIS: Hỗ trợ hầu hết mọi định dạng, chuyển đổi qua “Save As…”
- ogr2ogr (GDAL): Chuyển đổi hàng loạt, command line
# Shapefile → GeoJSON ogr2ogr -f GeoJSON output.geojson input.shp # GeoJSON → GeoPackage ogr2ogr -f GPKG output.gpkg input.geojson - Python (geopandas, rasterio): Tự động hóa quy trình
- GeoConverter (web): Chuyển đổi online nhanh
Lưu ý quan trọng
- Shapefile → GeoJSON: Kiểm tra mã hóa ký tự (UTF-8)
- GeoPackage: Đảm bảo SRID đúng sau chuyển đổi
- MapInfo ↔ Shapefile: Dùng ogr2ogr chuyển đổi trực tiếp
- Raster: Chọn phương pháp nén phù hợp (nén mạnh → mất chất lượng)
- Topology: GeoPackage và PostGIS giữ được topology; Shapefile thì không
Kết Luận
Không có định dạng “tốt nhất” — mỗi loại phù hợp với một ngữ cảnh khác nhau:
- Chia sẻ đơn giản → Shapefile (phổ biến nhất)
- Web / API → GeoJSON, Vector Tile
- Database nhẹ → SpatiaLite, GeoPackage
- Database lớn, nhiều người → PostGIS
- Raster ảnh vệ tinh → GeoTIFF (COG)
- Bản đồ offline mobile → MBTiles
- Lâm nghiệp & cơ quan nhà nước (Việt Nam) → MapInfo TAB
💡 Mẹo: Sử dụng Geocollect để thu thập dữ liệu GPS thực địa — app hỗ trợ xuất ra nhiều định dạng: GeoJSON, KML, GPX, DXF — phù hợp với hầu hết phần mềm GIS và quy trình làm việc.
Nếu bạn cần tư vấn về định dạng file phù hợp cho dự án, hãy liên hệ TLGeo.
