気象データを解く〜データを開く前に用語とか整理

  • 2012.06.26 Tuesday
  • 22:45

気象データを解析しようと思うが、
どこから入手すればいいのか、どうやって解析すればいいのかについて覚え書き

できるだけ多くの気象に興味のある人(特にこれから研究しようとしている学生さん)に、
気象の知識だけでなく、コンピュータで気象解析ができるようになってくれればと思っています。



前回からの続きです。

データを入手したので、早速開いてみると・・・

気象データの中身

メモ帳で開いても訳の分からない文字の羅列になっていると思う。

GRIBというのはバイナリファイルなので、人間ではなくコンピュータが読みやすい形で保存されている。

普通に開いても読むことができないが、
上のようなバイナリエディタを使えば、00とかFFなどという16進数で読むことができる。

例えば、先頭の4バイト、47 52 49 42 という16進数は、
エクセルでCHAR(HEX2DEC(47))と入れると G が返る。

他も同様に変換すると GRIB となる。

これは仕様書に書いてある1〜4オクテットのヘッダに一致する。

末尾の4バイト、37 37 37 37は仕様書の終了節 7777 に一致する。


なんだ、こんなに簡単に解読できるのか・・・
と思ったら、残念なことに、他は文字では表現できないデータのようです。

文字で読めないとなると挫折してしまいそうです
(おそらく、コンピュータや特にプログラミングに慣れていない人は、挫折どころではないかもしれませんが・・・)


でも、がんばって解いていきましょう。


続きを読む >>


関連投稿
気象データを解く〜データを入手する
気象データを解く〜データを開く まずは基本的な第0節から
気象データを解く〜データを開く 第1節を読む
気象データを解く〜データを開く 第3節を読む
気象データを解く〜データを開く 第4節を読む
気象データを解く〜データを開く 第5節を読む
気象データを解く〜データを開く 第7節を読む
気象データを解く〜データを開く 続くデータを見ていく
気象データを解く〜データを開く surfファイルを読む
気象データを解く〜データをパソコンで解析する その1
気象データを解く〜データをパソコンで解析する その2
気象データを解く〜データをパソコンで解析する その3

単位変換や気象計算覚え書き
単位変換覚え書き〜風向風速
 


さて、ここから先は、難しい用語が羅列することになるので、
今回の本題、基本的なものだけ整理しておく。


■バイト、ビット
コンピュータでは0か1(OFFかON)の2進数を使って情報を表現している。
例えば、 G(半角G)という文字は 2進数で表すと 1000111 となる。

7つの0と1の数字が並んでいるが、この1つ1つをビットといい、
数え方としては7あるので、7ビットという感じになる。

このビットの集まりが8つ(8ビット)集まると1バイトという単位になる。


■オクテット

では、GRIBの仕様書に書いてあるオクテットという単位はというと、

1オクテット=1バイト=8ビット

です。
ここではコンピュータからアプローチするので、まれにバイトで表現することがある。
もしそういった表現がでたら、1バイト=1オクテットのことだと思ってください。

例えば、4オクテットなら、データのある位置から4バイト切り出して解読すると言うことになります。


■進数
先ほどから出てきているN進数ですが、簡単に言うと、その数字に達すると桁が上がるという意味です。

たとえば、ふだん生活で使っている数字は、0〜9の10進数と呼ばれるものですが、
0〜9までしかないので、9の次を表現することができない。

なので、0〜9の10個の束を1と表現して、1つ上の空いているところ(10の桁)にそれを表して、10と表現してやればよいわけです。

そして、また11、12・・・と続けて、19まで達すると、
やっぱり次が表現できないので、2つ目の10個の束が集まったということで、
20と表現するわけです。

こうして10個の束を束ねて表現するのが10進数です。


同じようにコンピュータでは先ほど説明した通り、0か1の2つでしか表現できないので、2進数ということになる。

0、1、とくると桁が上がって10、11、また桁が上がって100・・・となるわけです。


この他に、16進数や256進数などがありますが、データを解読していく中で説明していきます。


ちなみに、上の方で書いたバイナリという言葉は、2進数という意味で、
その2進数の集まりで保存されたデータなので、バイナリデータ(ファイル)などと呼びます。

逆に、人間の読める形に直したものは、テキスト形式などと呼びます。


コンピュータ用語の細かなことは、他力ちゃんということで、専門書などを読んでください。
ここでは、そんなものだと言うこと程度にしておきます。


20120627追記分

■時刻の表現
時刻の中心はグリニッジです。この時刻をグリニッジ標準時(GMT)と呼ぶ。
現在は、UTCと呼ばれる世界協定時に置き換わっているが、基準はグリニッジのある経度0度となる。

日本は経度135度の明石が時刻の中心で、グリニッジから見ると+9時間の時差がある。
この日本を中心とした時刻のことを日本標準時(JST)と呼ぶ。

例えば、UTC 0時 = JST 9時 ということになる。

なお、気象では、00Zとか00UTCとかで表現することがある。
落としてくるデータ(ファイル名もファイル内も)はすべてUTCが基準となっています。


■ビックエンディアン・リトルエンディアン
仕様書を読むとデータはビックエンディアンで格納されているといった文が出てきます。

細かいことは説明しませんが、オクテット単位に切り出したデータをどちらから読むかという
方向を表した言葉と思ってください。

ビックエンディアンの場合は左から順に読んでいくことになります。

例えば、00 00 00 00 03 02 E9 61 とバイト列を読み取った場合は、
000000000302E961という感じで読み取り、解読していきます。

なお、リトルエンディアンは61 E9 02 03 00 00 00 00と格納されていますので、
右から順に000000000302E961と読み取っていきます。



これ以外の用語はその都度出てきたら、その場で説明や、ここへ追記していきます。



さて、次こそいよいよバイナリを解読です。


関連投稿
気象データを解く〜データを入手する
気象データを解く〜データを開く まずは基本的な第0節から
気象データを解く〜データを開く 第1節を読む
気象データを解く〜データを開く 第3節を読む
気象データを解く〜データを開く 第4節を読む
気象データを解く〜データを開く 第5節を読む
気象データを解く〜データを開く 第7節を読む
気象データを解く〜データを開く 続くデータを見ていく
気象データを解く〜データを開く surfファイルを読む
気象データを解く〜データをパソコンで解析する その1
気象データを解く〜データをパソコンで解析する その2
気象データを解く〜データをパソコンで解析する その3

単位変換や気象計算覚え書き
単位変換覚え書き〜風向風速
 
コメント
コメントする








    
この記事のトラックバックURL
トラックバック

calendar

S M T W T F S
     12
3456789
10111213141516
17181920212223
24252627282930
<< June 2018 >>

search this site.

よく使う、検索される投稿

categories

アマゾン

楽天

selected entries

archives

recent comment

  • SharePointの容量がパンパン!?〜OneNoteの容量確認と履歴の完全削除
    rockecco (06/12)
  • SharePointの容量がパンパン!?〜OneNoteの容量確認と履歴の完全削除
    haru (05/24)
  • Thumbs.dbでフォルダが削除、名前の変更ができない件
    rockecco (05/18)
  • Thumbs.dbでフォルダが削除、名前の変更ができない件
    rockecco (05/18)
  • Thumbs.dbでフォルダが削除、名前の変更ができない件
    BWM (05/16)
  • Thumbs.dbでフォルダが削除、名前の変更ができない件
    通りすがり (05/09)
  • Windows Updateのサービスが起動していない
    rockecco (04/25)
  • Windows Updateのサービスが起動していない
    hiro (04/21)
  • Windows10 1607 のタスクスケジューラの挙動がおかしい?
    rockecco (03/27)
  • Windows10 1607 のタスクスケジューラの挙動がおかしい?
    Hiro (03/27)

recent trackback

profile


※当ブログはリンクフリーですが、 取材や雑誌等で掲載される場合は、事前にお知らせください

others

mobile

qrcode

powered

無料ブログ作成サービス JUGEM