リクリ チャット 発表原稿の為の妄想まとめ
今週末にスピーカーとして参加予定のRe:Creator’s Chat。
テーマは決めてる割りに原稿が脳内でのみ構成されている現状…
ということで、まとめてみる。当日、リスナーで参加される方がもしこのエントリーを見てたら、続きは読まないことをお勧めします。
とはいえ、ちょっと小難しい単語もここでは現れてくるはずなので、当日の発表との差を見てもらうのも面白いかもw
とりあえず、資料をまとめるための自分用資料として書き連ねていきます。
かなり乱暴な解説なので(持ち時間などの関係上)、数学の先生などは読まない方が良いかと思います。頭頂部かヘソで茶が沸かせるかと。
まずはJpegの基本原理から。
の前に、概念的に言い切ってしまうけど、「自然界の波は、定常波の組み合わせで表現できる」。
はい、突っ込みどころ満載。でもスルー。
どんなにウネウネした波形でも、Sin波やCos波のいろいろな周波数の組み合わせで表現できてしまう。
ここで自然画像に眼を戻してみると、階調が自然に変化している画像であればその変化はある種の「波形」であると考えることが出来、上記の「定常波の組み合わせで表現」に当てはめることが出来る。
画像を色データの並びから、周波数データの組み合わせに変換することが出来るわけだけど、さて、周波数に置き換えられたことで、どんな利点が生まれるのか?
人間の生理的な特性として、変化の激しい早い箇所には対応できない、というものがある。ゆっくりした変化には対応できても、早い変化には対応しきれない。うなりのような「ぅわ~んぅわ~ん」という音は認識できても、耳につくようん「ピー」という音は“変化している音”と認識できない、という表現でお分かり頂けないだろうか?
波形を周波数で分解するということは、低周波から高周波までのそれぞれの成分に分解している、ということ。
ここで「高周波成分=変化の激しい早い部分」として考えることが出来る。
人間の特性として高周波(=変化の激しい早い部分)の認識が弱いのであれば、その部分のデータが欠落しても、復元した際にはその欠落分を認識しにくい。
単純にデータを20%削るより、人間に認識しにくいデータを20%削るのとではその品質に差が出るのは想像に難くない。
つまり、Jpegでは画像を周波数の成分に分解し、人の認識しにくい高周波成分を削ることで、画像から人に認識されにくい形でデータを削ぎ落とすことが出来、劣化を感じにくくする、ということでまとめることが出来る。
(単純に周波数の高い順から削り落としていくのではなく、量子化という処理の段階で量子化テーブルを使用して、効率的にデータを削る)
(ちなみに、1次元データに利用しているのがMP3。)
上記の理由によって、例えば階調の変化の激しい大きい画像、例えば写真の中に文字が含まれるもの・アニメ調のもの、等はその変化の急激さから高周波成分を的確に捉えることが出来なくなり、その周辺にノイズが生まれてしまう。これがいわゆる「モスキートノイズ」。本来なら少ない割合の高周波成分が多く検出されてしまう為です。
さらに、Jpegでは8×8ピクセルの矩形に区切って処理を行うため、圧縮率を上げてしまうと隣のブロックとの誤魔化しが利かなくなってくる。これが「ブロックノイズ」
処理効率などを考慮しているため、上記の仕様になっているわけだけれど、それを払拭するために生まれたのがJpeg 2000。Jpegで採用しているDCTではなくDWTのため、高周波成分をより的確に捉えることが出来るし(=より高精度に認識しづらいデータを削ぎ落とすことが出来る)、理論的にはブロックノイズも発生しない(実際には大きめの矩形に区切って処理しているらしい)。
の割りに、処理速度にネックがあったり、各ブラウザが対応しなかったりで、お世辞にも普及しているとは言い難い。
で今、脚光を浴び始めているのが、アルファチャンネルを保持し、綺麗な半透明を表現できる、PNG。
という流れで次の発表に繋げられたらいいなぁ。
09.26
指摘に基づいて「周波数の変化の激しい」→「周波数の変化の早い」に訂正。その他、ちょこちょこニホンゴ修正。
いちおう工業高校の電子機械科出身なのでこの話は分かるw
なぜか仕事は化学分析ですがww
重箱の隅だけど、周波数とは1秒間の波数なので、「高周波=変化が激しい」よりも「高周波=変化が早い」という表現にしないと帯域とゴッチャになりそうな気が。
掲載日: 2008年09月25日 11:23 PM by ないと☆どらいぶ
おぉっ!工業高校の電子機械科ってこんなことまで勉強するのね。
指摘㌧クス。そうよね、「激しい」だったら違う意味に取れちゃうね。
あ゛~スライド全然作れてね~
掲載日: 2008年09月26日 7:39 AM by 板