データフォーマットには、コンテンツへの参照を組み込むめるものもあります。 この参照は、データを見た時に自動的に読み出されます(ユーザが選択するのを 待たずに)。 このデータがインターネット経由(全世界から広く)で読み出せるなら、この機能を 使って読者についての知見がなくても、情報を取得できる可能性があります。また場合 によっては、読者に承諾を得ないまま強制的に動作させることも可能です。 このプライバシーに関連する問題を「Web バグ」と呼ぶ場合があります。
Web バグを使って、ドキュメントの中にあらかじめ参照を埋め込みます。コンテンツの 著者は、誰が、どこで、どんな方法でドキュメントを読んだのか追跡するのに、これを 利用します。 また著者は基本的にはどのように「盗み見されている」ドキュメントがある人から 別の人へ、ある組織から別の組織へとどのように渡っていくのかも見張れます。
HTML フォーマットは以前からこの問題を抱えていました。
Privacy Foundation に
よれば、
インターネットで広告を扱う会社は、今日 Web バグを Web ページ上で広く利用して
います。また追跡調査を行うために HTML ベースの電子メールでも使われています。
それらは、普通大きさが 1 x 1 ピクセルで、スクリーン上では目に見えず、追跡調査
に使われているのを隠しています。
しかし、それらは(img タグを使った)画像ではありません。
他に Web バグを実行している HTML タグには、たとえば、フレームやフォーム
呼び出し、スクリプトがあります。
単独で Web バグを実行すると「盗聴」サイトに対して、読者の IP アドレスや
読者が訪れたページ、ブラウザについてのさまざまな情報を提供します。クッキーを
あわせて利用すると、読者を個別に特定できるようになります。
Web バグについての概要については、
http://www.securityspace.com/s_survey/data/man.200102/webbug.html
で見られます。
もっと心配なのは、他のドキュメントのフォーマットがそのような機能も持っている ように見える点です。 Web サイトにある HTML を Web ブラウザで見る時に、誰がデータをブラウジング しているかという情報を取得する方法が別にあります。しかし、電子メールのような 別のフォーマットのドキュメントを見る時に、ドキュメントを読んだだけで監視され てしまうと想像できるユーザはほとんどいません。 たとえば、最近になって Microsoft Word は Web バグのサポートを決定しました。 the Privacy Foundation advisory for more information を見てください。 その勧告で言及しているように、最近のバージョンの Microsoft Excel や Microsoft Power Point も盗み見できます。 場合によっては、クッキーはさらに情報を取得するのに利用できます。
Web バグは、おもにファイルフォーマットの設計に当たって問題となります。 ユーザがプライバシーを大事にするなら、おそらくファイルを含む自動的な ダウンロードに制限をかけたくなるしょう。 ファイル自体をダウンロードする場合(つまり、Web ブラウザ経由で)は、例外の 1 つです。 他のファイルを同じ場所から同じ時間にダウンロードしても、ユーザにはほとんど 関係ありません。