第2回 データベースとウェブフィルタリング | ScanNetSecurity
2024.05.06(月)

第2回 データベースとウェブフィルタリング

〜Websense Enterprise ver. 5.1〜

特集 特集
〜Websense Enterprise ver. 5.1〜

 有害なウェブサイトや仕事に無関係なウェブサイトへのアクセスをブロックするソリューションとして始まったウェブフィルタリングは当初は該当すると考えられるKeywordを集めてD/B化し、アクセスしようとするサイトのページにそのKeywordが入っていた場合、そのページへのアクセスをブロックするという非常に単純なソリューションとして始まりました。つまり、俗にブラックリスト方式と呼ばれるもので「このサイトへのアクセスはお勧めでできない」ということをフィルタリングソリューションを提供する会社が事実上決めていたわけです。

 学校、会社、さまざまな業種、さまざまな職種が存在する世の中で、このような単純なソリューションが長続きするわけもなく、今では姿を消してしまいました。市場が求めていた解決策とは膨大な数のウェブサイトがカテゴリに分けられて、D/B化されていて、簡単な設定で企業や組織のポリシーにあったアクセス、非アクセスの設定ができることでありました。また、同じ組織内でも職種・部署の違いの反映、時間帯による柔軟性などが求められました。

 なぜなら、ウェブフィルタリングソリューションは本来組織・企業の経営者(運営者)とそこで働く従業員(職員)がインターネットの利用を促進するソリューションであるわけです。インターネットの利用をその運営者のポリシーにそって利用する限り、そこで働く人があたかもフィルタリングソリューションが導入されていることに気づかない。それこそが正に理想的な姿であるわけです。

■データベースがなぜ重要か? 量と質のバランス

1 )データベースの量
 既にフィルタリングの基礎となるURLのデータベースの重要性は明らかであるとお感じでしょう。
 常に増え続けるウェブサイト、そのサイト数は膨大な量になります。つまり、量的に存在するウェブサイトをできるだけ多く網羅していることは精度の高いデータベースの前提条件として必要になります。ウェブセンスでは1994年の事業開始時より約10年の蓄積があり、現在全世界で11億ページに及ぶウェブページをD/B化しており、その約10%を日本語のサイトで占めています。

2 )データベースの質
 データベースの質には2つの側面があります。一つはカテゴリ分けの精度、もう一つはアップデートの頻度、精度によるものです。幾らデータ(ウェブサイトのページ数)が多くてもそれらが正確にカテゴリ分けされていなければフィルタリングの本来の目的を達することはできません。カテゴリ例では、ITの大枠カテゴリーの中にポータル・サーチエンジンサイトの小枠カテゴリが存在する区分分けを行っています。
 ウェブセンスでは特許取得のAI(人工知能)ロボットと有資格インターネット・アナリストによる目視の2つの方法でカテゴリ分けを行い、カテゴリ数も80以上に及んでいます。(詳細は下記マスター・データベースの構造を参照)
 また、ウェブセンスではアップデートに関しては7時間おきに上記2つの方法で常にサイトマイニングとカテゴリ分けを行い常に増加するウェブサイトの捕捉とリンク切れなどのサイトの削除を行います。また、WebCatcher(TM)(ウェブ・キャッチャー)機能(詳細は下記マスター・データベースの構造を参照)を用いることで、よりアクセスされる頻度の高いウェブサイトの検出・データベースへの反映も実施しています。


■マスター・データベースの構造

 このようにウェブフィルタリングにおいて重要な役割を担うデータベース、ウェブセンス社のウェブセンスマスターデータベースは下記のように3つの方法で構築・運営・維持されています。

1 )AI(人工知能)ロボットによるサイトマイニング
 特許取得のAI(人工知能)ロボットがウェブセンス独自のアルゴリズムに従って、WWW内のサイトをマイニングし大量のホームページをウェブセンス独自の80以上のカテゴリに分類します。このマイニングでは、実際にホームページにアクセスし、そのサイト内の言葉、画像などを認識しカテゴリ分けを自動的に行います。このマイニングを毎日繰り返し、前日との比較で増えている部分だけを常にアップデートしてゆきます。リンク切れや廃止になっているホームページについても同時に検出し、データベースに反映させます。


 ==================================================================
   ここまでで、ウェブセンスエンタープライズに興味をもたれた方
 ==================================================================
 ⇒ウェブセンスエンタープライズVer.5.1の詳細は?
  http://www.websense.co.jp/products/
 ⇒ウェブセンスエンタープライズVer.5.1を今すぐ評価するには?
  詳しくは下記30日間無料体験版(機能制限なし)ダウンロードサイトへ
  http://www.websense.com/downloads/?Lang=Japanese
  尚、ダウンロードされる際、「Websenseをご利用になる形態の選択」で「スタンドアロンサーバー」を選択頂くと、ご自分のデスクトップで手軽にGUI、設定方法などをお試しいただけます。
 ==================================================================
    もっとウェブセンスエンタープライズをお知りになりたい方
 ==================================================================
 ⇒次週は第三回「プロトコルマネジメントによるネットワークの制御」と題してHTTPプロトコル以外のプロトコルのマネジメントによるネットワークの管理・制御についてお話を進めます。

  ウェブセンス・ジャパン株式会社
  プロダクトマーケティング       小林敏知
  チーフ・セールスエンジニア      住澤大介

  ウェブセンスホームページ http://www.websense.co.jp
  お問い合わせは mailto:japan@websense.com

(詳しくはScan本誌をご覧ください)
http://www.vagabond.co.jp/cgi-bin/ct/p.cgi?m-sc_netsec

《ScanNetSecurity》

PageTop

アクセスランキング

  1. ランサムウェア被害の原因はスターティア社の UTM テストアカウント削除忘れ

    ランサムウェア被害の原因はスターティア社の UTM テストアカウント削除忘れ

  2. クラウド労務管理「WelcomeHR」の個人データ閲覧可能な状態に、契約終了後も個人情報保存

    クラウド労務管理「WelcomeHR」の個人データ閲覧可能な状態に、契約終了後も個人情報保存

  3. モリサワ他と損害賠償金4,500万円支払で調停成立~フォント不正コピーの印刷会社

    モリサワ他と損害賠償金4,500万円支払で調停成立~フォント不正コピーの印刷会社

  4. 山田製作所にランサムウェア攻撃、「LockBit」が展開され複数のサーバのデータが暗号化

    山田製作所にランサムウェア攻撃、「LockBit」が展開され複数のサーバのデータが暗号化

  5. 信和へのランサムウェア攻撃で窃取された情報、ロックビット摘発を受けてリークサイトが閉鎖

    信和へのランサムウェア攻撃で窃取された情報、ロックビット摘発を受けてリークサイトが閉鎖

  6. サイバーセキュリティ版「天国と地獄」~ サプライヤーへサイバー攻撃、身代金支払いを本体へ請求

    サイバーセキュリティ版「天国と地獄」~ サプライヤーへサイバー攻撃、身代金支払いを本体へ請求

  7. 今日もどこかで情報漏えい 第23回「2024年3月の情報漏えい」なめるなという決意 ここまでやるという矜恃

    今日もどこかで情報漏えい 第23回「2024年3月の情報漏えい」なめるなという決意 ここまでやるという矜恃

  8. 「シャドーアクセスとは?」CSAJ が定義と課題をまとめた日本語翻訳資料公開

    「シャドーアクセスとは?」CSAJ が定義と課題をまとめた日本語翻訳資料公開

  9. PlayStation公式になりすましたアカウントに注意喚起、個人情報要求DMも

    PlayStation公式になりすましたアカウントに注意喚起、個人情報要求DMも

  10. インターネット専用宝くじで当選本数の登録誤り、1 等 200 万円 10 本が 200 本に

    インターネット専用宝くじで当選本数の登録誤り、1 等 200 万円 10 本が 200 本に

ランキングをもっと見る