BigTable

ページ名:BigTable

BigTable(ビッグテーブル)とは、Googleの大規模なサーバ上の大量のデータを管理する為に設計されたデータベースシステムである。Googleの分散ストレージ・システムを支えている。

目次

概要[]

BigTableはデータ圧縮された、高パフォーマンスのプロプライエタリなデータベースシステムである。Google File System(GFS)やChubby Lock Service、その他のいくつかのGoogleのプログラムで構築されている。今のところGoogle以外に供給・使用はされていない。2004年から作成され[1]、現在はMapReduce(BigTableに格納されたデータの生成や修正にしばしば使われている)[2]やGoogle Reader[3]Google マップ[4]、Google Print、「My Search History」、Google Earth、Blogger、Google Code hosting, Orkut[4]YouTube[5]のようないくつものGoogleのアプリケーションで使用されている。Googleが自社のデータベースを開発する理由はコスト、スケーラビリティ、パフォーマンス特性のより良いコントロールなどである[6]

技術[]

BigTableは高速で超大規模なColumn-oriented DBMSである。行ではなく、列からの高速な読み込みに焦点を当てている。BigTableは数百から数千台のサーバのペタバイトまでのデータを扱うように。システムへのサーバの増設を簡単にして、再設定なしに自動的にそれらのリソースの利用を始めるように設計されている[7]

各テーブルは多次元である。1つ1つのフィールドはその時点のスナップショットを持ち、バージョニングを行う事が出来る。テーブルはGFSに最適化されており、大きなテーブルは複数のTablet segment(タブレットセグメント)に自動的に分割される。分割はタブレットが200メガバイトのサイズになるように行の境界で行われる。サイズが特定の限界を超える兆候が見られた場合、テーブルはBMDiffとZippyアルゴリズムを使用して圧縮される。これらはLZWより容量の最適化で劣るが、計算時間の効率に関して勝ると言われている。

タブレットのGFS内の位置(サーバのIPとPort)は、「META1」タブレットと呼ばれる複数の特別なタブレットにデータベースエントリとして記録されている。META1タブレットは1つだけある「META0」タブレットを照会する事で作成される。「META0」タブレットは通常は1つのマシンを占有している。「META1」タブレットの位置に関してクライアントから頻繁に問い合わせを受けるからである。「META1」タブレットはそれ自体が、実際のデータの位置についての答えを持っている。GFSマスターサーバのように、META0は通常はボトルネックにはならない。META1の位置を発見・送信する為に必要なプロセッサ時間と帯域はごく僅かである。クライアントは積極的に位置をキャッシュして、照会を必要最低限にするからである。

他の実装[]

Hadoopプロジェクトは、BigTableの現在の実装を目指して改良を加えられている。Hbaseと呼ばれている。

"Just as Bigtable leverages the distributed data storage provided by the Google File System, Hbase will provide Bigtable-like capabilities on top of Hadoop."

関連事項[]

  • MapReduce

References[]

  1. "First an overview. BigTable has been in development since early 2004 and has been in active use for about eight months (about February 2005)." Google's BigTable
  2. "Bigtable can be used with MapReduce, a framework for running large-scale parallel computations developed at Google. We have written a set of wrappers that allow a Bigtable to be used both as an input source and as an output target for MapReduce job". pg 3 of "Bigtable: A Distributed Storage System for Structured Data", 2006
  3. "Reader is using Google's BigTable in order to create a haven for what is likely to be a massive trove of items." Official Google Reader blog.
  4. 4.04.1 "There are currently around 100 cells for services such as Print, Search History, Maps, and Orkut." Google's BigTable
  5. "Their new solution for thumbnails is to use Google’s BigTable, which provides high performance for a large number of rows, fault tolerance, caching, etc. This is a nice (and rare?) example of actual synergy in an acquisition." YouTube Scalability Talk
  6. "We have described Bigtable, a distributed system for storing structured data at Google....Our users like the performance and high availability provided by the Bigtable implementation, and that they can scale the capacity of their clusters by simply adding more machines to the system as their resource demands change over time...Finally, we have found that there are significant advantages to building our own storage solution at Google. We have gotten a substantial amount of flexibility from designing our own data model for Bigtable." from the Conclusion of "Bigtable: A Distributed Storage System for Structured Data", 2006
  7. *"Database War Stories #7: Google File System and BigTable"

外部リンク[]

  • 丸山先生レクチャーシリーズ2007-2008
Smallwikipedialogo.pngこのページの内容は、ウィキペディアから取られています。オリジナルの記事は、BigTableにあります。この記事の著作権者のリストは、ページの履歴を御覧ください。The Unofficial Google Wiki 日本語版と同じく、ウィキペディアのテキストは、GNU Free Documentation Licenseで提供されています。




特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。

シェアボタン: このページをSNSに投稿するのに便利です。


最近更新されたページ

左メニュー

左メニューサンプル左メニューはヘッダーメニューの【編集】>【左メニューを編集する】をクリックすると編集できます。ご自由に編集してください。掲示板雑談・質問・相談掲示板更新履歴最近のコメントカウン...

谷歌

谷歌(こくか、Guge)は、Googleの中国でのブランド名。概要[]2006年4月12日に、中華人民共和国の北京市で開かれた記者会見で発表された。[1]なお、この場合の「谷」は「穀」の簡体字であるの...

村上憲郎

村上 憲郎(むらかみ のりお、1947年-)は、日本の実業家である。略歴[]大分県佐伯市出身。Google JapanのCEOを務める。京都大学工学部資源工学科卒業。日立電子、DECを経て、North...

予定されているイベント

このページは、このウィキアに関するニュースや、関連する話題を扱っています。このページに追加するには、「編集」のリンクを辿ってください。カレンダーの使い方は、Help:カレンダーを御覧ください。目次1 ...

ヴィントン・サーフ

ファイル:Vinton Cerf.jpgヴィントン・サーフヴィントン・グレイ・サーフ(Vinton Gray Cerf、1943年6月23日 - )はアメリカ合衆国の情報工学者であり、インターネットと...

ラリー・ペイジ

ファイル:Larry Page laughs.jpgラリー・ペイジローレンス・エドワード・ペイジ(Lawrence Edward "Larry" Page, 1973年3月26日 - )は、Googl...

ラリー・ブリリアント

ローレンス・ラリー・ブリリアント博士(Lawrence "Larry" Brilliant、1944年5月5日 - )は、医師、免疫学者、科学技術者、作家、慈善家であり、Googleの運営する慈善団体...

ページランク

ファイル:Linkstruct2.svgページランクの動作概念図ページランク(PageRank)は、World Wide Web上の文書や画像を検索する検索エンジンの一つであるグーグルが採用している、...

ダブルクリック_(企業)

ダブルクリック株式会社は、東京都品川区に本社を置くインターネット広告配信企業である。トランスコスモスグループ。業界標準となっているASP型のネット広告配信技術DARTを国内で独占販売している。沿革[]...

ケヴィン・マークス

ファイル:Kevin Marks, 2006.jpgケヴィン・マークス(2006年)ケヴィン・マークス(Kevin Marks)はソフトウェア技術者。アップルコンピュータと英国放送協会の両方から賞をも...

グーグル八分

グーグル八分(グーグルはちぶ)とは、グーグルの基準に該当するページが、グーグルのデータベースから除かれ、グーグルで検索しても内容が表示されない状態になることを村八分になぞらえて呼ぶ言葉である。グーグル...

グルト

グルトはウェブサイトのGoogleのファンサイト上で作り上げられたマスコットキャラクター。不破りと氏によってデザインされた。可愛らしい眼鏡っ子で背中に白熊のような幽霊が取り付いてる少し変わった女の子で...

アドワーズ

アドワーズ(Adwords)は、検索連動型広告の一つで、Google社の提供するサービスの一つ。概要[]キーワード検索をした際に、結果画面にキーワードと関連性のある広告を表示し、低予算で効果的な宣伝を...

YouTube

YouTube, LLC(ユーチューブ)はアメリカ合衆国・カリフォルニア州サンブルノにある企業で、インターネットで動画共有サービスを行っている。目次1 概要2 歴史3 SNS3.1 SNSについて3....

SketchUp

SketchUp(スケッチアップ)は、Google Inc.が開発している3Dデザインツール。目次1 概要2 特徴3 歴史4 関連書籍5 外部リンク概要[]Google Inc.が開発している3Dデザ...

Picasa

テンプレート:Infobox SoftwarePicasa(ピカサ)は、デジタル写真管理ソフトウェアである。元々はIdealabの傘下にあったデジタル写真管理会社のPicasaが同名で開発・販売してい...

Orkut

orkut(オーカットまたはオルカット)は、ユーザーが新しい友人と出会い、かつ既存の関係を維持するのを助けることを目的としたバーチャル・コミュニティである。一般にソーシャル・ネットワーキング・サービス...